交易价格: 面议
类型: 软件著作权
技术成熟度: 通过小试
专利所属地:中国
专利号:2019SR0493783
交易方式: 完全转让 许可转让 技术入股
联系人: 桂林旅游学院
所在地:广西壮族自治区桂林市
项目简介:
随着互联网的快速发展,电子邮件已经成为了最普遍的应用,是人们的生活、学习和工作中必不可少的通讯工具。而在我们享受电子邮件带给我们便利的同时,随之而来的垃圾邮件却给人们带来了无尽的烦恼。身处大数据时代,信息传播速度越来越快,邮箱邮件增速明显,而这些邮件中,对于用户而言,只有一两封是自己真正需要的邮件,其他的便是垃圾邮件。这些垃圾邮件不仅给用户带来烦恼,而且清除起来特别麻烦。因此,通过研究反垃圾邮件技术,而其中最重要的是过滤技术,本软件利用支持向量机(SVM)模型实现垃圾邮件的自动分类算法,作为反垃圾邮件的初步工作。
项目核心创新点:
本软件基于支持向量机(SVM)模型,根据有限的样本信息,训练出一个具有最优性能的垃圾邮件自动分类系统。通过支持向量机模型,对邮件进行过滤,提高垃圾邮件的分类效果。
项目详细用途:
软件首先将数据集进行预处理,分为训练集和测试集,对其进行分词后,再提取训练邮件数据的特征向量,由于邮件的内容过多,因此最关键的是要找出其主要的分类关键词,在找出关键词后就可以用这些关键词对邮件进行特征标记。数据集使用现在广泛使用的邮件数据集,邮件总数为500封,通过预处理之后选择80%作为训练数据,20%作为测试数据,将训练数据使用SVM训练,其中使用的核函数为高斯核函数,将训练得到的模型使用测试数据进行测试,最后可以达到输入一封邮件后,能正确输出是属于垃圾邮件还是正常邮件。
Copyright © 2018 宁夏回族自治区生产力促进中心 版权所有 宁ICP备11000235号-3 宁公网安备 64010402000776号