[00287517]一种基于聚类和隶属度融合的改进型文本分类算法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610380813.7
交易方式:
完全转让
许可转让
技术入股
联系人:
南京邮电大学
所在地:江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开了一种基于聚类和隶属度融合的改进型文本分类算法,该算法将待分类文本和训练文本集中的训练文本用向量空间表示,通过聚类算法将各个类别中的训练文本聚类,并合并同一个簇内的训练文本,形成新的文本向量,利用新的文本向量与待分类文本向量进行计算,从而得到待分类文本与各个类别的相似度以及待分类文本隶属各个类别的程度,将两者相加,最大值对应的类别即为待分类文本的类别。聚类算法在不裁剪原始样本数量的基础上减少文本分类算法执行的时间复杂度,隶属度改进了待分类文本的分类判定方式,考虑训练文本密度对分类判定的影响,提高文本分类的准确率,本发明有效解决了文本分类的算法时间复杂度和分类准确率问题。