[00290497]基于优化质心分类算法的文本分类系统研究(登记)
交易价格:
面议
类型:
非专利
技术成熟度:
正在研发
交易方式:
完全转让
技术入股
许可转让
联系人:
林念文
所在地:宁夏回族自治区
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本项目对文本分类的各种技术理论进行研究,对各种分类算法进行分析和对比,针对传统质心分类算法提出了优化方法,最终设计和实现了一个文本分类系统。该系统主要涉及文本分类的类型、文本表示方法、中文分词、文本特征抽取算法、文本特征权重算法及各种文本分类算法等相关技术,并对其中一些关键技术进行了深入分析,针对类中心分类算法提出了优化方法。在系统设计中应用向量空间模型来表示文本,其中特征选择应用文档频率方法,特征的权重采用 方法计算。通过本系统可以实现文本数据的快速分类,有效地组织和管理各种资源,并快速、准确地找到用户所需信息,一定程度上提高用户检索效率。