[00287411]基于模糊数据挖掘的中文网页自动分类方法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201010118500.7
交易方式:
完全转让
许可转让
技术入股
联系人:
南京邮电大学
所在地:江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公布了一种基于模糊数据挖掘的中文网页自动分类方法,该方法由分类词语描述库构建部分、新网页预处理部分、模糊分类匹配器部分以及分类结果模糊评判部分组成。通过应用模糊综合评判的方法,将构建分类词语描述库时所生产的训练集特征词向量模糊矩阵和新网页预处理部分所生产的网页特征词模糊向量进行模糊分类运算,再通过分类结果模糊评判,从而得到该中文网页的模糊分类。该方法能有效提高分类效率,解决分类模糊性问题,具有良好的可扩展性,操作简单方便,易于推广。