[00230779]一种互联网数据聚类方法及系统
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201510956891.2
交易方式:
完全转让
许可转让
技术入股
联系人:
中国科学院深圳先进技术研究院
所在地:广东深圳市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明属于聚类算法技术领域,尤其涉及一种互联网数据聚类方法及系统。
所述互联网数据聚类方法包括以下步骤步骤a在原有的FG-k-means算法的目标函数距离计算项中添加惩罚系数,形成新的目标函数;步骤b对新的目标函数的参数进行优化求解;步骤c根据优化的参数结果计算样本与聚类中心的距离,根据样本与聚类中心的距离对样本进行聚类簇分配。本发明实施例的互联网数据聚类方法及系统在原有FG-k-means算法的目标函数距离计算项中加入惩罚系数,可以有效地控制原有FG-k-means算法存在的聚类簇样本数量无限增长的问题,互联网数据聚类方法同时能够使得各个聚类簇之间样本数量均衡可控,从而获得更高的聚类精度。