[00230805]海量交易数据中频繁项目集的挖掘方法及查询方法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201310629404.2
交易方式:
完全转让
许可转让
技术入股
联系人:
中国科学院深圳先进技术研究院
所在地:广东深圳市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开一种海量交易数据中频繁项目集的挖掘方法,其包括:A)收集原始交易数据,并更新与原始交易数据对应的索引文件;B)查询是否存在未处理的原始交易数据;若存在,则执行步骤C);若未存在,则返回步骤A);C)对未处理的原始交易数据进行预处理,并将经过预处理的原始交易数据导入到分布式文件系统中;D)利用均衡的并行频繁项目集增长算法对导入到分布式文件系统中的经过预处理的原始交易数据进行计算,进而得到频繁项目集;E)将由步骤D)得到的频繁项目集导入到分布式文件系统中;F)更新与经过步骤C)至步骤E)处理的原始交易数据对应的索引文件。本发明还公开一种海量交易数据中频繁项目集的查询方法。