X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
欢迎来到宁夏技术市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
 常见问题  关于我们
成果
成果 专家 院校 需求
微信公众号
当前位置: 首页 >  科技成果  > 详细页

[00265875]一种改进的SimHash代码相似度检测方法

交易价格: 面议

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:CN201611203147.6

交易方式: 完全转让 许可转让 技术入股

联系人: 浙江工业大学

所在地:浙江杭州市

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
分享
|
收藏
|

技术详细介绍

一种改进的SimHash代码相似度检测方法,包括以下步骤1)分词;2)hash;3)加权;4)合并将各个特征向量经过hash加权之后的结果累加,变成只有一个序列串;5)减值通过整理分析,选择一个阈值T,将最后合并得到的结果序列串每一项减去设定的阈值T,得到最终的结果序列串;6)降维对于n‑bit签名的累加结果进行降维处理,即对于最终序列串上的每一位,若大于0则置1,否则置0,从而得到该语句的simhash值,最后根据不同语句的simhash值的海明距离来判断它们的相似度。本发明提供了一种准确性较高的改进的SimHash代码相似度检测方法。

Copyright © 2018    宁夏回族自治区生产力促进中心    版权所有    宁ICP备11000235号-3    宁公网安备 64010402000776号

联系电话:0951-5064080              网站访问量:               网站在线人数:0              技术支持:科易网