[00230785]确定数据点的相似度的方法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201410805905.6
交易方式:
完全转让
许可转让
技术入股
联系人:
中国科学院深圳先进技术研究院
所在地:广东深圳市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明提供一种确定数据点的相似度的方法。
确定数据点的相似度的方法包括:(a)将所有数据点进行线性投影;(b)基于线性投影后的数据点来构建包括预定数量的具有预定深度的树的随机森林,其中,按照测试函数将随机森林的每个分割结点中的数据点分割到左孩子结点或右孩子结点;(c)获取每个数据点在每颗树上的分割路径;(d)根据获取的分割路径来确定数据点的哈希码,并根据确定的哈希码来确定数据点的相似度。在根据本发明示例性实施例的确定数据点的相似度的方法中,生成的哈希码的长度突破了原始数据点的维度的限制,确定数据点的相似度的方法比现有的哈希编码方法更加灵活,可以更好地应用于各种数据的相似性的比较。