[00251745]一种跨语言的电子文本剽窃检测系统及其检测方法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201410062327.1
交易方式:
完全转让
许可转让
技术入股
联系人:
西安交通大学
所在地:陕西西安市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开了一种跨语言的电子文本剽窃检测系统及其检测方法,包括以下步骤分别对待测电子文本和参考电子文本进行段落划分,得到待测段落集和参考段落集;根据跨语言本体,查找待测段落集和参考段落集中词语对应的概念,并根据所查找到的概念,将待测段落集和参考段落集表示为待测多重概念序列和参考多重概念序列;据待测多重概念序列,检索得到与待测多重概念序列共同概念最多的参考多重概念序列;检测多重概念序列,生成剽窃证据列表;对剽窃证据列表进行合并、整理,生成检测结果;输出和显示检测结果。本发明中所建立得多重概念序列,能够将待测电子文本和参考电子文本进行充分的检索,进而提高了检测的准确率。