[00251736]基于句法树和领域特征的生物文本蛋白质指代消解方法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610872780.8
交易方式:
完全转让
许可转让
技术入股
联系人:
西安交通大学
所在地:陕西西安市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及基于句法树和领域特征的生物文本蛋白质指代消解方法,用于解决现有基于规则的方法中F值低的问题,其步骤包括对原始文本进行预处理;从句法树中查找关系代词和距离该关系代词最近的名词短语,作为该关系代词的先行语;从句法树中查找人称代词,并从句法树的并列短语结构、子句句法树或前一句子的句法树中查找该人称代词的先行语;利用句法树得到限定性名词短语和候选先行语集,并基于生物领域特征如单复数、实体类型、数量等性质从候选先行语集中挑选出最优的作为先行语;非蛋白质指代消解过滤。本发明实现了生物文本中的蛋白质指代消解,能够获得较高的F值。