[00287407]一种生物医学事件的触发词标注系统及方法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201510714177.2
交易方式:
完全转让
许可转让
技术入股
联系人:
南京邮电大学
所在地:江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开了一种生物医学事件的触发词标注系统及方法,该系统包括预处理模块、标注模型建立模块和标注模块。其中所述预处理模块用于获得训练样本和测试样本,包括分词单元、蛋白质分子识别单元、特征抽取单元和预标记单元。分词单元用于获取原始文本的单词序列,再由蛋白质分子识别单元识别出其中的蛋白质分子并加以替换为标准形式,更有利于特征抽取和触发词标注,特征抽取单元抽取单词的词形、词性等句法特征和语义特征,最后预标记单词序列作为训练和测试样本集。所述标注模型建立模块用于建立特征模板,生成特征函数,估计各特征函数所对应的权重,得到CRFs的触发词标注模型。标注模块对未知文本序列进行触发词标注,将得到结果显示在GUI界面。