[00284260]一种基于MST算法的越南语依存树库构建方法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610063686.8
交易方式:
完全转让
许可转让
技术入股
联系人:
昆明理工大学
所在地:云南昆明市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及一种基于MST算法的越南语依存树库构建方法,属于自然语言处理技术领域。本发明包括步骤:首先构建越南语依存树库训练语料库;再利用越南语依存树库训练语料库的语料训练得到MST模型,再利用MST模型训练越南语句子得到越南语依存树库;对得到的越南语依存树库语料库进行校正。本发明所构建的越南语依存树库对越南语语言的句法分析、机器翻译及息获取等上层应用能提供有力支撑;可以构建10万句越南语依存树库;本发明的方法避免了人工收集和标注越南语依存树库的过程,节省了人力和构建树库的时间;本发明的方法相比采用CRFParser和借助汉‑越双语词对齐语料构建越南语依存树库方法准确率明显提高。