[00284930]一种柬埔寨语组织机构名识别方法
交易价格:
面议
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201611157511.X
交易方式:
完全转让
许可转让
技术入股
联系人:
昆明理工大学
所在地:云南昆明市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及一种柬埔寨语组织机构名识别方法,属于自然语言处理技术领域。本发明首先对抽取的柬埔寨语篇章进行切分,切分后的句子进行分词和词性标注,通过人工校对,然后标注柬埔寨语命名实体,得到相当规模的柬埔寨语组织机构名语料;通过标注的语料提取命名实体指示词,构建指示词库,构建特征模板,通过改进的Tri‑training算法学习得到组织机构名识别模型;对选取的测试语料通过组织机构名识别模型进行训练得到组织机构名的标注结果。本发明对柬埔寨语组织机构名进行有效的识别,为信息抽取和机器翻译等工作提供强有力的支撑;目前没有发现柬埔寨语做相关的组织机构名识别的报告,本发明取得了很好的效果。