针对中文到斯拉夫语系翻译过程中存在的翻译质量不稳定、领域适应性差等问题,提出了一套基于底座预训练语言模型、语言聚类训练策略、多语言优化目标、模型架构等四个维度的综合解决方案。通过分析斯拉夫语言的内在语言特性及翻译语料的统计特征,提出了多目标自蒸馏策略,解决了多语言数据不均衡带来的收敛不一致性问题;发明了帕累托互蒸馏训练算法,突破了多语言帕累托优化困境;实现了基于梯度冲突的自适应参数分配策略,有效缓解多语言参数冲突问题。
该技术能够显著提高中国与斯拉夫语系国家之间的沟通效率,促进政府间的政治、经济、文化交流合作。可以推广应用于“一带一路”国际会议、双边会谈及多边协商中的实时翻译,减少语言障碍。为学术研究提供文献翻译支持,推动跨语言的学术交流与合作;促进多语言教学,助力高校提供中文和斯拉夫语系语言的双语课程。