面向自然语言处理通用对话领域的“活字”大模型

成果简介

针对大规模语言模型在自然语言处理的通用领域取得的成功及该技术在广泛的应用场景中展示了强大的潜力，团队自主研发并开源了通用对话大模型“活字”。该模型在BLOOM-7B基础上，通过指令微调后在标准的中/英文基准与主观测评上均取得优异的效果，同时支持多语言对话能力；人
工构造了更多指令微调模板，使得指令微调的数据更加丰富；基于多轮对抗攻击，以SFT形式手动设计安全数据，强化模型回复的安全性和合规性；通过人类反馈的强化学习 (RLHF)进一步优化了模型回复质量，使其更加符合人类偏好。
“活字”大模型的多语言支持和强大的对话能力使其在多个领域显示出广泛的潜力。该模型可被应用于提高客户服务效率，通过自动化和即时响应减轻人工负担。在教育领域，它可以作为学习工具，辅助语言学习和练习。其跨语言交流的功能促进了国际旅游和商务中的沟通。此外，“活字”
大模型拥有处理和分析大量文本的能力，可以用于研究和数据分析，帮助从复杂的文本中提取有价值的洞见。

其他成果推荐

更多>

宁夏电信一体化算力服务能力建设成果

所属单位：中国电信股份有限公司宁夏分公司

面向行业赋能的宁夏城市算力平台

所属单位：中国电信股份有限公司宁夏分公司

智能化煤矿机器人集群应用关键技术创新与示范

所属单位：陕煤集团神木柠条塔矿业有限公司

电缆通道智能巡检机器人监控应用系统

所属单位：陕西丰鼎鸿邑电子科技有限公司

综采工作面巷道单元支护装备及智能搬运机器人研发与应用

所属单位：陕西陕煤黄陵矿业有限公司

用于易燃易爆区域的机器人充电系统及充电方法

所属单位：西安量子智能科技有限公司