针对大规模语言模型在自然语言处理的通用领域取得的成功及该技术在广泛的应用场景中展示了强大的潜力,团队自主研发并开源了通用对话大模型“活字”。该模型在BLOOM-7B基础上,通过指令微调后在标准的中/英文基准与主观测评上均取得优异的效果,同时支持多语言对话能力;人
工构造了更多指令微调模板,使得指令微调的数据更加丰富;基于多轮对抗攻击,以SFT形式手动设计安全数据,强化模型回复的安全性和合规性;通过人类反馈的强化学习 (RLHF)进一步优化了模型回复质量,使其更加符合人类偏好。
“活字”大模型的多语言支持和强大的对话能力使其在多个领域显示出广泛的潜力。该模型可被应用于提高客户服务效率,通过自动化和即时响应减轻人工负担。在教育领域,它可以作为学习工具,辅助语言学习和练习。其跨语言交流的功能促进了国际旅游和商务中的沟通。此外,“活字”
大模型拥有处理和分析大量文本的能力,可以用于研究和数据分析,帮助从复杂的文本中提取有价值的洞见。