度小满”轩辕”系列发布12款金融大模型 _ 经济参考网

3月11日，度小满宣布“轩辕”系列金融大模型新增开源6B、13B、70B三种参数12款金融大模型。这12款大模型在用户信息分析、业务数据洞察等十余种金融实际任务评测中，达到自身2倍甚至5倍参数量的模型水平。

据了解，三种参数的基座模型、对话模型、int4量化模型、int8量化模型完全开源，开发者可在GitHub、HuggingFace、Model Scope等开源社区内下载使用。

在“轩辕”模型矩阵中，70B及以上模型适合针对需要深度分析、复杂指令执行以及全方位Agent调用的场景，而6B、13B的模型则更加适用于对响应速度有高要求、面向小规模场景和单任务的应用。“轩辕”6B-4-bit量化Chat模型则以其低推理部署成本，进一步降低大模型的应用门槛。

专注中文金融领域任务FinanceIQ大模型金融自动评测集显示，在注册会计师（CPA）、银行从业资格、基金从业资格、证券从业资格等多项金融领域考试中，“轩辕”展示出金融领域专家的水平。

“轩辕”系列大模型在训练方式上进行了多项创新，例如将人类偏好对齐技术引入了金融大模型训练。通常，多数垂类大模型仅在微调阶段引入特定领域数据，但这种方法在实际应用中常常显示出局限性，金融行业的复杂性要求模型能够更深入地理解并适应行业特定的需求。为此，度小满构建了涵盖通用性、安全性和金融特性的Prompt数据集，并组织了专业的标注团队对成对的回答进行偏好标注，从而收集到了一批高质量、广覆盖的偏好数据，并通过一系列实践、分析和改进成功完成了奖励模型和后续的强化训练。

度小满在2023年5月开源千亿级中文金融大模型“XuanYuan-176B”。2023年9月，“XuanYuan-70B”大模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首。本次度小满“轩辕”模型矩阵再次升级，十亿-百亿-千亿参数全覆盖，实现多场景任务适配。

业内普遍认为，金融大模型的价值在于在核心业务场景中发挥实际作用，如通过综合分析用户信息以支持风险评估、刻画客户画像等。目前，“轩辕”金融大模型已经应用在度小满的营销、客服、风控、办公、研发等各个业务场景，已经初见成效。据称，在代码助手方面，用大模型辅助生成的代码，采纳率能够达到42%，帮助公司整体研发效率提升了20%；在客服领域，大模型推动服务效率提升了25%。（孙静）