新华通讯社主管

首页 >> 正文

度小满”轩辕”系列发布12款金融大模型
2024-03-11 来源: 经济参考网

  3月11日,度小满宣布“轩辕”系列金融大模型新增开源6B、13B、70B三种参数12款金融大模型。这12款大模型在用户信息分析、业务数据洞察等十余种金融实际任务评测中,达到自身2倍甚至5倍参数量的模型水平。

  据了解,三种参数的基座模型、对话模型、int4量化模型、int8量化模型完全开源,开发者可在GitHub、HuggingFace、Model Scope等开源社区内下载使用。

  在“轩辕”模型矩阵中,70B及以上模型适合针对需要深度分析、复杂指令执行以及全方位Agent调用的场景,而6B、13B的模型则更加适用于对响应速度有高要求、面向小规模场景和单任务的应用。“轩辕”6B-4-bit量化Chat模型则以其低推理部署成本,进一步降低大模型的应用门槛。

  专注中文金融领域任务FinanceIQ大模型金融自动评测集显示,在注册会计师(CPA)、银行从业资格、基金从业资格、证券从业资格等多项金融领域考试中,“轩辕”展示出金融领域专家的水平。

  “轩辕”系列大模型在训练方式上进行了多项创新,例如将人类偏好对齐技术引入了金融大模型训练。通常,多数垂类大模型仅在微调阶段引入特定领域数据,但这种方法在实际应用中常常显示出局限性,金融行业的复杂性要求模型能够更深入地理解并适应行业特定的需求。为此,度小满构建了涵盖通用性、安全性和金融特性的Prompt数据集,并组织了专业的标注团队对成对的回答进行偏好标注,从而收集到了一批高质量、广覆盖的偏好数据,并通过一系列实践、分析和改进成功完成了奖励模型和后续的强化训练。

  度小满在2023年5月开源千亿级中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首。本次度小满“轩辕”模型矩阵再次升级,十亿-百亿-千亿参数全覆盖,实现多场景任务适配。

  业内普遍认为,金融大模型的价值在于在核心业务场景中发挥实际作用,如通过综合分析用户信息以支持风险评估、刻画客户画像等。目前,“轩辕”金融大模型已经应用在度小满的营销、客服、风控、办公、研发等各个业务场景,已经初见成效。据称,在代码助手方面,用大模型辅助生成的代码,采纳率能够达到42%,帮助公司整体研发效率提升了20%;在客服领域,大模型推动服务效率提升了25%。(孙静)

 

凡标注来源为“经济参考报”或“经济参考网”的所有文字、图片、音视频稿件,及电子杂志等数字媒体产品,版权均属《经济参考报》社有限责任公司,未经书面授权,不得以任何形式刊载、播放。获取授权

产业链供应链发力 邮轮经济拓展消费新空间

产业链供应链发力 邮轮经济拓展消费新空间

2023年我国全面恢复国际邮轮运输以来,积累多年的邮轮旅游需求集中释放。

·海南矿山修复让废矿“生金”

四川国企重点发力功能性改革

四川国企重点发力功能性改革

科技创新是决定产业引领和安全支撑作用发挥的根本。

·央企加快布局发展人工智能

《经济参考报》社有限责任公司版权所有 本站所有新闻内容未经协议授权,禁止转载使用

新闻线索提供热线:010-63074375 63072334 报社地址:北京市宣武门西大街57号

JJCKB.CN 京ICP备18039543号

010140010080000000000000011100001310767284