7月28日,在2025世界人工智能大会期间,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,为金融AI应用打造“可靠、可控、可优化”的智能中枢。
随着金融业数智化转型步伐加快,大模型在金融领域的应用逐渐深入。然而,实际业务场景对金融知识专业性、业务逻辑推理以及安全合规的高要求,使现有大模型面临诸多挑战。蚂蚁数科CEO赵闻飙指出,通用大模型与产业实际应用间存在“知识鸿沟”,构建专业金融大模型是推动金融与AI深度融合的必由之路,金融大模型的应用深度将成为金融机构竞争力的关键要素。
据悉,Agentar-Fin-R1基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上,超越Deepseek-R1等同尺寸开源通用及金融大模型,彰显其强大的金融专业性、推理能力与安全合规能力。
蚂蚁数科通过构建全面的金融任务数据体系及创新模型训练算法,实现模型能力提升。在数据层面,打造业内较为全面专业的金融任务分类体系,涵盖6大类、66小类金融场景,基于千亿级金融专业数据语料,运用可信数据合成技术与金融长思维链构造机制,让模型“懂金融、成专家”。在训练层面,创新加权训练算法,提高复杂金融任务学习效率与性能,降低企业落地门槛与成本。同时,模型可不断迭代,吸收关键信息并针对性优化。
为评估大模型在实际金融场景的部署能力,蚂蚁数科联合多方机构推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理及安全合规能力。目前Finova已全面开源,推动行业共同提升大模型在金融领域的应用水平。
据介绍,蚂蚁数科作为蚂蚁集团旗下独立科技子公司,今年加速布局企业级大模型服务,聚焦金融与新能源行业场景。此前推出的金融智能体平台Agentar通过信通院评测获最高评级,并联合伙伴推出超百个金融智能体解决方案,加速大模型在金融业规模化应用。