2025世界人工智能大会正在上海举行,大模型专业领域应用受关注。7月27日下午,在“从通用智力到专业生产力:高阶程序引领的AI应用新范式”论坛上,蚂蚁集团旗下蚂蚁密算宣布开源高阶程序(High - Order Program)大模型可信应用技术框架,探索智能与工程融合的AI应用新范式,致力解决大模型专业应用的可靠性困境,推动其在专业领域规模化应用。
浙江大学教授陈纯在论坛指出,大模型专业化应用首要问题是可靠性。虽然当前技术SOTA已经到了80%到90%的水平,但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。他认为“幻觉”是智力必然代价,消除幻觉,大模型会退化为检索工具,突破可靠性关键在于构建工程化保障框架。
蚂蚁密算董事长韦韬认为,突破大模型专业化应用可靠性困境,不能仅依赖大模型自身不犯错,而要结合智能与工程体系保障可靠性。他以人类个体易错但工程体系进步能完成巨型任务为例,提出通过全新程序表达、场景知识嵌入和闭环核验反馈机制,将大模型不确定智力输出转化为可信专业生产力
据悉,蚂蚁密算探索的高阶程序大模型可信应用技术框架,核心组件有业务逻辑程序化表达、场景知识图谱和受控工具链,全流程贯穿核验机制处理关键执行结果。该框架借鉴工程管理体系成功经验,如标准作业程序(SOP)和检查清单机制,确保大模型即便出现幻觉,也能满足专业领域精确性和可靠性要求。目前,该框架已在金融风控全链路、网络入侵检测、医疗重复计费等多行业场景初步应用,显著提升可靠性和时效性。如金融联合风控,传统体系依赖人工,流程冗长、易受主观影响,应用框架后实现风控全链路智能化编排与自动化执行。
韦韬表示,高阶程序可以与大模型强互补,将大模型这样的通用智力引擎,可靠地应用于众多专业场景。“大模型可靠性的解法,不在于大模型本身,而在于工程化和智能化的融合。我们开源高阶程序HOP,希望与行业一起把大模型从人类助手正在变成规模化专业生产力。我们也相信,解决了可靠性问题,大模型即将涌现新的Killer App(杀手级应用)。”