在连续发布Seedance 2.0之后, 字节跳动14日又宣布推出豆包大模型2.0系列,针对大规模生产环境的使用需求进行系统性优化。
据介绍,在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌,数学和推理能力达到世界顶尖水平。
大模型执行长链路复杂任务,需要丰富的世界知识。豆包2.0加强了知识覆盖,在多项公开测试集上表现突出。
在教育、娱乐、办公等众多场景中,大模型需要理解图表、复杂文档、视频等内容。对此,豆包2.0全面升级多模态理解能力,视觉推理、空间感知、长上下文理解等权威测试均取得业界最佳表现。
面对动态场景,豆包2.0增强了对时间序列与运动感知的理解能力,还可实现实时视频流分析、环境感知与主动交互,广泛应用于健身指导、穿搭建议、看护陪伴等生活场景。
图:Agent及推理能力部分评测成绩
Agent能力是大模型具备行动力的关键。测试成绩显示,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水平,在HLE-Text(人类的最后考试)上更是获得54.2的最高分。
目前,豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择「专家」模式即可对话体验,火山引擎也已上线豆包2.0系列模型API服务。
据了解,豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,有较大的成本优势。豆包2.0 Lite更是有性价比,综合性能超越两个月前发布的上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元。

