近日,中国电子技术标准化研究院正式发布了“求索”人工智能国家标准评测基准体系3.0(以下简称“‘求索’3.0”)。
随着人工智能技术走向规模化产业应用,如何准确、客观、全面衡量人工智能系统能力、适配人工智能技术快速迭代与多场景融合的迫切需求,成为产学研用各界关注的焦点。中国电子技术标准化研究院依托人工智能基础与应用标准工业和信息化部重点实验室,面向人工智能全产业链,联合产业相关方,共同孵化国家标准,打造“求索”人工智能国家标准评测基准体系。
本次正式发布的“求索”3.0,新增具身智能测评基准、智能体测评基准、智能终端测评基准3项测试能力。目前,“求索”3.0已形成了覆盖人工智能芯片、整机服务器、大模型、智能体、具身智能、智能终端、安全等产业链各重点环节的全方位评测体系。
根据“求索”3.0最新测评结果,中电信人工智能科技(北京)有限公司等3家单位的相关产品通过“求索”3.0大模型测试,北京百度网讯科技有限公司等4家单位的相关产品通过“求索”3.0智能体测试。
中国电子技术标准化研究院相关负责人表示,目前“求索”3.0已经得到100余家产学研用单位的支持和参与,形成了科学化、体系化的基准体系。未来,“求索”还将持续提升评测能力水平,打造兼具技术引领性、场景适配性和国际影响力的人工智能评测新基准。

