新华通讯社主管

首页 >> 正文

中国电信实现商用智算超节点推理性能业界新突破
2025-08-14 来源:经济参考网

  近期,中国电信广东公司联合中国电信研究院、华为公司,基于中国电信粤港澳大湾区(韶关)算力集群已上线的全球首个商用昇腾超节点智算集群,采用中国电信研究院自研“翼芯”智算测试与适配优化平台,针对多种推理场景开展了大模型性能优化及测试。

  随着人工智能业界大模型从稠密架构向以DeepSeek为代表的多专家混合模型(MoE)架构演进,基于高端智算能力的云上推理成为当前技术演进的趋势和必然需求,高效率推理性能成为智算资源提供领先者的核心竞争力。

  通过对主流模型与超节点系统迭代适配调优,不同场景下的推理性能均实现了大幅提升;其中DeepSeek 671B满血版模型达到单卡推理吞吐性能2122Tokens/s,刷新了业界纪录。

广东电信超节点液冷舱

  昇腾超节点系统创新应用全总线架构,采用高速互连技术将384张910C智算卡紧密耦合形成大型算力单元。该架构在大幅降低模型并行通信时延的同时,还需要解决好资源调度与并行策略设置复杂性变高的问题;需要针对不同业务场景的资源和并发策略进行灵活设置,才能最大发挥算力单元整体性能,将算力单元与大模型的亲和度提升至最佳。

  本次中国电信广东公司和华为公司共同合作,完成翼芯测试平台与昇腾384卡超节点对接优化,针对13项基准性能、6类典型场景推理性能,采用5类典型资源配置开展自动化测试;同时尝试采用了算子融合替换、PD分离调度、KV cache优化、集合通信优化、并行策略优化等多维度的调优策略,不断将吞吐性提升到最大。经充分优化后,DeepSeek 671B模型在多种场景下的单卡吞吐性能较优化前有2.5-4.3倍提升;在保证TTFT为1.28s、TPOT为50ms的服务质量指标下,单卡吞吐达到了2122Tokens/s,较业界前期测试最佳性能提升9.2%。

  本次超节点优化和性能指标刷新,成功体现了中国电信对智算系统整体优化核心技术的深刻理解与实践创新能力,可以根据客户实际场景性能的需要,灵活配置智算资源池资源,更高效地服务于复杂推理、多智能体协同等新业务场景。下一阶段中国电信将开展更多场景的超节点形态优化研究和验证测试;在此基础上,进一步汇聚产业生态、共建行业生态、共享技术生态、聚拢开发者生态,持续推动国产智算基础设施建设和技术创新,全面助力人工智能产业高质量发展。(陈新豪 师春雨)

凡标注来源为“经济参考报”或“经济参考网”的所有文字、图片、音视频稿件,及电子杂志等数字媒体产品,版权均属《经济参考报》社有限责任公司,未经书面授权,不得以任何形式刊载、播放。获取授权

《经济参考报》社有限责任公司版权所有 本站所有新闻内容未经协议授权,禁止转载使用

新闻线索提供热线:010-63074375 63072334 报社地址:北京市宣武门西大街57号

JJCKB.CN 京ICP备2024066810号-1