新华通讯社主管

首页 >> 正文

探讨技术提升路径与安全治理 2024 GDC大模型前沿论坛在沪举行
2024-03-25 记者 张纹 上海报道 来源: 经济参考网

  3月24日,2024全球开发者先锋大会(2024 GDC)大模型前沿论坛在上海举行。作为世界人工智能大会(WAIC)聚焦科技和人才力量的重要板块,GDC已成为顶尖技术风向标和开发者的科技交流盛典。本次GDC前沿论坛由全球开发者先锋大会组委会指导,上海人工智能实验室(即上海AI实验室)及上海市人工智能行业协会共同主办。

  记者从现场了解到,顶尖学者及业界先锋汇聚上海徐汇西岸,以“开发‘模’力前沿,共创智能生态”为主旨,探讨大模型技术提升路径与安全治理,畅想未来应用可能。

  上海AI实验室领军科学家林达华认为,过去一年大模型技术的迅猛发展,有两个重要的驱动力量:一个是源于所有研究者和从业者对于AGI(通用人工智能)技术理想的追求;另一个是产业界看到了大模型带来产业革命的可能性,以巨大资源投入此赛道。技术追求和应用潜力两种力量交织,造就了当前“波澜壮阔”的发展局面。

  业内专家认为,随着大模型技术的进一步发展,AI产业分工将会被重塑。“大模型研发需要投入巨量资源,但拥有基础模型的企业不会垄断一切,尤其不会吞噬所有垂直赛道。” 林达华指出,行业模型、模型插件等研发投入相对较小,但拥有相对大的应用空间,对专业数据和领域的理解,可以成为竞争壁垒。“更重要的是清楚理解自身资源禀赋和优势,选择合适的产业分工角色,形成差异化竞争路径。”林达华说。

  在复旦大学计算机科学技术学院教授邱锡鹏看来,新一代大模型将支持各种模态,与更多实际场景结合。他指出,过去一年,业界见证了以ChatGPT为代表的单模态大模型趋向成熟。双模态大模型开始蓬勃发展,通过结合文本和图像,或文本和语音,可以支持更丰富的交互与创作,“开创了繁荣的AIGC时代”。

  值得关注的是,本次论坛还将“百模大战”搬到了活动现场。阿里通义、腾讯混元、商汤商量、书生·浦语等多个大模型的技术负责人首度“同框”,同台畅谈共同关心的话题——大模型的技术演进路在何方?下一步如何更大限度地发挥“模”力?

  商汤科技大装置执行总监成功认为,大语言模型能够基于知识完成基础的用户交互,通过推理能力对复杂任务进行分析,并且以代码作为媒介,与现有的软件系统联结,以完成最终的任务执行。在这种范式下,开发者使用代码这一天然语言,可以将大模型能力与应用开发更好地结合起来,推动技术在更多场景落地。

  阿里通义算法负责人周畅则指出,合成数据会在未来大模型训练中扮演更加重要的角色,通过使用合成数据,有望使语言模型和多模态模型仅靠“自己”便获得能力提升。升级数据处理能力将是提升模型研发水平的重要方向之一。

  此外,首届“书生·浦源大模型挑战赛(春季赛)”获奖名单也于论坛现场揭晓。经过一个多月的角逐,挑战赛从122个参赛团队中决出20支优胜队伍,诞生了众多应用创新成果。据悉,今年1月,上海AI实验室发起首届“书生·浦源大模型挑战赛”,旨在促进AI生态发展,推动大模型在各行业的应用落地。挑战赛自开赛以来受到学界和业界广泛关注,122支队伍运用书生·浦语2.0模型及全链条开源体系,进行了十余种垂类大模型的开发训练,涵盖20个领域和超30个应用场景。

凡标注来源为“经济参考报”或“经济参考网”的所有文字、图片、音视频稿件,及电子杂志等数字媒体产品,版权均属《经济参考报》社有限责任公司,未经书面授权,不得以任何形式刊载、播放。获取授权

业内呼吁建立长效机制处置家庭过期药品

业内呼吁建立长效机制处置家庭过期药品

“半个垃圾桶装的都是布洛芬”“促销活动囤两箱肺宁片全部过期”……

·微观察|“百洁布”“香烟”也能吃?

《经济参考报》社有限责任公司版权所有 本站所有新闻内容未经协议授权,禁止转载使用

新闻线索提供热线:010-63074375 63072334 报社地址:北京市宣武门西大街57号

JJCKB.CN 京ICP备18039543号

010140010080000000000000011100001310768879