3月24日,2024全球开发者先锋大会(2024 GDC)大模型前沿论坛在上海举行。作为世界人工智能大会(WAIC)聚焦科技和人才力量的重要板块,GDC已成为顶尖技术风向标和开发者的科技交流盛典。本次GDC前沿论坛由全球开发者先锋大会组委会指导,上海人工智能实验室(即上海AI实验室)及上海市人工智能行业协会共同主办。
记者从现场了解到,顶尖学者及业界先锋汇聚上海徐汇西岸,以“开发‘模’力前沿,共创智能生态”为主旨,探讨大模型技术提升路径与安全治理,畅想未来应用可能。
上海AI实验室领军科学家林达华认为,过去一年大模型技术的迅猛发展,有两个重要的驱动力量:一个是源于所有研究者和从业者对于AGI(通用人工智能)技术理想的追求;另一个是产业界看到了大模型带来产业革命的可能性,以巨大资源投入此赛道。技术追求和应用潜力两种力量交织,造就了当前“波澜壮阔”的发展局面。
业内专家认为,随着大模型技术的进一步发展,AI产业分工将会被重塑。“大模型研发需要投入巨量资源,但拥有基础模型的企业不会垄断一切,尤其不会吞噬所有垂直赛道。” 林达华指出,行业模型、模型插件等研发投入相对较小,但拥有相对大的应用空间,对专业数据和领域的理解,可以成为竞争壁垒。“更重要的是清楚理解自身资源禀赋和优势,选择合适的产业分工角色,形成差异化竞争路径。”林达华说。
在复旦大学计算机科学技术学院教授邱锡鹏看来,新一代大模型将支持各种模态,与更多实际场景结合。他指出,过去一年,业界见证了以ChatGPT为代表的单模态大模型趋向成熟。双模态大模型开始蓬勃发展,通过结合文本和图像,或文本和语音,可以支持更丰富的交互与创作,“开创了繁荣的AIGC时代”。
值得关注的是,本次论坛还将“百模大战”搬到了活动现场。阿里通义、腾讯混元、商汤商量、书生·浦语等多个大模型的技术负责人首度“同框”,同台畅谈共同关心的话题——大模型的技术演进路在何方?下一步如何更大限度地发挥“模”力?
商汤科技大装置执行总监成功认为,大语言模型能够基于知识完成基础的用户交互,通过推理能力对复杂任务进行分析,并且以代码作为媒介,与现有的软件系统联结,以完成最终的任务执行。在这种范式下,开发者使用代码这一天然语言,可以将大模型能力与应用开发更好地结合起来,推动技术在更多场景落地。
阿里通义算法负责人周畅则指出,合成数据会在未来大模型训练中扮演更加重要的角色,通过使用合成数据,有望使语言模型和多模态模型仅靠“自己”便获得能力提升。升级数据处理能力将是提升模型研发水平的重要方向之一。
此外,首届“书生·浦源大模型挑战赛(春季赛)”获奖名单也于论坛现场揭晓。经过一个多月的角逐,挑战赛从122个参赛团队中决出20支优胜队伍,诞生了众多应用创新成果。据悉,今年1月,上海AI实验室发起首届“书生·浦源大模型挑战赛”,旨在促进AI生态发展,推动大模型在各行业的应用落地。挑战赛自开赛以来受到学界和业界广泛关注,122支队伍运用书生·浦语2.0模型及全链条开源体系,进行了十余种垂类大模型的开发训练,涵盖20个领域和超30个应用场景。