新华通讯社主管

首页 >> 正文

作业帮发布银河大模型
2023-09-02 来源: 经济参考网

  9月2日至6日,2023中国国际服务贸易交易会在北京举办,作业帮受邀参展,并正式发布自研银河大模型。

  同时作业帮公布了银河大模型在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示,作业帮银河大模型以平均分73.7分位居C-Eval榜首;同时在CMMLU榜单Five-shot和Zero-shot测评中分别以平均分74.03分及73.85分位列第一,成为同时在上述两大权威榜单平均分排名第一的教育大模型。

  银河大模型作为作业帮自主研发的大语言模型,深度融合作业帮多年的AI算法沉淀和教育数据积累,是一款专为教育领域量身打造的覆盖多学科、多学段、多场景的教育大模型。它不仅具备高度的多学科知识解答能力,更能协助不同学段学生进行创意写作,同时还能够实现自主提问、陪伴式辅导等,助力学生个性化学习与成长。

  作业帮银河大模型的综合实力在权威测评榜单中得到验证。据悉,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。根据C-Eval排行榜的最新数据显示,作业帮银河大模型以平均分为73.7分位居榜首。

  在由MBZUAI、上海交通大学、微软亚洲研究院共同推出的CMMLU榜单中,作业帮银河大模型表现同样出色,在Five-shot和Zero-shot测试中分别以74.03分及73.85分占据榜首。

  据了解,CMMLU共涵盖了67个主题,涉及自然科学、社会科学、工程、人文以及常识等。在CMMLU榜单中的表现,再次印证了作业帮银河大模型在知识储备和语言理解方面的实力。

  作业帮银河大模型在英文方面表现同样不俗。由美国加州大学伯克利分校、哥伦比亚大学、芝加哥大学等高校联合打造的全球性大规模多任务语言理解评测基准MMLU,在集合了科学、工程、数学、人文、社会科学等领域的57个科目的评测中,作业帮银河大模型平均分71.88分。(赵萍)

 

凡标注来源为“经济参考报”或“经济参考网”的所有文字、图片、音视频稿件,及电子杂志等数字媒体产品,版权均属经济参考报社,未经经济参考报社书面授权,不得以任何形式刊载、播放。获取授权

人工智能时代呼唤网络安全治理升级

人工智能时代呼唤网络安全治理升级

随着人工智能的出现,网络信息技术迭代升级加速,网络安全领域新情况、新问题、新挑战层出不穷。

·气候变暖给长江源区生态环境带来系列变化

国企领跑 山西构建“多业支撑”现代产业体系

国企领跑 山西构建“多业支撑”现代产业体系

通过建链、补链、延链、强链,努力实现从“一业独大”向“多业支撑”转变。

·国企战略性新兴产业并购重组活跃

经济参考报社版权所有 本站所有新闻内容未经经济参考报协议授权,禁止转载使用

新闻线索提供热线:010-63074375 63072334 报社地址:北京市宣武门西大街57号

JJCKB.CN 京ICP备18039543号

010140010060000000000000011100001310739615