北京智源研究院大模型评测：百度文心大模型4.0登顶闭源榜-知多少教育网-记录每日最新科研教育资讯

首页 > 资讯

北京智源研究院大模型评测：百度文心大模型4.0登顶闭源榜

发布时间: 2024-06-21 07:43:58 881次浏览

近日，由北京智源研究院打造的FlagEval天秤大模型评测平台实现了全面升级，并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示，百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一。

FlagEval天秤大模型评测平台是智源研究院推出的大模型评测体系，自2023年发布以来，已从主要面向语言模型扩展到视频、语音、多模态模型，实现多领域全覆盖，目前已评测国内外300余个开源和商业闭源的语言及多模态大模型。资料显示，FlagEval大语言模型评测体系当前包含6大评测任务，近30个评测数据集，超10万道评测题目。

从榜单中可以看到，百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一，云雀2-Pro、豆包、GPT-4o分别位居二三四位，百川、零一万物、kimi等追随其后。

(北京智源研究院供图)

点击展开全文

本文链接：http://knowith.com/news-1-742.html北京智源研究院大模型评测：百度文心大模型4.0登顶闭源榜

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：2024南京软件大会将举行

下一篇：国际首次！氮气与烯烃直接合成烷基胺

热点精选

湖南省发布国家科学技术奖部分项目变更公示

湖南省发布国家科学技术奖部分项目变更公示

湖南省拟提名2023年度国家科学技术奖部分项目变更公示 1月9日－1月13日，湖南省科技厅对我省拟提名2023年度国家科学技术奖

首个“国家工程师奖”表彰背后有何深意？

首个“国家工程师奖”表彰背后有何深意？

我国工程师领域又添了一个国家级的大奖。19日上午，“国家工程师奖”表彰大会在人民大会堂举行，81名个人被授予“国家

重庆市级人才计划“包干制项目”立项清单公布

重庆市级人才计划“包干制项目”立项清单公布

关于下达重庆市级人才计划“包干制” 项目计划的通知各有关项目承担单位：经研究决定，现将重庆市级人才计划“包干制”项

山西省公示2023年度重点研发计划拟立项项目

山西省公示2023年度重点研发计划拟立项项目

2023年度山西省重点研发计划拟立项项目公示各有关单位：根据《山西省科技计划项目管理办法》（晋政办发〔2021〕42号）规

上海市就科技专家库管理办法公开征求意见

上海市就科技专家库管理办法公开征求意见

关于《上海市科技专家库管理办法》公开征求意见的公告为更好适应新形势下科技项目管理需要，进一步规范上海市科技

河南省科技基础条件专项资金拟支持项目公示

河南省科技基础条件专项资金拟支持项目公示

2024年度河南省科技基础条件专项资金拟支持项目公示根据《河南省省级创新生态支撑专项资金管理办法》相关规定，经