北京智源研究院大模型评测:百度文心大模型4.0登顶闭源榜

75次浏览

近日,由北京智源研究院打造的FlagEval天秤大模型评测平台实现了全面升级,并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示,百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一。wSw知多少教育网-记录每日最新科研教育资讯

wSw知多少教育网-记录每日最新科研教育资讯

FlagEval天秤大模型评测平台是智源研究院推出的大模型评测体系,自2023年发布以来,已从主要面向语言模型扩展到视频、语音、多模态模型,实现多领域全覆盖,目前已评测国内外300余个开源和商业闭源的语言及多模态大模型。资料显示,FlagEval大语言模型评测体系当前包含6大评测任务,近30个评测数据集,超10万道评测题目。wSw知多少教育网-记录每日最新科研教育资讯

从榜单中可以看到,百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一,云雀2-Pro、豆包、GPT-4o分别位居二三四位,百川、零一万物、kimi等追随其后。wSw知多少教育网-记录每日最新科研教育资讯

wSw知多少教育网-记录每日最新科研教育资讯

(北京智源研究院供图)wSw知多少教育网-记录每日最新科研教育资讯

本文链接:http://knowith.com/news-1-742.html北京智源研究院大模型评测:百度文心大模型4.0登顶闭源榜

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

热点精选

最新推荐

您可能感兴趣