FlagEval

来源:AIGC圈子:AI模型测评 2024-05-28 18:55:06 538阅读 举报

FlagEval(天秤)是由智源研究院与多所高校团队联合打造而成的,是一个采用“能力-任务-指标”三维评估框架的大型评估平台,旨在提供全面、详细的评估结果。该平台已经涵盖了30多种能力、5种任务和4大类指标,共计600多个维度的全面评估内容,任务维度包括了22个主客观评估数据集和84433道题目。

FlagEval官网

FlagEval

智源研究院推出的FlagEval(天秤)大模型评测平台

访问官网> 攻略讨论>

合作联络微:vapehome
链接:https://www.aiddithome.com/p/1a0e8145d7eace.html
版权归原作者所有,未经允许请勿转载。若此文章存在违规行为,您可以点击 “举报”

登录 后发表评论
1条评论
首席爆料师
1楼 · 2024-05-28 19:14:06

有时候AI的幽默让我笑出声