FlagEval

来源：AIGC圈子：AI模型测评 2024-05-28 18:55:06 829阅读举报

FlagEval（天秤）是由智源研究院与多所高校团队联合打造而成的，是一个采用“能力-任务-指标”三维评估框架的大型评估平台，旨在提供全面、详细的评估结果。该平台已经涵盖了30多种能力、5种任务和4大类指标，共计600多个维度的全面评估内容，任务维度包括了22个主客观评估数据集和84433道题目。

FlagEval官网

智源研究院推出的FlagEval（天秤）大模型评测平台

访问官网> 攻略讨论>

合作联络微：vapehome
链接：https://www.aiddithome.com/p/1a0e8145d7eace.html
版权归原作者所有，未经允许请勿转载。若此文章存在违规行为，您可以点击 “举报”。