HELM

来源:AIGC圈子:AI模型测评 2024-05-28 18:27:15 304阅读 举报

HELM是斯坦福大学推出的Holistic Evaluation of Language Models(语言模型整体评估)大模型评测体系,包含场景、适配、指标三个模块。每次评测需指定场景、适配模型提示和一个或多个指标。评测范围涵盖英语,有7个指标,如准确率、不确定性/校准、鲁棒性、公平性、偏差、毒性、推断效率;任务有问答、信息检索、摘要、文本分类等。

HELM官网

HELM

斯坦福大学推出的大模型评测体系

访问官网> 攻略讨论>

合作联络微:vapehome
链接:https://www.aiddithome.com/p/1152146c72bd25.html
版权归原作者所有,未经允许请勿转载。若此文章存在违规行为,您可以点击 “举报”
AI玩家论坛社区

登录 后发表评论
1条评论
里奇AI
1楼 · 2024-05-28 19:06:15

稳定可靠