HELM

HELM

来源：AIGC圈子：AI模型测评 2024-05-28 18:27:15 680阅读举报

HELM是斯坦福大学推出的Holistic Evaluation of Language Models（语言模型整体评估）大模型评测体系，包含场景、适配、指标三个模块。每次评测需指定场景、适配模型提示和一个或多个指标。评测范围涵盖英语，有7个指标，如准确率、不确定性/校准、鲁棒性、公平性、偏差、毒性、推断效率；任务有问答、信息检索、摘要、文本分类等。

HELM官网

斯坦福大学推出的大模型评测体系

访问官网> 攻略讨论>

合作联络微：vapehome
链接：https://www.aiddithome.com/p/1152146c72bd25.html
版权归原作者所有，未经允许请勿转载。若此文章存在违规行为，您可以点击 “举报”。

HELM官网

相关问题

相关内容