C-Eval是一套适用于大型语言模型的跨学科多层次中文评估工具,由上海交通大学、清华大学和爱丁堡大学的研究人员于2023年5月一同发布。其中包含了13948个多项选择题,覆盖了52个学科领域和四个不同难度等级,旨在评估大型中文语言模型的理解能力。
一个全面的中文基础模型评估套件
感觉智商在线
感觉智商在线