LLMEval是由复旦大学NLP实验室发布的一种大型模型评估基准。LLMEval-3是其最新版本,专注于评估专业领域的知识能力。此版本涵盖教育部规定的13个学科领域,包括哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学和艺术学,共涵盖50多个细分学科,共计约20万道标准生成式问答题目。
由复旦大学NLP实验室推出的大模型评测基准
AI的学习曲线很平缓,越用越顺手
AI的学习曲线很平缓,越用越顺手