SuperCLUE是一个综合评估中文通用大型模型的基准测试,评估模型在基础能力、专业能力和中文特性能力三个方面的表现。
基础能力包括:语义理解、对话、逻辑推理、角色扮演、编码、生成创造等10种技能。
专业能力范围广泛,包括中学、大学与专业考试,涵盖了数学、物理、地理和社会科学等多达50项能力。
中文的独特功能:专门针对中文特色任务设计的能力,包括10种不同领域,如中文成语、诗歌、文学、字形等。
中文通用大模型综合性测评基准
AI的学习曲线很平缓,越用越顺手
AI的学习曲线很平缓,越用越顺手