根据小米公司官方微博消息,MiLM 大型语言模型于今日正式通过大模型备案,据称将逐步应用于小米汽车、手机、智能家居等产品,并将在未来面向更多用户开放体验。
小米公司的 MiLM 大模型是在去年8月首次出现在C-Eval、CMMLU 大模型评测榜单上。当时该型号在 C-Eval 总榜上排名第 10,是同参数级别中排名第 1。
根据 GitHub 项目页面的信息显示,MiLM-6B 是小米公司研发的一款规模庞大的预训练语言模型,参数数量高达 64 亿。
根据C-Eval提供的数据,MiLM-6B模型在STEM(科学、技术、工程和数学教育)的20个具体科目中,在计量师、物理、化学、生物等多个项目上取得了较高的准确率。
据报道,MiLM-6B 模型目前在许多文科科目中表现良好,但在涉及“抽象思维”的科目,比如“法学、数学、编程、概率论、离散数学”等方面,仍有改进的空间。
在10個"社會科學"測試科目中,除了"教育學和地理"之外,這個模型在其餘8個科目中都取得了相對理想的準確率。在人文科學的11個科目中,MiLM-6B 在"歷史與法律"方面表現出了不錯的準確率。