小米开源首个推理大模型Xiaomi MiMo

  新浪科技讯 4月30日上午消息,小米开源首个为推理(Reasoning)而生的大模型‘Xiaomi MiMo’,联动预训练到后训练,全面提升推理能力。

  据介绍,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

  随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

  值得注意的是,MiMo-7B全系列模型均已开源。据了解,MiMo 来自小米全新成立不久的“小米大模型Core团队”的初步尝试。(闫妍)

卡尼领导的加拿大自由党在联邦众议院选举中获胜外交部回应

中吉乌铁路重点控制性工程开工建设,包括三座隧道

沪指窄幅震荡 多只银行股创历史新高

特斯拉可能痛失关键市场!纽约州议员提议关闭其所有当地门店

特斯拉美国内华达州Semi工厂预计年内投产首批电动卡车

李在明涉嫌违反《公职选举法》案将于5月1日宣判

“ChatGPT严选”横空出世了,“DeepSeek严选”还要等多久?

涉嫌性侵日本女性,两名驻日美军士兵面临刑事指控!日本民众集会抗议,美驻日大使:将配合调查

为了反制特朗普,欧洲祭出了“豪猪”战略

复星国际:豫园股份一季度归母净利润约5182.74万元 同比减少71.24%

亚马逊将在产品标价旁显示美国关税产生的额外成本

澳大利亚一季度通胀率持稳于四年低点2.4%

美国2月FHFA房价指数环比上涨0.1% 低于预期

这就是上海!

数字中国建设峰会启幕 奇富科技费浩峻详解智能体时代三大要素升级

乌总理:俄方袭击致乌天然气产量损失近50%

特斯拉宣布Semi工厂建成,有望明年量产,价格或大幅上涨

通用汽车拉响警报:尽管Q1盈利超预期,仍撤回业绩指引、冻结股票回购

企业取消“大小周”引热议,半月谈:不能将显性加班变为隐性加班

东方电气公布一季度业绩 归母净利润约11.54亿元同比增长27.39%

<< 上一篇

马上评丨准入壁垒越少,市场活力越足

下一篇 >>

锗价驱动2024年业绩暴增,云南锗业如何破解现金流负增长困局?

版权声明

除非注明,文章均由 24小时全国售后服务客服热线-全国官方售后服务点热线号码 整理发布,欢迎转载。

转载请注明本文地址:http://www.qlzijzu.com/post/58829.html

相关文章