小米开源首个推理大模型Xiaomi MiMo

2025-04-30 10:20:02 / 0 条评论 / 3 次浏览 / 24小时故障维修电话售后服务

　　新浪科技讯 4月30日上午消息，小米开源首个为推理（Reasoning）而生的大模型‘Xiaomi MiMo’，联动预训练到后训练，全面提升推理能力。

　　据介绍，在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo 仅用 7B 的参数规模，超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

　　随着DeepSeek-R1引发业界强化学习（RL）共创潮，DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下，MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

　　值得注意的是，MiMo-7B全系列模型均已开源。据了解，MiMo 来自小米全新成立不久的“小米大模型Core团队”的初步尝试。（闫妍）

卡尼领导的加拿大自由党在联邦众议院选举中获胜外交部回应

中吉乌铁路重点控制性工程开工建设，包括三座隧道

沪指窄幅震荡多只银行股创历史新高

特斯拉可能痛失关键市场！纽约州议员提议关闭其所有当地门店

特斯拉美国内华达州Semi工厂预计年内投产首批电动卡车

李在明涉嫌违反《公职选举法》案将于5月1日宣判

“ChatGPT严选”横空出世了，“DeepSeek严选”还要等多久？

涉嫌性侵日本女性，两名驻日美军士兵面临刑事指控！日本民众集会抗议，美驻日大使：将配合调查

为了反制特朗普，欧洲祭出了“豪猪”战略

复星国际：豫园股份一季度归母净利润约5182.74万元同比减少71.24%

亚马逊将在产品标价旁显示美国关税产生的额外成本

澳大利亚一季度通胀率持稳于四年低点2.4%

美国2月FHFA房价指数环比上涨0.1% 低于预期

这就是上海！

数字中国建设峰会启幕奇富科技费浩峻详解智能体时代三大要素升级

乌总理：俄方袭击致乌天然气产量损失近50%

特斯拉宣布Semi工厂建成，有望明年量产，价格或大幅上涨

通用汽车拉响警报：尽管Q1盈利超预期，仍撤回业绩指引、冻结股票回购

企业取消“大小周”引热议，半月谈：不能将显性加班变为隐性加班

东方电气公布一季度业绩归母净利润约11.54亿元同比增长27.39%

<< 上一篇

马上评丨准入壁垒越少，市场活力越足

下一篇 >>

锗价驱动2024年业绩暴增，云南锗业如何破解现金流负增长困局？

版权声明

除非注明，文章均由 24小时全国售后服务客服热线-全国官方售后服务点热线号码整理发布，欢迎转载。

转载请注明本文地址：http://www.qlzijzu.com/post/58829.html

相关文章