新闻资讯

小米开源首个推理大模型Xiaomi MiMo

  新浪科技讯 4月30日上午消息,小米开源首个为推理(Reasoning)而生的大模型‘Xiaomi MiMo’,联动预训练到后训练,全面提升推理能力。

  据介绍,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

  随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

  值得注意的是,MiMo-7B全系列模型均已开源。据了解,MiMo 来自小米全新成立不久的“小米大模型Core团队”的初步尝试。(闫妍)

  • 工商银行东营分行被罚57.8万元:违反账户管理规定,违反网络安全管理规定等
  • 湖北一厅官利用其子结婚之机违规收受礼金!他还涉嫌充当涉黑“保护伞”
  • 把银行APP当金店逛,“新淘金热”被点燃:有银行贵金属资产规模年增70%
  • 泰国央行将关键利率降至两年来最低 行长此前警告贸易冲突带来经济风暴
  • 住房和城乡建设部办公厅主任李晓龙已任部总工程师
  • 去年立案侦办侵权假冒案件3.7万起,公安部公布13起案例
  • 直击车展|对话日产汽车马智欣:必须跟上中国速度,把产品研发周期缩短至24个月内
  • 乌克兰据悉准备最快周三与美国签署自然资源协议
  • 老铺黄金早盘涨近7% 机构称在金价上涨背景下销售更为受益
  • 言短意长|新能源领军者密集捐赠母校
  • 艺人自爆出道6年0工资,乐华CEO杜华:公司投的钱还没还
  • 直击沪市业绩说明会:智能体获产业界共识 上市公司加速竞逐AI应用
  • 新西兰南岛西岸远海发生6.2级地震,震源深度10千米
  • 新澳澳门最精准龙门,助力足球赛事走向巅峰
  • 国家药监局:暂停进口印度一原料药
  • 关键词: