小米开源"小米MiMo"大模型:挑战OpenAI o1-mini,7B参数碾压,推理能力瞩目

3个月前 科技 16观看
摘要 小米开源"小米MiMo"大模型:挑战OpenAI o1-mini,7B参数碾压,推理能力瞩目随着人工智能的快速发展,大模型已成为业界研究的热点。小米公司也不甘示弱,其大模型团队通过小米MiMo公众号宣布,他们开源了首个“为推理而生”

小米开源"小米MiMo"大模型:挑战OpenAI o1-mini,7B参数碾压,推理能力瞩目TEN喜好网-记录每日喜好的科技时尚娱乐生活

随着人工智能的快速发展,大模型已成为业界研究的热点。小米公司也不甘示弱,其大模型团队通过小米MiMo公众号宣布,他们开源了首个“为推理而生”的大模型MiMo。这款模型在数学推理和代码竞赛公开测评集上展现出了强大的实力,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。TEN喜好网-记录每日喜好的科技时尚娱乐生活

MiMo是小米大模型Core团队的一次初步尝试,他们通过联动预训练到后训练的全面提升,使得MiMo的推理能力得到了显著提升。在数据和算法等多层面的创新驱动下,MiMo的推理能力得到了质的飞跃。TEN喜好网-记录每日喜好的科技时尚娱乐生活

预训练阶段的核心是让模型见过更多推理模式,而数据层面则着重挖掘富推理语料,并合成约200B tokens的推理数据。经过三阶段的训练,逐步提升训练难度,总训练达到25T tokens。这些工作为MiMo的后训练阶段打下了坚实的基础。TEN喜好网-记录每日喜好的科技时尚娱乐生活

后训练阶段的核心是高效稳定的强化学习算法和框架。为了解决困难算法问题中的奖励稀疏问题,团队提出了Test Difficulty Driven Reward策略。此外,他们还引入了Easy Data Re-Sampling策略,以稳定RL训练。在框架方面,他们设计了Seamless Rollout系统,使得RL训练加速2.29倍,验证加速1.96倍。这些创新性的方法大大提升了MiMo模型的性能。TEN喜好网-记录每日喜好的科技时尚娱乐生活

开源地址和相关技术报告的链接也已附在文章中。小米MiMo大模型的开源行为展现了小米公司对技术共享和社区合作的重视,这也是小米在人工智能领域积极布局的一部分。TEN喜好网-记录每日喜好的科技时尚娱乐生活

MiMo的推理能力提升不仅体现在参数规模上,更体现在其在实际应用中的表现。在数学推理和代码竞赛公开测评集上,MiMo仅用7B的参数规模,就超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。这一成绩无疑证明了MiMo的强大实力和广阔的应用前景。TEN喜好网-记录每日喜好的科技时尚娱乐生活

小米MiMo大模型的出现,无疑给业界带来了新的思考和启示。它不仅展示了小米在人工智能领域的实力和决心,也为学术界和工业界提供了宝贵的经验和参考。随着小米MiMo大模型的进一步发展,我们期待它在更多领域展现出卓越的性能和价值。TEN喜好网-记录每日喜好的科技时尚娱乐生活

总的来说,小米MiMo大模型以挑战OpenAI o1-mini为目标,凭借7B参数的规模碾压对手,其推理能力令人瞩目。小米MiMo的开源行为和其在技术上的创新性举措,都值得我们肯定和赞赏。我们期待小米MiMo大模型在未来能够取得更多的突破和成就,为人工智能的发展做出更大的贡献。TEN喜好网-记录每日喜好的科技时尚娱乐生活

TEN喜好网-记录每日喜好的科技时尚娱乐生活

TEN喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
疑遭猎杀 泰海域发现无头“美人鱼”:只因毫无科学依据的传说

疑遭猎杀 泰海域发现无头“美人

11月19日

11-19 122阅读
奇瑞劲云概念车实拍图发布,将亮相广州车展,支持特殊驾驶模式

奇瑞劲云概念车实拍图发布,将亮相

11-19 101阅读
撑起“北方第二城”,凭什么是它?

撑起“北方第二城”,凭什么是它?

全国

11-19 112阅读
一个融了16轮的IPO,投资人集体赚钱了

一个融了16轮的IPO,投资人集体赚

近期

11-19 125阅读
打工人,靠新中式按摩“续命”

打工人,靠新中式按摩“续命”

26岁

11-19 109阅读
莎拉波娃涉嫌欺诈? 网球巨星竟有这样的污点究竟是怎么回事

莎拉波娃涉嫌欺诈? 网球巨

如果是非常关注体育界的话,莎拉波

11-19 103阅读
小舍得原著结局是什么?南俪和夏君山的结局好不好?

小舍得原著结局是什么?南俪

《小舍得》是一根据鲁引弓的同名

11-19 100阅读
长江文化艺术季闭幕式圆满落幕 平安携手金莎合唱《何以家国》

长江文化艺术季闭幕式圆满

  4日晚,长江文化艺术季闭幕式在宜昌

11-19 104阅读
24岁影后李庚希被喊黑幕!曾被徐静蕾力捧没听倪萍劝告

24岁影后李庚希被喊黑幕!曾

11月16日晚,金鸡奖评选上曝出最大冷门

11-19 111阅读
零容忍!税务部门公布3起网络主播偷税被处罚案件

零容忍!税务部门公布3起网

11月15日消息,近

11-19 106阅读
《优米雅的鍊金工房》第二波情报,新宣传片公开

《优米雅的鍊金工房》第二

活着, 就会不断地累积记忆。这是她在灭

11-19 107阅读
《模拟农场25》水稻种植终于实装 专业农户称赞超真实

《模拟农场25》水稻种植终

经典写实模拟农场游戏系列最新作《模

11-19 97阅读
360浏览器兼容模式怎么设置?360浏览器极速模式怎么开?一文看懂

360浏览器兼容模式怎么设

360浏览器是我们使用最多的一款浏览器

11-19 119阅读
CS1.6怎么加机器人?CS1.6加机器人方法

CS1.6怎么加机器人?CS1.6

《CS1.6》也就是大家都玩过的反恐精英

11-19 189阅读
原子之心3826设施所有死者所在位置一览

原子之心3826设施所有死者

在原子之心游戏设定中,死者在生命体征消

11-19 123阅读