news 2026/5/4 9:36:30

小米 MiMo:最近很活跃的AI模型,还白送 100 万亿 tokens

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
小米 MiMo:最近很活跃的AI模型,还白送 100 万亿 tokens

小米 MiMo:最近很活跃的AI模型,还白送 100 万亿 tokens


小米什么时候成 AI 模型厂商了?

很多人对小米做 AI 的印象还停留在"小爱同学"。但过去两个月,小米的 MiMo 模型系列以一种近乎刷屏的节奏密集更新,密度堪比当年的 DeepSeek。

梳理一下4月份的时间线:

  • Orbit 激励计划上线,总池子 100 万亿 tokens,面向开发者发放
  • 小米 MiMo-V2.5 系列开源
  • Xiaomi MiMo-V2.5-TTS-Series + ASR 正式发布:你的声音,随心所“驭”
  • 小米 MiMo-V2.5 系列
  • Xiaomi MiMo 现已接入全球顶级 Agent 框架 Hermes Agent,并限免两周
  • Xiaomi MiMo-V2-Pro 发布:面向 Agent 时代的旗舰基座
  • Xiaomi MiMo-V2-Omni 发布:看得清,听得懂,能动手的全模态 Agent 基座
  • Xiaomi MiMo-V2-TTS 发布:能说会唱的语音合成大模型

一个做手机的公司,怎么突然在开源模型圈这么活跃?


MiMo 到底是什么水平

先说 MiMo-7B,这是小米的成名作。

7B 参数在大模型圈属于"小个子",但 MiMo-7B 用强化学习硬生生把它训练成了推理怪兽。核心数据:

BenchmarkGPT-4oClaude-3.5-Sonneto1-miniMiMo-7B-RL
MATH-50074.678.390.095.8
AIME 20249.316.063.668.2
AIME 202511.67.450.755.4
LiveCodeBench v532.938.953.857.8

一个 7B 的模型,在数学推理上把 GPT-4o 和 Claude-3.5-Sonnet 按在地上摩擦。后来的增强版 MiMo-7B-RL-0530 更进一步,AIME 2024 拿到 80.1 分,直接超越 DeepSeek R1 的 79.8。

技术上,MiMo-7B 有几个值得注意的点:

  1. 预训练用了约 25 万亿 tokens,三阶段数据混合策略,专门增强了推理模式的密度
  2. 多 Token 预测(MTP)作为额外训练目标,使用一个 MTP 层做推测解码时,接受率约 90%
  3. RL 阶段只用基于规则的准确性奖励,不用神经网络奖励模型,避免了 reward hacking
  4. 代码奖励引入了测试难度驱动机制,给不同难度的测试用例分配细粒度分数

这些设计组合在一起,让一个小模型在推理任务上打出了远超自身参数量的表现。


从 7B 到 1T:V2 系列的跳跃

MiMo-7B 证明了小米在模型训练上有真功夫,但 7B 参数终究有天花板。V2 系列是一次量级跳跃:

MiMo-V2-Pro:约 1T 参数,100 万上下文窗口,专门优化代码生成和理解。2026 年 3 月先以"Hunter Alpha"的化名在 OpenRouter 上线,一周后才正式解密——这个操作本身就很有趣,说明小米想先让社区用盲测来评价模型能力,而不是靠品牌滤镜。

MiMo-V2.5(311B)和MiMo-V2.5-Pro(1T):2026 年 4 月公测。V2.5-Pro 在软件工程任务中能和 Claude Opus 4.6、GPT-5.4 正面竞争,完成 SysY 编译器任务只需 4.3 小时。Token 效率相比上一代提升 42% 到 50%——这意味着同样的效果,API 调用成本直接砍半。

MiMo-V2.5-ASR(8B):专用语音识别模型,开源后在 HuggingFace 上可以直接部署。

从 7B 推理模型到 1T 全模态 Agent,小米用了不到一年。这个速度在开源模型圈里确实少见。


Orbit 计划:100 万亿 token 的羊毛

重点来了。

小米在 4 月 28 日上线了Orbit 激励计划,总池子 100 万亿 tokens,面向开发者发放。地址:100t.xiaomimimo.com

能领多少?

根据我的观察,填写申请表单后:

  • 运气好的能拿到Max 月度套餐,包含16 亿 tokens
  • 普通的也能拿到Pro 月度套餐,包含7 亿 tokens
  • 官方 Max 年度订阅价格将近 7000 元,送 1 个月相当于白嫖约 600 元

16 亿 tokens 是什么概念?日常开发中写代码、做 Review、跑测试,够用很久了。我自己试了下,只拿到了一个Pro

怎么申请?

流程很简单:

  1. 先用你的邮箱登录platform.xiaomimimo.com(MiMo API 开放平台)
  2. 打开100t.xiaomimimo.com,填写申请表单
  3. 表单内容主要是选你常用的 AI 编程工具和底层模型,再描述一下你用 AI 做过什么项目
  4. 提交后等审核,审核很快,官方说法是 3 个工作日

注意:最好先登录开放平台再申请,否则权益可能无法到账。登录后 24 小时内权益会自动到账,在订阅管理中可以看到。

支持哪些模型和工具?

赠送的套餐支持 MiMo 全系列模型,包括 V2.5-Pro、V2.5 等。同时兼容 Claude Code、OpenCode 等主流编程工具。

也就是说,你可以把这个额度接到 Claude Code 里,用 MiMo 的模型跑日常开发任务。


值不值得?

白送的东西,没有不薅的道理。

我自己还没用,期待使用之后写一个反馈,不过我看了下网上的评论:

  1. MiMo 模型的实际编程能力,在复杂任务上和 Claude Opus、GPT-5 还有差距,但在中等难度的日常开发任务上已经够用。
  2. Token 效率提升 42%-50%是官方数据,实际体验取决于具体任务类型
  3. Orbit 计划的审核标准不透明——有人随便填就拿到了 Max 套餐,有人认真写反而只拿到 Pro,有一定随机性
  4. tokens 的有效期是 1 个月,过期作废,所以领到之后要尽快用

对于开发者来说,最实际的用法是:

  • 把 MiMo 接到 Claude Code 或 OpenCode 里,作为日常轻量任务的备选模型
  • 用它跑一些不那么关键的代码生成、文档编写、测试用例生成
  • 把省下来的 Claude/GPT 额度留给真正需要强模型的复杂任务

最后

说实话,之前我从来不用国产模型的,但是也一直期待国产模型能崛起,从DS到minimax/kimi/GLM,希望mimo在国产一线能有一席之地。看他们的模型迭代速度,感觉是玩真的了。

Orbit 计划的 100 万亿 token 池,也是小米在用真金白银换开发者生态。策略和当年 DeepSeek 开源类似——先让开发者用起来,用的人多了,生态自然就起来了。

至于能不能替代 Claude 或 GPT?再说吧,白送 16 亿 tokens,先薅了再说。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 9:34:54

Python通达信数据获取终极指南:快速掌握股票量化分析利器

Python通达信数据获取终极指南:快速掌握股票量化分析利器 【免费下载链接】mootdx 通达信数据读取的一个简便使用封装 项目地址: https://gitcode.com/GitHub_Trending/mo/mootdx 还在为股票数据获取烦恼吗?每次进行量化分析都要面对复杂的API接口…

作者头像 李华
网站建设 2026/5/4 9:34:38

BetterNCM安装器完全指南:一键解锁网易云音乐隐藏功能

BetterNCM安装器完全指南:一键解锁网易云音乐隐藏功能 【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件 项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 还在为网易云音乐功能单一而烦恼?BetterNCM安装器让你轻松…

作者头像 李华
网站建设 2026/5/4 9:26:52

[2026.5.3][IT工坊]WIN11.26H1.28020.1921[PIIS]中简深度优化版

精简了Defender和大多数人用不上的IIS、hyper-V等组件 精简了EDGE、Webview2、微软应用商店 (三者提供有恢复安装包) 精简了SxS,不支持启用新功能,不支持更新 保留了IE、截图工具、讲述人、TTS、人脸识别 、NET4.8.1、Media Player等 集成了NET3.5、VC运行库 已去掉桌面右下角水…

作者头像 李华
网站建设 2026/5/4 9:19:50

Docker Compose部署WordPress:从环境一致性到生产级调优

1. 项目概述:一个为WordPress量身定制的Docker化解决方案如果你正在寻找一种快速、干净、可复现的方式来部署WordPress,那么你很可能已经厌倦了手动配置LAMP(Linux, Apache, MySQL, PHP)环境的繁琐。每次换服务器、重装系统&#…

作者头像 李华