news 2026/6/9 11:12:11

媲美 DeepSeek-V3.2,小米开源3090亿参数大模型,把手机的性价比卷到 AI

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
媲美 DeepSeek-V3.2,小米开源3090亿参数大模型,把手机的性价比卷到 AI

2025年12月17日,在小米“人车家全生态”合作伙伴大会上,新近加入小米的Xiaomi MiMo大模型负责人罗福莉首次公开亮相,发布了小米自研的推理大模型MiMo-V2-Flash,并宣布其全面开源

该模型采用混合专家架构,总参数为309B,激活参数为15B,实现极致的推理效率。

01 技术背景

小米此次发布的MiMo-V2-Flash是该公司自主研发的首个推理大模型。

模型负责人罗福莉于今年11月加入小米,此前她曾主导开发多语言预训练模型VECO,并参与了MoE大模型DeepSeek-V2的研发。

罗福莉在本次大会上表示,智能终将从语言迈向物理世界,她正在小米与团队共同构建这样的未来。

02 核心参数与性能

MiMo-V2-Flash采用混合专家架构,总参数量为309B,实际激活参数量为15B。

罗福莉指出,与同类模型相比,MiMo-V2-Flash的参数量减少了1/2至2/3,但在多项评测中性能表现突出。

该模型在多项权威代码与智能体评测基准中已位居全球开源模型前列。具体来看,其在SWE-Bench Verified测试中获得73.4%的分数,超越了DeepSeek-V3.2和Kimi-K2-Thinking等主流开源模型。

03 技术创新

MiMo-V2-Flash在技术架构上采用了一系列创新设计。该模型采用了混合注意力架构,具体为5层滑动窗口注意力与1层全局注意力交替使用。

滑动窗口注意力机制将每个token的注意力视野限制在邻近的128个token内,这种设计可以将注意力计算复杂度从平方级降低为线性级

研究团队发现,128被证明是窗口大小的最佳数值,而512反而会导致性能下降。为缓解滑动窗口可能导致的长文理解问题,模型引入了可学习的注意力汇聚偏置。

04 训练与效率优化

在模型训练方面,MiMo-V2-Flash采用了多教师在线策略蒸馏的新范式。这种方法只需要传统训练方法约1/50的算力,就能使学生模型达到教师模型的性能峰值。

模型支持深度思考与联网搜索功能,能够实现自然流畅的人机对话,并在需要实时数据获取、动态信息查询或资料验证的场景中提供支持。

模型原生支持32K序列长度,可扩展至256K上下文窗口。

05 成本与可用性

MiMo-V2-Flash展现出卓越的推理速度与成本控制能力。API定价为每百万token输入0.1美元、输出0.3美元。

罗福莉指出,对比闭源竞品Claude 4.5 Sonnet,该模型的推理成本仅为其2.5%左右。模型已经在Hugging Face上以MIT许可协议发布,包括基础版权重。

小米还推出了在线AI聊天服务Xiaomi MiMO Studio,可以通过该平台体验MiMo-V2-Flash。该服务支持深度思考和联网搜索功能。

小米模型体验地址:

https://aistudio.xiaomimimo.com/

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 6:50:05

MonitorControl完整教程:轻松掌控Mac外接显示器设置

MonitorControl完整教程:轻松掌控Mac外接显示器设置 【免费下载链接】MonitorControl MonitorControl/MonitorControl: MonitorControl 是一款开源的Mac应用程序,允许用户直接控制外部显示器的亮度、对比度和其他设置,而无需依赖原厂提供的软…

作者头像 李华
网站建设 2026/6/9 5:18:13

Qualcomm Atheros QCA9377无线网卡Linux驱动完整教程与详细步骤

Qualcomm Atheros QCA9377无线网卡Linux驱动完整教程与详细步骤 【免费下载链接】Qualcomm-Atheros-QCA9377-Wifi-Linux Drivers and Firmware for Qualcomm Atheros QCA9377 0042 [rev. 30] 项目地址: https://gitcode.com/gh_mirrors/qu/Qualcomm-Atheros-QCA9377-Wifi-Lin…

作者头像 李华
网站建设 2026/6/7 11:10:04

电网智能体的“决策感官”:高精度AI气象如何使电网自主预测、调度,实时平衡万亿级新能源波动?

摘要本文系统阐述高精度AI气象技术如何作为电网智能体的核心感知与决策系统,通过多尺度气象融合预测、源-网-荷-储动态耦合及自主优化调度三大技术体系,破解高比例新能源接入下电力系统运行的确定性难题。研究显示,该系统可将风电/光伏功率预…

作者头像 李华
网站建设 2026/6/9 1:11:57

Rustup工具链管理完全指南:从安装到精通

Rustup工具链管理完全指南:从安装到精通 【免费下载链接】rustup The Rust toolchain installer 项目地址: https://gitcode.com/gh_mirrors/ru/rustup Rustup作为Rust编程语言的官方工具链管理器,是每个Rust开发者必须掌握的核心工具。它不仅能简…

作者头像 李华
网站建设 2026/6/9 0:16:13

XChart完全指南:轻松实现Java数据可视化

XChart完全指南:轻松实现Java数据可视化 【免费下载链接】XChart 项目地址: https://gitcode.com/gh_mirrors/xch/XChart 还在为Java项目中枯燥的数据展示而烦恼吗?XChart这款轻量级图表库能帮你快速将数据转化为生动的可视化图表!本…

作者头像 李华