如何评价6月9日小米MiMo-V2.5-Pro的UltraSpeed模式?1000tps是怎么实现的?
前言 / 简介
在苹果 WWDC26 开始前几个小时,小米 MiMo 悄然发布了 MiMo-V2.5-Pro 的 UltraSpeed 模式

这是业内首次在 1 万亿参数大模型上突破了 1000 tokens/s 输出速度
拿手机举例,这就是 AI 大模型领域的国产 5G 时刻!
MiMo-UltraSpeed 是什么?
讨论 MiMo-V2.5-Pro-UltraSpeed 之前,我们先来看看它是什么
简单来说就是,通过模型与系统的极致 Codesign(Co-design 协同设计)业内首次在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/秒

小米官方介绍
小米技术官号对 MiMo-UltraSpeed 进行了介绍
官方宣称 MiMo-UltraSpeed 的速度比标准速度快 10 倍以上,峰值甚至能达到 1200-1300 tokens/s
小米技术官号介绍 MiMo-V2.5-Pro-UltraSpeed:1T 参数模型生成速度推向 1000 Tps价格为标准速度 3 倍
MiMo-UltraSpeed 限时体验价仅为标准速度的 3 倍
| MiMo-V2.5-Pro | 输入 缓存命中 | 输入 缓存未命中 | 输出 |
|---|---|---|---|
| 标准速度 | ¥0.025 / 1M token | ¥3.0 / 1M token | ¥6.0 / 1M token |
| UltraSpeed | ¥0.075 / 1M token | ¥9.0 / 1M token | ¥18.0 / 1M token |

目前为申请制体验,通过审核的用户还可获得免费的 Chat 体验
实际表现对比视频
小米技术官号放出了 MiMo-V2.5-Pro-UltraSpeed 的实际表现对比
左边是 MiMo-UltraSpeed,右边是标准速度
https://www.zhihu.com/video/2047838225297937703一段相同提示词的任务,右侧标准速度需要 6 分 15 秒完成,左侧 UltraSpeed 仅需 12.4 秒!
两者用时差距超 30 倍,小米官方宣称的 10 倍速度可能还保守了!
为什么速度很重要?
我给大家举个例子
- 不知道各位有没有听过一个说法「月薪 8000 不是月薪 4000 的两倍,而是五倍」
- 意思是,月薪 8000 看起来可能是 4000 的两倍,但如果统一减去 3000 生活成本,实际到手就是 5000 和 1000,前者变成了后者五倍
我再给大家举个例子
- 2G 时代,我们会把小说书籍等文字内容下载到手机,以获得流畅不间断的阅读体验
- 3G 时代,我们会把漫画音乐等内容下载到手机,以获得流畅不间断的视听体验
- 4G 时代,我们会把电影和剧集等视频内容下载到手机,以获得流畅不间断的观影体验
5G 时代,我们似乎很少在手机里下载东西了,而都是在线观看和阅读,这个现象的本质原因是网速有了显著提升,只要流媒体平台正常,5G 网可以非常方便地实时加载,拖动进度条也无需等待(所以我说,MiMo-UltraSpeed 是大模型领域的国产 5G 时刻)
我的意思是,虽然 MiMo-UltraSpeed 看似只是标准速度的 10 倍左右,但它带来的体验提升可谓前所未有,因为你可以无需纠结地待在电脑旁等 AI 完成任务,也没必要离开窗口去做别的事
如果你在用之前的 AI 大模型,可能会纠结「我该在电脑上进行别的任务,还是玩会手机,或者离开电脑去做点别的?」而在这样纠结的过程中,你损失的时间可能已经超过 MiMo-UltraSpeed 完成任务的时间了(毕竟前段视频里,MiMo-UltraSpeed 真就只花了十几秒)
此时,所谓的「10 倍速度」就已经不是 9 倍的差距,而是一劳永逸地解决了你的纠结,可以让你更沉浸地使用 AI 完成一系列复杂的任务,不需要频繁地来回切换工作场景 并大大影响工作效率
不严谨对比友商
既然开头提到了 WWDC26,而苹果今年 OS 27 的重心也确实是 Apple Intelligence 和 Siri AI
那我刚好拿 Siri AI 的一个场景作对比,我知道它和 MiMo-UltraSpeed 并非同类大模型、也并非相似场景,我是想通过对比来说明「速度差距的感受有多明显」
该场景中,用户让 Siri AI「发信息到群里,问他们要不要来派对,并附上菜单」其实需求很简单
但是 iPhone 17 Pro 的 Siri AI 花了近十秒才完成这个任务,而且在进行任务这十秒里,屏幕上只有一个小图标动画和「Working...」提示

这不仅是在让用户等待,其实还会造成用户的不确定心理,因为用户对等待的时间没有预期,不耐烦和焦虑的情绪会在等待过程中呈指数级增长,这也是目前 AI 大模型的明显短板之一
所以凌晨看到这里,我最明显的感受就是「好慢啊!」……

回到前段视频里的那个场景,右侧的 MiMo 标准速度其实还会出现停顿和等待,而左侧的 MiMo-UltraSpeed 已经快到看不清思考过程了,更别说任何可感知的停顿……
而如果没有停顿 用户也就不存在任何不确定心理,只需要安心等待结果输出即可
总结
小米目前已经通过 MiMo 的全方位布局,成为了当前国内头部的 AI 企业之一,而且即便放眼全球,同时拥有顶级 AI 大模型和手机终端产品的企业,也只有小米和谷歌了
虽然在这个话题下,仍有某些顽固分子假装理中客来吐槽几句小米,但我相信他们心里也清楚:小米现在早已不是十年前的那个小米了……
小米长期坚持「人车家全生态」的核心理念,在全球都有丰富的产品矩阵和出色影响力,而 MiMo 也必将走出国门、走向世界,成为国产 AI 大模型的代表之一!
展望未来
我认为 MiMo-V2.5-Pro-UltraSpeed 确实是很有「小米思维」的产品
先是标准版和 Pro,然后是相对较贵的 Ultra(当然 对比同档竞品还是很划算)这不就是小米汽车的剧本嘛!
Ultra 的性价比已经很棒,雷总再出个性价比更极致的 V2.5-Pro-GTSpeed 吧,伟大旅程!(狗头)