如何评价6月9日小米MiMo-V2.5-Pro的UltraSpeed模式?1000tps是怎么实现的?

前言 / 简介

在苹果 WWDC26 开始前几个小时,小米 MiMo 悄然发布了 MiMo-V2.5-Pro 的 UltraSpeed 模式

这是业内首次在 1 万亿参数大模型上突破了 1000 tokens/s 输出速度

拿手机举例,这就是 AI 大模型领域的国产 5G 时刻


MiMo-UltraSpeed 是什么?

讨论 MiMo-V2.5-Pro-UltraSpeed 之前,我们先来看看它是什么

简单来说就是,通过模型与系统的极致 Codesign(Co-design 协同设计)业内首次在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/秒


小米官方介绍

小米技术官号对 MiMo-UltraSpeed 进行了介绍

官方宣称 MiMo-UltraSpeed 的速度比标准速度快 10 倍以上,峰值甚至能达到 1200-1300 tokens/s

小米技术官号介绍 MiMo-V2.5-Pro-UltraSpeed:1T 参数模型生成速度推向 1000 Tps


价格为标准速度 3 倍

MiMo-UltraSpeed 限时体验价仅为标准速度的 3 倍

MiMo-V2.5-Pro输入 缓存命中输入 缓存未命中输出
标准速度¥0.025 / 1M token¥3.0 / 1M token¥6.0 / 1M token
UltraSpeed¥0.075 / 1M token¥9.0 / 1M token¥18.0 / 1M token

目前为申请制体验,通过审核的用户还可获得免费的 Chat 体验


实际表现对比视频

小米技术官号放出了 MiMo-V2.5-Pro-UltraSpeed 的实际表现对比

左边是 MiMo-UltraSpeed,右边是标准速度

https://www.zhihu.com/video/2047838225297937703

一段相同提示词的任务,右侧标准速度需要 6 分 15 秒完成,左侧 UltraSpeed 仅需 12.4 秒!

两者用时差距超 30 倍,小米官方宣称的 10 倍速度可能还保守了!


为什么速度很重要?

我给大家举个例子

  • 不知道各位有没有听过一个说法「月薪 8000 不是月薪 4000 的两倍,而是五倍」
  • 意思是,月薪 8000 看起来可能是 4000 的两倍,但如果统一减去 3000 生活成本,实际到手就是 5000 和 1000,前者变成了后者五倍

我再给大家举个例子

  • 2G 时代,我们会把小说书籍等文字内容下载到手机,以获得流畅不间断的阅读体验
  • 3G 时代,我们会把漫画音乐等内容下载到手机,以获得流畅不间断的视听体验
  • 4G 时代,我们会把电影和剧集等视频内容下载到手机,以获得流畅不间断的观影体验

5G 时代,我们似乎很少在手机里下载东西了,而都是在线观看和阅读,这个现象的本质原因是网速有了显著提升,只要流媒体平台正常,5G 网可以非常方便地实时加载,拖动进度条也无需等待(所以我说,MiMo-UltraSpeed 是大模型领域的国产 5G 时刻)


我的意思是,虽然 MiMo-UltraSpeed 看似只是标准速度的 10 倍左右,但它带来的体验提升可谓前所未有,因为你可以无需纠结地待在电脑旁等 AI 完成任务,也没必要离开窗口去做别的事

如果你在用之前的 AI 大模型,可能会纠结「我该在电脑上进行别的任务,还是玩会手机,或者离开电脑去做点别的?」而在这样纠结的过程中,你损失的时间可能已经超过 MiMo-UltraSpeed 完成任务的时间了(毕竟前段视频里,MiMo-UltraSpeed 真就只花了十几秒)

此时,所谓的「10 倍速度」就已经不是 9 倍的差距,而是一劳永逸地解决了你的纠结,可以让你更沉浸地使用 AI 完成一系列复杂的任务,不需要频繁地来回切换工作场景 并大大影响工作效率


不严谨对比友商

既然开头提到了 WWDC26,而苹果今年 OS 27 的重心也确实是 Apple Intelligence 和 Siri AI

那我刚好拿 Siri AI 的一个场景作对比,我知道它和 MiMo-UltraSpeed 并非同类大模型、也并非相似场景,我是想通过对比来说明「速度差距的感受有多明显」


该场景中,用户让 Siri AI「发信息到群里,问他们要不要来派对,并附上菜单」其实需求很简单

但是 iPhone 17 Pro 的 Siri AI 花了近十秒才完成这个任务,而且在进行任务这十秒里,屏幕上只有一个小图标动画和「Working...」提示

这段从 WWDC26 第 41 分钟开始


这不仅是在让用户等待,其实还会造成用户的不确定心理,因为用户对等待的时间没有预期,不耐烦和焦虑的情绪会在等待过程中呈指数级增长,这也是目前 AI 大模型的明显短板之一

所以凌晨看到这里,我最明显的感受就是「好慢啊!」……

如果不相信,可以去看回放,01:41 就是播到这段


回到前段视频里的那个场景,右侧的 MiMo 标准速度其实还会出现停顿和等待,而左侧的 MiMo-UltraSpeed 已经快到看不清思考过程了,更别说任何可感知的停顿……

而如果没有停顿 用户也就不存在任何不确定心理,只需要安心等待结果输出即可


总结

小米目前已经通过 MiMo 的全方位布局,成为了当前国内头部的 AI 企业之一,而且即便放眼全球,同时拥有顶级 AI 大模型和手机终端产品的企业,也只有小米和谷歌了

虽然在这个话题下,仍有某些顽固分子假装理中客来吐槽几句小米,但我相信他们心里也清楚:小米现在早已不是十年前的那个小米了……

小米长期坚持「人车家全生态」的核心理念,在全球都有丰富的产品矩阵和出色影响力,而 MiMo 也必将走出国门、走向世界,成为国产 AI 大模型的代表之一!


展望未来

我认为 MiMo-V2.5-Pro-UltraSpeed 确实是很有「小米思维」的产品

先是标准版和 Pro,然后是相对较贵的 Ultra(当然 对比同档竞品还是很划算)这不就是小米汽车的剧本嘛!

Ultra 的性价比已经很棒,雷总再出个性价比更极致的 V2.5-Pro-GTSpeed 吧,伟大旅程!(狗头)


编辑于 2026-06-10 · 著作权归作者所有