如何评价小米mimo-V2.5 系列模型5月27日大降价？

早上起来后发现，身边的几个群里都在聊小米Mimo-V2.5系列大模型的大降价，而且不只降价，还把这个月大家用的返还给了用户，进行了一波重置，真的是“业界良心”。

AI发展到现在，已经逐渐从AI时代，进化成AI Agent时代了，如果你对大模型的时候，还只停留在和大模型对话的时代，那该转换一下思路了。

现在大家对于AI的使用，更多的是在Agent这块，如果你已经用上了Claude Code，或者Codex，那应该能体会到这一转变。

小米MiMo大模型的主要优势，不在于AI推理方面，而在于Agent执行方面，执行任务的成功率还是很高的，这使得很多日常消耗Token很多的资深用户，都对小米MiMo的慷慨和降价，非常开心。

有了量大管饱的Token，日常可以做的事情就更多了。消耗起来也不需要精打细算了，这真的是极好的。

这波新的调价，力度相当之大。最高降幅可达 99%，并且不再区分输入长度；Token Plan 也做了计费体系优化，用量提升到原来的 5 至 8 倍，现有有效期内 Token Plan 用户额度还会全量重置。

之所以小米能够进行如此大幅度的降价，背后的原因可能与以下几方面有关：

一是推理成本降下来了。大模型 API 的价格，本质上取决于单位 Token 的推理成本。

小米官方提到，这次降价背后有推理系统优化：基于 SGLang HiCache 完整支持 SWA，把 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低到优化前的近七分之一，并把可缓存 Token 数量提升到优化前的近五倍，从而提升缓存命中率和推理效率。同时，小米还优化了专家并行方案、输入长度分桶策略，提升集群输入吞吐能力。

说人话，就是通过对缓存体系和集群调度得优化，使得同样的算力可以服务更多 Token，单位成本自然下降，在成本降低后，小米将价格也降下来了。

和DeepSeek V4 Pro对比，MiMo-V2.5-Pro 和 DeepSeek-V4-Pro 的 API 价格几乎打平：缓存命中输入都是 0.025 元/百万 Tokens，未命中输入都是 3 元/百万 Tokens，输出都是 6 元/百万 Tokens；但小米标准版 MiMo-V2.5 更便宜。

二是目前的大模型已经进入到了“能力接近、价格敏感”的阶段。早期模型竞争主要比谁更聪明，谁的 benchmark 更高；但当开源模型、国产模型、闭源 API 的能力差距逐渐缩小之后，开发者会越来越现实：同样完成一个 Agent 任务，谁更稳、谁更便宜、谁更容易接入，谁就更有机会被默认使用。

这也是为什么 Token 价格变得非常关键。对普通聊天场景来说，Token 成本可能只是几分钱、几毛钱的问题；但对 Agent、代码生成、企业流程自动化、长文档分析来说，一个任务消耗几十万甚至上百万 Token 并不夸张。一个模型贵一点，在单次调用上看不明显；一旦进入高频调用、自动化调用、批量处理场景，成本差距就会被指数级放大。

三是小米希望打造AI生态。MiMo-V2.5 系列此前已经走了开源、公测、Token 激励计划、Agent 生态合作等路线。通过让更多开发者使用小米MiMo大模型，形成小米MiMo的口碑。目前来看，小米前期的激励计划，确实给小米带来了很多资深用户。

这次新模型降价后，身边很多申请到小米MiMo的免费Token的朋友，都主动推荐大家使用，说明效果也很不错。

对一个后来进入大模型平台竞争的公司来说，最难的不是发布模型，而是让开发者把它放进真实项目里。

而小米MiMo在大模型方面，做的非常出色，每一步行动都很有效，很到位。小米这么卷，可能会逐渐抢走那些依靠模型性价比高的企业的生态位。

Token 价格正在变成 AI 时代的“电价”。

工业时代，电价决定了很多工业生产是否能规模化；

互联网时代，带宽和云服务器价格决定了很多应用能不能跑起来；

AI 时代，Token 价格决定了智能应用能不能从 Demo 变成日常基础设施。

无论是对于开发者，还是普通人，当你需要AI帮你执行任务时，你就需要Token，当你每天的Token消耗量起来后，你就需要便宜的，性价比高的Token。

而降价后的小米MiMo，是目前非常好的选择，大家如果日常对Token消耗比较大的话，可以考虑充一波小米MiMo，长期使用能够省不少钱^[1]。

以上，邀请码见文末，试用后可获得10块钱体验金，感兴趣的可以试一下，以及该学Codex和Claude Code了~

编辑于 2026-05-27 · 著作权归作者所有

你被哪个后来知道很sb的BUG困扰过一周以上吗？21世纪看番指北 - 计算机大学生的看番个人最佳实践为什么有些人不敢使用微信？如何查找弹窗广告的源头？如何在知乎使用动态头像 win11反应巨慢，对比win10感觉啥都慢半拍，有大佬知道咋解决吗？如何看待内存条价格崩了？为什么光驱的发展停止了?几乎全网视频都能下，颜值还高到离谱，这开源神器真的封神了。如何正确使用知乎？为何windows自带的文件搜索这么慢，而Everything的这么快？如何看待网曝百度网盘 Windows 版兼容模式疑似限制用户电脑 CPU 频率？这是真的吗？如何评价极客湾的全年手机大横评视频被下架？5个极品网站，都很刺激如何评价武亮在直播中说刚上大一不需要买电脑、男生每月生活费不能超过1500，女生要多给，起步2000？zip 解压密码忘记了怎么办？有哪些薅羊毛方法，每天收入10元就可以?OPPO 母亲节海报文案因称「妈妈有两个老公」引发争议，数码品牌营销的创意边界该如何界定？作为个人能合法飞行无人机吗？2026年土耳其区Apple ID注册教程及避坑指南