如何评价小米mimo-V2.5 系列模型5月27日大降价?

这个降价幅度极其令人震惊,把API缓存命中降到百分之一价格过于离谱,在降价打折史上恐怕都得记上一笔。

看起来,小米可能把 deepseek v4 公开技术文档中的缓存技术用上了。不然很难解释近百倍的降价幅度。毕竟那个技术中的一个要点是用 ssd 当显存用,极大幅度缓解了1M上下文的显存开销。

如果不是有技术突破,这事儿哪怕雷军也很难说服罗福莉拍板。幸运的是相关技术已经在deepseek文档中公开公布了。

无它,希望其它产商都能跟进。因为雷军不太可能赔本赚吆喝,这次我了解到的情况是目前的价格依然有得赚,所以可以推测出小米必定已经采用了deepseek v4论文中的技术。

(补充:已测试,当前mimo api调用响应速度相比之前确实有明显下降,下降到跟deepseek类似的速度,看来,用这个缓存技术虽然可以降成本,但api响应速度下降也是客观存在的。进一步证明了小米确实使用了与deepseek类似的缓存技术。)

毕竟小米有token plan,这下子是真的比deepseek还便宜一丢丢。真心佩服小米团队的研发速度。

可能有的人觉得,小米能做这个没什么了不起,这么说吧,了不起的不是能做,而是敢做。GLM,KIMI,qwen,doubao等模型能不能做这个,理论上也能做,但他们敢不敢降价呢?有没有可能其它大模型也偷偷做了这个缓存优化,但就是不肯降价呢。而小米做了就敢降价,这就是小米不同的地方了。

小米跟deepseek同价,同样是1M上下文,并且有多模态

这个新闻基本相当于是:deepseek提前发布了4.1。大家能理解吗?


ocg的定价

目前 opencode go 的 mimo 定价也已经跟 deepseek 看齐了,可以随便站起来蹬了。

编辑于 2026-05-28 · 著作权归作者所有