如何看待内存条价格崩了?
Google 提出了一种新的 KV Cache 压缩方法(类似 TurboQuant 这一类思路),能把大模型推理中最占内存的部分压缩到原来的几分之一(大约 6 倍量级),而且基本不影响效果。

这件事之所以影响内存厂,是因为它动摇了原本的逻辑:以前是 模型越强、对话越长 → 越吃高端内存 → 内存厂持续受益。
但现在变成:同样的模型和对话,可以用更少的内存跑起来。
所以就是从“原样存储”,变成“压缩存储+还原”,信息没少,占用更低。
于是市场开始担心:如果单位内存需求下降,未来增长是不是要打折?这就是短期预期转弱的原因。
但反过来看,也就是长期来看,内存占用下降也意味着成本更低、应用更容易普及,甚至可能带来整体使用量的爆发。
所以这一轮波动不是行业变差,而是技术进步,让市场开始重新评估内存的真实需求。
编辑于 2026-04-01 · 著作权归作者所有