为什么m4max可以轻松堆128g显存,nvidia消费端显卡却长期被限制在24g?

都是trade-off嘛,每种内存都是平衡容量/带宽的不同的平衡点。这种trade-off是arch的魅力所在,硬说谁吊打谁就有点搞笑了

和GDDR相比,LPDDR做到接近的带宽会需要更大的容量和更高的位宽,比如在6400频率的时候,M1 Max做到400G带宽就意味着保底512bit的位宽和32G的容量,可以看看光控制器就占了多大的面积。而且上到这个规模,布线和封装的成本也不低,为此苹果专门封装了内存并且上了基板以降低成本,而不是部分半吊子说的扯淡的低延迟。而作为对比,同时期的3060的实现360G的带宽只用到了192bit/12G,而且如果老黄想的话,缩回6G也是可以的。对比下来,如果仅仅是从游戏的角度来说,对容量的需求多半会先跪在带宽&核心性能之前,所以GDDR显然更适合这个领域,LPDDR巨大的容量和和控制器都是浪费。这也就是为啥同样是用统一内存,游戏机要用GDDR而不是LPDDR。但是即使是这样,GDDR的高延迟和小容量给SoC还是有水土不服,所以Xbox Series的内存设计是不对称的,而PS5 Pro那边整了一点DDR给系统用

不过如果,恰好有一种负载,需要高带宽的同时,还需要巨大的内存呢,是不是LPDDR就用上了?这不就是LLM推理的需求嘛。尤其是现在模型都在转MoE,更加利好这种小带宽,高容量的模式。具体来说,计算卡的HBM直接被朝着LLM的形状塑造,而复用GDDR的传统图形卡跑推理就比较难受了,想要攒出200G级别的显存需要HDET级别的平台+至少300G这个级别的的内存+8卡,最好还要有PCIe Switch,而换成统一内存的SoC也就两台,用网卡甚至雷电串起来,虽然前者的理论性能和并发吞吐要高很多,但是整体的成本也是非常高的,对于玩票试试水来说投入过大了。目前老黄想出来的最适合图形卡的负载应该是做PD分离的P,所以我们看到了CPX这种东西,但是业界买不买账还另说。友商那边,Azure/AWS/Google主要是求稳压价用,目前都是HBM,没有什么花活;AMD则是搞起了HBM+LPDDR的两层,intel直接做LPDDR的GPU,高通/苹果的方案也是LPDDR。

虽然老黄的GPU没用LPDDR,但是服务器级CPU确实是LPDDR第一人,SOCAMM的设计看起来也兼顾了布线,散热和扩展

而到边缘这里,就更是LPDDR的天下了。AMD做了Strix Halo,256bit做到最大128G,intel早有死掉的大SoC(目前看又要复活),nv有工业场景的jetson(覆盖规模从64bit到256bit,目前最大256bit-128G),c端还准备搞N1/N1X(后者的打包方案就是DGX Spark),高通这边基本上全线LPDDR(无论是手机/pc还是更大的智驾芯片)。所以不是nv消费端被限制在24G,而是打游戏的没钱买更大的……

编辑于 2026-03-04 · 著作权归作者所有
相关文章
intel的大小核和amd的双ccd哪个对游戏影响大?你看好英伟达即将发布的首款笔记本电脑N1X吗?真正懂显卡的人,都选了什么显卡?砺算科技 7g100 国产显卡开启预约,12GB 售 3299 元,其市场竞争力如何?如果黄仁勋愿意,凭借英伟达目前造算力卡的技术,最高可以造出什么水平的游戏显卡?梁文峰称英伟达「技术没有秘密」,从技术角度看该说法合理吗?RTX306012GB 显卡将于 6 月复产、7 月开卖,它在当前市场还有竞争力吗?如何评价50系显卡?联想 ThinkBook14+/16+2026 酷睿版售 8299 元起,你觉得值得购买吗?砺算科技 7g100 国产显卡开启预约,12GB 售 3299 元,其市场竞争力如何?如果黄仁勋愿意,凭借英伟达目前造算力卡的技术,最高可以造出什么水平的游戏显卡?Intel 核显编年史:从Gen 6到Xe3的破茧之路,量变引起的质变8G显卡能跑的模型精选(2026年更新)蓝戟 Intel Arc Pro B70 TF评测:32 GB大显存,推理神卡?NVIDIA RTX PRO™ 5000 Blackwell 深度测评:48GB vs 72GB,AI 推理怎么选?AMD 和 NVIDIA 显卡现在差距还有多大,各自优势在哪里?【2026年1月】1月装机走向与推荐(市场分析部分/总第116期)本地跑AI大模型,显卡显存怎么选?一张表搞定,别再买错了用Mac跑大模型,比5090还划算?固态硬盘坏了不识别?别扔!我用这套全系列开卡量产工具救活了3块SSD,省下好几千