DDR5内存当显存,性能超过GDDR3了吗?或者DDR6有可能超过GDDR5吗?
理论带宽用位宽*等效频率就可以了,GDDR5等效最高才到8G,打不过LPDDR5X的9.6,比还在6.4的DDR5略高一点。果硅在崛起于LPDDR5时期也算是顺势而为,这个时候同位宽的LPDDR5已经不输GDDR5了,算是到了能用的阶段。所以这个阶段开始出现了很多统一内存的大型SoC,MSDT平台的SoC的iGPU性能也逐渐进入可用的程度
至于现在用的GDDR6是从14-20G,GDDR6X可以到24。在通常意义上的旗舰卡的384bit位宽下就是1T多带宽,预计年中的M Ultra靠1024bit-9600-LPDDR6X能超过去
但是GDDR7有30G+,5090的512bit GDDR7以32G的容量轻松做到接近2T带宽。只有LPDDR6靠把每通道的位宽提高50%才能尝试比一比。预计这个时节点大型SoC和dGPU的距离会进一步拉近,但是大家应该已经发现了,除非你能找到一个对显存容量要求很大的场景,不然用LPDDR,是不如用GDDR划算的。所以游戏卡一版用GDDR。
但是存不存在这样一个场景呢?当然,端侧推理,尤其是MoE模型的推理就很贴合这个需求,所以苹果这一波躺着爽吃LLM的红利。intel也搞出了用LPDDR的显卡,AMD也在MI450上放了12通道的LPDDR。至于NV,Grace和Vera上早就用了LPDDR,开创了LPDDR上服务器的先河。
同理,想用DDR做显存,只要你位宽堆的够高也行,常规的8通道(512bit),12通道(768bit)的服务器成本高一个很大的原因就是巨量的DIMM布线和控制器的非常高的实现成本
实际上超大规模的果硅很早就遇到了同样的问题,苹果为了方便布线,把内存重新封装,然后拉到了基板上,极大的降低成本,代价就是相比于传统的板仔方案还可以把内存颗粒吹下来换更大的,基板上的对于电焊师傅来说几乎不具备可更换性
然后进一步的,你还可以用高级封装把他们叠在一起,然后再和GPU连起来——
哎,然后你就再次发明了HBM
不明白为啥知乎天天删我评论,在这里回一下评论区某些眼睛不好不看题的
还“有没有可能GDDR5是和DDR3是一个时代的东西……”,学会写反问句了觉得自己很酷是吧。为啥我比较(LP)DDR5和GDDR5,要不看看题主问的什么呢? 你高考答题也是不看题目的是吧?这么懂自己提一个问题呗,键盘在自己手上,给题主好好科普下内存发展阶段
甚至我还很贴心的横向对比了下LPD5同时期的GD6/GD6X/GD7和下一代的LPD6,各自的优略和场景都给了。arch这边各种trad-off是基本常识,怎么讨论个技术问题有个人脑子整天不是赢麻就是输到底的,都是笔电男大是吧?阅读能力不行的半吊子晃怪我了?