如何看待英伟达 CEO 黄仁勋在2026 CES上的演讲,有哪些信息值得关注?
我只关心CES大会对我们普通人AI和游戏党的影响,我得出的结论是:显卡会供大于求,很多老旧显卡将会被淘汰,我们普通人会以低价拿到更多老款显卡型号。这一切都是源于:
Rubin的横空出世。
Rubin与H200对华解禁
Rubin架构下AI算力与能耗,效率方面,保守估计是H200的10倍!
算力方面,Rubin的推理能力是Blackwell的5倍,训练性能是其3.5倍。
能耗成本方面,推理成本单位算力降低10倍,训练成本降低4倍。
假设在推理场景下,一张H200的性能是1000 TFLOPS,功耗700瓦。那么一张rubin卡的性能是5000 TFLOPS,功耗70x5=350瓦。那么,都用700瓦的电力情况下,可供2张rubin卡计算,十倍的差距。
尤其是能耗上,举个简单例子,比如tesla t4性能与TITAN X性能差不多,差一代架构
t4是一张无需额外供电的低功耗计算卡,满载功耗也就70w以内,而titan x需要220w以内,对于计算中心来说,24小时x365天的电费差距是150w一年,企业电费大约每年为此要多付出1200元甚至更高,即Tesla t4一张卡一年要比titan x多付出1000多块钱电费,1000张卡就是100万以上额外电费,以此类推。

H200真实功耗大约700W,那么同算力,干同一个任务,rubin卡等价于70W,单卡能耗差了600瓦,成本就高出600瓦电费,单卡每年耗费5256度电,按工业用电1元/度来算,大约单卡每年多耗费5000元,数据中心如果有1万块H200,每年光能耗要多耗费5000万。这还不算整机维护、机房维护等其它支出,实际差距感觉还会更大。
因此H200对华解禁,中国可以拥有大规模的H200显卡了,但你的效率只有美国rubin架构下的1/10。如果中美数据中心最大规模上限是固定的,那么美国建立一个AI数据中心,就相当于中国的10个,你要达到同等规模,就不得不在基建上额外投资10倍,事实上不止10倍,因为后期维护等长期成本上,冷却系统、高速网络互联的扩展性的成本,等等,隐性成本低太多了,感觉不止10倍。尤其是在横向扩展方面,人家建一个数据中心可能半年,而你因为没有这种技术不得不做大量规划,然后小心翼翼建成,每扩展一次都要额外花销,最终时间成本、电力成本、维护成本都将被远远甩开。
长期来看,算力中心一定会优先选Rubin,H200等老显卡大量转移到中国,给中国的高校或者大厂,然后会发生什么?老旧显卡,包括那些3090/4090/5090的卡大厂是看不上的,然后就是大量20系及以前的老显卡会被淘汰!10系显卡更是路边
在AI应用蓬勃发展下,2080ti都不太能胜任了,尤其是视频语义应用下起步需要30系3080以上的显卡。也就是说,哪怕是30系卡可能也撑不了多久了,先是10系显卡崩盘,其次是20系显卡,然后是30系显卡。
所以一个显而易见的结论就是:消费级显卡什么5090/4090/3090是一个下跌趋势不可逆,像3080及以上的卡逐步萎缩,而3070以下的卡基本脱钩。这对于游戏党是一大利好,民用领域终于可以不用再受AI、矿潮的影响了。目前在1K分辨率下30HX矿卡对标1660通吃大多数游戏,160元价格无敌。2K分辨率下40HX矿卡对标2060super通吃大多数游戏,300元价格无敌。下面就看30系显卡有没有能冲到500元以内的神卡了。