兩種邏輯的頂峰對決:NVIDIA追求極速,AMD 重倉容量

兩種邏輯的頂峰對決:NVIDIA追求極速,AMD 重倉容量

新電子科技雜誌 1-7

如果只盯著記憶體頻寬這單一數據看,你很容易會誤判這場戰爭的局勢。今日亮相的 NVIDIA Rubin 以 22TB/s 的驚人頻寬看似壓制了 AMD MI455X 的 19.6TB/s,許多分析師急著宣判 NVIDIA 再次勝利。但若我們深入拆解目前 AI 社群的實際應用需求,會發現這並非簡單的勝負對決。這兩款晶片的規格差異,實則揭示了 AI 運算市場正在經歷一場關鍵的「戰略分流」。這是兩家巨頭在 AI 發展的分岔路口上,各自選擇了截然不同的賭注。

[NVIDIA Rubin:為訓練而生的光速跑車]

NVIDIA 的選擇極度清晰,那就是「速度」。Rubin 採用的 8-stack HBM4 搭配 SK Hynix 的特挑高頻寬顆粒,目標只有一個:縮短模型訓練的時間(Time-to-Train)。

在兆級參數模型的訓練叢集中,數萬顆 GPU 需要頻繁交換數據,任何一點頻寬瓶頸都會導致昂貴的算力閒置。這就是為什麼 NVIDIA 寧願犧牲單顆晶片的記憶體容量,也要追求極致的傳輸速率。對於 OpenAI 或 Google 這種急於搶在對手前發布下一代模型的客戶來說,Rubin 就像是一輛頂級賽車。他們不在乎這輛車能載多少行李,他們只在乎能不能以最快速度衝過終點線。在「模型訓練」這個分秒必爭的戰場上,NVIDIA 透過極致的頻寬規格,再次築起了對手難以跨越的高牆。

[AMD MI455X:吞噬模型的推論巨艦]

然而,AMD 面臨的困境是:在純粹的速度與頻寬上,他們難以在短時間內超越擁有供應鏈優先權的 NVIDIA。因此,MI455X 選擇了一條不同的路。它搭載的 12-stack HBM4 設計,雖然在單 pin 速率上不如對手,且必須承擔更複雜的封裝良率風險,但它換來了 NVIDIA 無法比擬的武器:巨大的記憶體容量。

在 AI 推論(Inference)的場景中,也就是 ChatGPT 回答你問題的那一刻,「裝得下」往往比「跑得快」更關鍵。AMD 的策略很務實,利用 12-stack 的海量記憶體,單張 MI455X 足以承載更巨大的模型參數,這意味著企業可以大幅減少伺服器的佈署數量。如果說 Rubin 是追求極速的賽車,那 MI455X 就是一艘巨型貨櫃輪。它或許跑得沒那麼快,但它能以最低的單位成本(TCO),將 AI 服務運送到全世界。這對於微軟、Meta 等需要大規模提供服務的巨頭來說,是極具吸引力的替代方案。

[各有千秋的雙極體系]

我們正在見證 AI 晶片市場的專業分工。過去那種「一款晶片通吃」的時代已經結束。NVIDIA 繼續鞏固其在「模型創造」階段的皇權,為探索智慧邊界的科學家提供最強工具;而 AMD 則利用大容量記憶體的特性,切入了「模型服務」的廣大市場。

AMD 的 12-stack 雖然是為了避開 NVIDIA 鋒芒的不得已之舉,但卻意外在推論市場找到了一個舒服的甜蜜點。這場 Rubin 與 MI455X 的對決,最終證明了市場夠大,大到容得下追求極致速度的賽車手,也容得下追求極致效益的航運大亨。

這兩款晶片的存在,恰恰證明了 AI 產業已經從早期的蠻荒探索,進入了成熟的專業分工時代。

编辑于 2026-05-21 · 著作权归作者所有