目前性能最强大的核显相当于哪个独显?

现在是 2026 年 6 月 30 日。

GB20B(GB10B) 是目前最强的“核显”。

它的浮点性能相当于独显里的 RTX 5070,实测稀疏化 FP4 浮点性能是 1000+ TFLOPS,采用台积电 5nm 节点里的 4N 制程,基于 NVIDIA RTX Blackwell 微架构,计算能力为 CC 12.1,和 Grace CPU 之间用 600GB/s 的 NVLink 连接,SoC 内存带宽达到 300GB/s。

拥有第四代光线追踪内核,第五代张量内核,这两个东西完爆所有非 NVIDIA 系的“核显”。

支持 AV1 硬件编解码、HEVC 4:2:2 硬件编解码。

无论是渲染性能还是 AI 运算、多媒体编辑,在目前的核显中无出其右。

例如 AI 计算,跑 Diffusion 的话,没有任何核显能与之匹敌,跑 LLM 的话,内存带宽不如苹果顶配,但是现在有 DiffusionGemma、DSpark、MTP 等各种越来越多依赖算力的 LLM 加速方案,GB20B 这样的方案跑 LLM 也不遑多让,而且因为支持 CUDA,很多 AI 方案出来基本上能做到 day0 部署,例如 DSpark 基本上当天就能看到双 DGX Spark 用 DSpark 跑 Deepseek V4 Flash,生成速度达到每秒 65 Toks。

至于像 Qwen 3.6 27B 这样的稠密模型,使用 NVFP4 效果显著,能做到单 DGX Spark 单用户每秒 26.3 的生成速度(四用户能达到 92 Toks/s),这应该是理论值的 1.3 倍了:

至于 DiffusionGemma,GB10B 面对所有核显就好像欺负小孩一样,US 里随随便便都每秒 800~1000 Toks/。

编辑于 2026-07-01 · 著作权归作者所有
相关文章
如果黄仁勋愿意,凭借英伟达目前造算力卡的技术,最高可以造出什么水平的游戏显卡?一图看懂 CPU、GPU、内存和显存的关系英特尔第三代 Ultra 核显性能堪比 RTX3060,将对笔记本市场带来哪些影响?如果黄仁勋愿意,凭借英伟达目前造算力卡的技术,最高可以造出什么水平的游戏显卡?NVIDIA RTX PRO™ 5000 Blackwell 深度测评:48GB vs 72GB,AI 推理怎么选?【装机帮扶站】第1294-1295期:低预算PC用户福音?支持DDR3内存的配置如何组?英特尔第三代 Ultra 核显性能堪比 RTX3060,将对笔记本市场带来哪些影响?严重虚假宣传:“i9级处理器”已入侵低端笔记本市场麒麟芯片差距是变大了吗?Intel 核显编年史:从Gen 6到Xe3的破茧之路,量变引起的质变被英伟达的价格逼上梁山!用350元的国产芯跑YOLO,效果让我惊了用Mac跑大模型,比5090还划算?明明可以做小 非得把显卡做那么大是为何?蓝戟 Intel Arc Pro B70 TF评测:32 GB大显存,推理神卡?聊聊NVidia的六件套【2026年4月】Gemma 4 显存配置完整指南:E4B、26B、31B 到底需要多少显存?英特尔第三代 Ultra 核显性能堪比 RTX3060,将对笔记本市场带来哪些影响?本地跑AI大模型,显卡显存怎么选?一张表搞定,别再买错了26年2月,什么显卡值得买?(含天梯图)英特尔酷睿Ultra 7 270K Plus/Ultra 5 250K Plus首发评测:一年蛰伏终翻身,游戏与生产力双双进化