如何评价 Surface Laptop Ultra?

Surface Laptop Ultra是微软发布的采用Nvidia RTX Spark方案(也就是ARM架构的N1X处理器)的笔记本,卖点是AI PC——本地大模型部署。

而Nvidia RTX Spark跟Nvidia DGX Spark性能差距非常小,内存够大(最高128GB),但内存带宽还是300GB/s的水平。

本地跑大模型,显存足够的情况下,显存带宽决定了模型推理的速度。

DGX Spark和RTX Spark采用统一内存方案,所以内存带宽就相当于显存带宽,它们的带宽计算如下(同时加入竞品的对比):

  • DGX Spark:(256 bit * 8533 Mbps) / 8 = 273 GB/s
  • RTX Spark:(256 bit * 9400 Mbps) / 8 = 301 GB/s
  • AMD Halo:(256 bit * 8533 Mbps) / 8 = 273 GB/s
  • AMD Point:(128 bit * 8000 Mbps) / 8 = 128 GB/s
  • Intel Panther Lake:(128 bit * 9600 Mbps) / 8 = 154 GB/s

看到没,RTX Spark只是通过拉高内存频率来提高内存带宽,相比DGX Spark没有实质提升,跟AMD已上市销售一年多的Halo核显本拉不开差距。Intel就不说了,跑大模型真就是路边一条。

今年最火的最适合本地部署的两个开源模型分别是:

  • Qwen3.6-35B-A3B:MoE模型
  • Qwen3.6-27B:稠密模型

RTX Spark跑Q4_K_M量化版本,预估速度大约是:

  • Qwen3.6-35B-A3B:65+ tok/s
  • Qwen3.6-27B:15+ tok/s (不开MTP)

Q4量化都只有这种速度了,Q8只会更慢,尤其是稠密模型。

我理想中的速度应该是:

  • 跑Q8量化的Qwen3.6-35B-A3B,速度能达到100+ tok/s。
  • 跑Q8量化的Qwen3.6-27B,不开MTP,速度能达到20+ tok/s。

还是期待AMD明年发布的下一代Halo核显——Medusa Halo,传闻将引入384-bit LPDDR6内存,带宽能突破500 GB/s。

如果不执着于Q8量化,那现阶段性价比最高的方案也许是外接一张32GB显存的显卡,比如AMD的专业卡R9700(显存带宽640 GB/s,价格1万出头),跑Q4量化,预估速度大约是:

  • Qwen3.6-35B-A3B:125+ tok/s
  • Qwen3.6-27B:30+ tok/s (不开MTP)

速度相比RTX Spark翻倍,而且由于显存余量足够,上下文同样可以拉得非常大。

编辑于 2026-06-03 · 著作权归作者所有
相关文章
为什么微软没有Windows9?为什么微软要对Office 2019实施编辑禁令?当年卖16999的微软旗舰!如今600块到手,光拆零件都回本了在不停止Windows更新的情况下,为什么微软不出一个更现代的Windows-lite?请问文科大学生该选macbook还是windows?微软下一代 Xbox 被曝取消附赠手柄以降低成本,此举会影响你的购买意愿吗?微软高管承诺将改善 Windows 系统可靠性以重建用户信任,你认为微软将如何实现此目标?请问文科大学生该选macbook还是windows?微软官方的MediaCreationTool有什么不好,导致大家都不用?大甩卖!正版Win11仅售70元,微软是疯了?还是另有所图你认为微软 Surface 系列产品的优势和劣势在哪?如何评价微软前CTO发长文指出Windows的混乱局面,「14年14次转变,17种GUI共存」?微软高管承诺将改善 Windows 系统可靠性以重建用户信任,你认为微软将如何实现此目标?微软删除 Win11 游戏内存推荐文章,32GB 建议引发争议,如何评价这一建议?消息称微软携手英伟达公布 N1/N1X 版 Surface 笔记本,这对 AIPC 发展意味着什么?你为什么喜欢使用Mac电脑,有没有什么你特别喜欢的优点?WindowsPhone8 的市场失利,给微软留下了哪些深刻教训?微软edge浏览器为什么逐渐被其他的浏览器代替?微软 WinXP 壁纸「Bliss」拍摄地 30 年后重现,为何能引发一代人的集体回忆?微软必应 Rewards 2026 全新改版:积分获取规则大改,积分严重缩水!