如何评价 Surface Laptop Ultra?
Surface Laptop Ultra是微软发布的采用Nvidia RTX Spark方案(也就是ARM架构的N1X处理器)的笔记本,卖点是AI PC——本地大模型部署。
而Nvidia RTX Spark跟Nvidia DGX Spark性能差距非常小,内存够大(最高128GB),但内存带宽还是300GB/s的水平。
本地跑大模型,显存足够的情况下,显存带宽决定了模型推理的速度。
DGX Spark和RTX Spark采用统一内存方案,所以内存带宽就相当于显存带宽,它们的带宽计算如下(同时加入竞品的对比):
- DGX Spark:(256 bit * 8533 Mbps) / 8 = 273 GB/s
- RTX Spark:(256 bit * 9400 Mbps) / 8 = 301 GB/s
- AMD Halo:(256 bit * 8533 Mbps) / 8 = 273 GB/s
- AMD Point:(128 bit * 8000 Mbps) / 8 = 128 GB/s
- Intel Panther Lake:(128 bit * 9600 Mbps) / 8 = 154 GB/s
看到没,RTX Spark只是通过拉高内存频率来提高内存带宽,相比DGX Spark没有实质提升,跟AMD已上市销售一年多的Halo核显本拉不开差距。Intel就不说了,跑大模型真就是路边一条。
今年最火的最适合本地部署的两个开源模型分别是:
- Qwen3.6-35B-A3B:MoE模型
- Qwen3.6-27B:稠密模型
RTX Spark跑Q4_K_M量化版本,预估速度大约是:
- Qwen3.6-35B-A3B:65+ tok/s
- Qwen3.6-27B:15+ tok/s (不开MTP)
Q4量化都只有这种速度了,Q8只会更慢,尤其是稠密模型。
我理想中的速度应该是:
- 跑Q8量化的Qwen3.6-35B-A3B,速度能达到100+ tok/s。
- 跑Q8量化的Qwen3.6-27B,不开MTP,速度能达到20+ tok/s。
还是期待AMD明年发布的下一代Halo核显——Medusa Halo,传闻将引入384-bit LPDDR6内存,带宽能突破500 GB/s。
如果不执着于Q8量化,那现阶段性价比最高的方案也许是外接一张32GB显存的显卡,比如AMD的专业卡R9700(显存带宽640 GB/s,价格1万出头),跑Q4量化,预估速度大约是:
- Qwen3.6-35B-A3B:125+ tok/s
- Qwen3.6-27B:30+ tok/s (不开MTP)
速度相比RTX Spark翻倍,而且由于显存余量足够,上下文同样可以拉得非常大。
编辑于 2026-06-03 · 著作权归作者所有