如何评价 AMD Ryzen AI Halo ？

谢邀

如果时395的话，内存带宽是硬伤因为内存是256 位宽的LPDDR5x，对于llm来说那就是太小了。苏妈说Ryzen AI Max+ 395 比RTX 5080快 3 倍，那简直是胡扯了，目测只有3070的速度。

说到395的8060s算是老架构了用的RDNA3.5的架构，我去年双11买的时候还支持的不咋地，pytorch都要自己编译，什么都没有生态巨差。

不过就是今年上半年AMD算是小发力了一下，Pytorch和vllm也算能凑活在ROCM上用了，而395要跑大模型的话还是推荐llama.cpp，直接用valkan就可以，速度跟ROCM一样，现在应该算是可用状态了，我听说可以跑comfyui了，不过我没测试，估计这个速度页跑不了多快。

我这边自己跑了2个模型：

一个q6的Qwen3.6-35B-A3B 和一个q4的Qwen3.5-122B-A10B，因为可以超分显存，所以本来是可以跑Q8的Qwen3.6，但是不稳定所以我就懒得找原因了用q6正好，准度也不错。

那么说速度的话基本上是35B-A3B 不加MTP是30多tokens，加了MTP能上50+。

122B-A10B是每秒22左右，基本上这个水平的模型也能凑活用了，不过27B的dense模型是别想了Q8的话6tokens，Q4的话提高一倍12tokens，基本不能用。

所以这个最合适的就是跑MOE。激活在20B一下的模型理论上速度都可以接受。不过这个128G的显存优点尴尬，235B的模型Q4的话正好装不下，要是稍微长一点的上下文就要用Q3，但是Q3的量化损失太大，所以根本没法用。他要是再加个24G内存那应该是一个非常好的家用产品。

最后要是评价的话就是，目前能用，而且可以跑一些比较大的模型，而且性价比很高（对比 MAC M5和dxg spark），像我这样自己折腾在家跑点简单的服务还是可以的，养龙虾和开发的话不建议，还是有点慢。

我现在开发用DS，写好了harness，一天一个多亿的Token才几块钱，比自己在家折腾强多了。

最后，应该没人用这玩意玩游戏吧

编辑于 2026-06-16 · 著作权归作者所有