
一张图从69秒飙到14秒
你敢信?同一张AMD显卡,生图速度从100秒变成13秒!只因为我换了个整合包……


如果你也是A卡用户,想在Windows上跑ComfyUI,还被各种报错折磨得想砸电脑——这篇文章就是为你写的。
先别划走,我不是卖课的,也不是推广。只是一个跟你一样踩遍所有坑、差点放弃、最后被一位网上大佬救回来的普通玩家。
💀【绝望篇】我试了所有“据说可行”的方案,全都失败了
前阵子我发过一篇AMD显卡部署ComfyUI的方案。当时我查了大量资料,得出一个结论:A卡在Windows下的最优解,应该是“C+R”——也就是ComfyUI + ROCm。
但现实给了我狠狠一巴掌。
我像个无头苍蝇一样试了无数种组合:
- ❌ WSL2下 ComfyUI + DirectML —— 装上了,慢得离谱,视频直接崩
- ❌ WSL2下 ComfyUI + ROCm——装上了,识别不到显卡,WSL2不识别RNDA2架构
- ❌ Windows下 ComfyUI + ROCm —— 根本装不上,依赖冲突到怀疑人生
- ❌ Windows下 ComfyUI + ZLUDA —— 各种kernel报错,连图都出不来
- ❌ 各种魔改PyTorch、手动编译、改环境变量……全是死胡同
唯一能跑起来的,只有 C+D(ComfyUI + DirectML)。
但那个速度……我真的……生成一张512x512的图,等了100秒。
你没看错,100秒。隔壁N卡玩家都生成几十张了,我还在盯着进度条发呆。
更崩溃的是,我想跑视频工作流(WanVideo、AnimateDiff)。
于是又迎来了一波“报错轰炸”——
📛 报错1:5D张量不支持
`RuntimeError: the dimension of at::Tensor must be 4 or lower, but got 5`
普通KSampler不认识视频,必须换专用节点。
📛 报错2:WanVideo节点找不到
节点列表里搜不到任何`WanVideo`开头的节点。手动装`ComfyUI-WanVideoWrapper`,依赖冲突一堆。
📛 报错3:transformers版本死锁
低版本报错`No module named 'torch.distributed.tensor.device_mesh'`,高版本又缺`Qwen2Tokenizer`。
升也不是,降也不是,死循环。
📛 报错4:显存明明有12GB,只认1GB
DirectML检测错误,强制`--lowvram`也没用。Wan2.1模型一加载就OOM。
📛 报错5:PurgeVRAM V2节点报CUDA not available
节点里硬编码了`torch.cuda.empty_cache()`,A卡没有CUDA,直接红。
📛 还有……
- VAE解码出绿色紫色条纹(A卡独有)
- 显存泄漏,跑一次就得重启
- Git克隆永远443或403
- Manager安全限制、依赖缺失、OpenCV多版本打架……


我真的累了,我想放弃了。
那一周,我每天下班就坐在电脑前,看日志、改代码、重装环境、等编译……
凌晨两三点,屏幕上还是红色的报错。
我甚至认真考虑过:要不把A卡卖了,换N卡算了。
🤨【转折篇】刷网上教程时,偶然发现一个整合包,我是不信的
就在我快要放弃的时候,看到一个视频:
「AMD显卡Windows下部署ROCm整合包,支持RDNA2老显卡」
我当时第一反应:又是标题党吧?
我试过那么多方案,没有一个真正能在Windows下把ROCm跑起来的。
但视频简介里写得很详细,大佬还发了一个6650XT实机安装演示,评论区也有人晒成功截图。
我心里一动:反正都要换卡了,再试一次。
下载、解压、双击运行……
整个过程比我想象的简单太多——不用手动装驱动、不用改注册表、不用编译源码。
启动命令行滚动,我死死盯着屏幕。
---
😭【惊喜篇】127.0.0.1:8188 弹出的那一刻,我差点哭出来
浏览器里,ComfyUI界面正常加载了。
我赶紧去看启动日志,一行一行扫:
```
pytorch version: 2.9.1+rocmsdk20251207
AMD arch: gfx1031
ROCm version: (7, 2)
Device: cuda:0 AMD Radeon RX 6750 GRE 12GB : native```
成了!!!
日志里清清楚楚显示我的显卡——6750GRE(虽然设备显示为 cuda:0,但实际后端是 ROCm,因为 PyTorch 针对 AMD 显卡编译时使用了 ROCm 接口。)。
我深吸一口气,拖了一个最简单的文生图工作流,点下“Queue Prompt”。
23秒,一张图出来了。

比之前DirectML的100秒,快了4倍。
我以为这就到头了,又跑了一次——13秒。
再跑一次,还是13秒。
我终于追上大部队了。
---
🎉【感悟篇】老显卡的春天,真的来了
这一刻我才真正理解:
AMD显卡在Windows下跑ComfyUI,ROCm才是正确的路。
而“机制罗_LX”大佬的整合包,帮我跨过了所有配置门槛。
如果你也是A卡用户(尤其是RDNA2架构的老卡),别再像我一样傻傻地折腾DirectML了。
去关注我,我带你找那个AMD ROCm整合包。
不用双系统、不用WSL、不用放弃Windows。
下载即用,视频工作流也能跑(虽然部分高级节点还有坑,但至少能动了)。
---
📌最后说几句
我不是什么技术大神,只是一个被报错折磨了无数个夜晚的普通玩家。
写这篇文案,一是记录这段“从崩溃到惊喜”的历程,
二是真心希望帮到跟我一样在A卡上死磕ComfyUI的朋友。
如果你也遇到过这些报错,或者用了这个整合包成功了,欢迎评论区留言。
我们一起让A卡玩家不再孤单。
> 点赞 + 转发,让更多A卡兄弟看到。
> 老显卡不认命,我们还能再战三年!

---
ComfyUI AMD显卡 ROCm AI绘画 显卡救星