有没有感觉DeepSeek V4 Flash 和 Pro 感觉很难用?
实际使用体感,Deepseek V4完成任务速度慢、完成度不高,确实和前沿模型有很大的差距。
我2026年4月有一个项目,是让大模型写脚本,写好提示词,调用大模型生成报告和网页的。原始的脚本是GPT 5.4 mini在Codex里面完成的,完成了网页设计、提示词撰写、报告生成的全流程。
你没看错,是GPT 5.4 mini,都不是5.4本尊,也不是最新又上一个台阶的GPT 5.5。
现在这个报告的格式需要改一改。因为Claude Desktop客户端支持自定义模型提供商,于是就接入了Deepseek V4一用,正好也对我来说是测试一下模型的能力。
首先问题就是速度慢。我已经设计完成了整体流程框架,实际上就是修改一下提示词而已,但Deepseek V4各处打转,18分钟都没完成任务。

等到他整个任务跑了25分钟,烧掉1人民币的API额度之后,我打开就傻眼了。
Deepseek V4改完,是这个样子的。

原版GPT 5.4 mini通过codex设计是这个样子的。我这还不如不改了,完全搞砸了。

好在git做了备份,直接重新退回上一个checkpoint了。
交给Claude Sonnet 4.6,任务丝滑完成,修改不超过6分钟。当然价格肯定是更贵,API计费的话,我统计了一下是6美元。
GPT和Claude写出来的代码,都可以互相接手,不存在所谓的只能用奠基模型。
但问题是Claude订阅套餐我付了20美元月费,这个钱就是包含在里面。订阅套餐里面的额度大致是10倍补贴,所以相当于0.6美元。
把账算清楚。Deepseek V4,花1人民币,用时25分钟把项目搞砸。Claude Sonnet 4.6,挂牌价40人民币,实际上花4人民币,6分钟把项目改好。
今天也算是真切体会到差距有多大了。相比于前沿模型,速度慢、完成度不行,便宜也并非真便宜。