如何评价 Deepseek V4 因为缺少昇腾芯片而不得不抬高价格?
2026年4月24日,Deepseek V4终于发布,以1.6万亿的参数量成为参数量最大的开源模型,而闭源模型基本都不公布参数量,所以V4也是已知参数量最大的模型。
采用MoE混合专家架构,每次推理实际激活参数490亿 。
标配 100 万token上下文窗口,能够处理极长的文本输入,这也是目前主流大模型标配。
官方评测显示,其使用体验优于Sonnet4.5,交付质量接近Opus 4.6非思考模式,比思考模式还有点差距。
在数学、STEM、竞赛级代码及世界知识测评中,大幅领先其他开源模型,跟Opus4.6、GPT5.4、Gemini Pro3.1这三个排名前三的闭源模型不相上下。
最关键的是,不但开源,而且价格仅为闭源模型的十分之一到三分之一,纯纯白菜价。
当然,Deepseek已经不是第一次干这种掀桌子的事了,大家也都见怪不怪,但这次有一个更震撼的消息,那就是V4版本从训练到推理已经完全适配了国产AI算力集群。
对于万亿以上主流大模型而言,这还是第一次。
虽然适配国产取得了重大突破,但其实也并不是大家想的那样,完全替换了英伟达。
毕竟当年花了那么多钱,各种规避风险囤的卡,不可能说扔就扔了。
而且有一说一,目前世界上最强的AI芯片还是英伟达的B300,华为目前已经投产的昇腾910C,论单芯片性能估计也就将将排进全球前十。
不过确实比H20强多了,FP16精度下稠密峰值算力能达到800TFLOPS,算力是它的两倍多,要不怎么这个阉割版在中国卖不出去呢。
但比完全体H200将近2000TFLOPS的算力还是差不少,更不用说B200的2000多TFLOPS和B300的3000多TFLOPS。
这里我们统一采用FP16精度下稠密峰值算力进行比较,因为模型训练目前大多采用FP16精度,可以达到效果与效率的平衡。
不考虑稀疏计算这种算法上的优化,只看稠密计算这个完全依靠硬件性能的算力。
而除了算力之外,衡量AI芯片性能的主要参数还包括了内存大小、内存带宽、能效比、软件生态和互联扩展。
算力代表芯片执行浮点运算的峰值速度,决定了训练和推理的绝对算力上限。
内存大小决定了能够加载大模型的参数量,目前大模型通常以FP16精度进行训练,一个参数大概占用两字节,万亿参数大模型就需要2T内存。
但考虑到计算过程占据的内存才是大头,所以万亿参数需要的内存大概在40T。
人类大脑大概有800多亿神经元,每个神经元有1000到10000个突触,如果想要实现人类智能,最好每个突触都对应一个参数,那么总参数量是80到800万亿,需要的内存是3200T到32000T。
内存带宽决定了芯片能否持续喂饱其计算单元,是避免内存墙瓶颈的关键。
能效比,每瓦特提供的算力,直接影响大规模部署的运营成本与散热挑战。
软件生态的成熟度,如CUDA对英伟达的意义,则决定了芯片能否被开发者高效利用,将硬件参数转化为实际生产力。
互联扩展性决定了多计算卡协同工作的效率,是构建万卡集群的基础。
一个坏消息是,中国AI芯片在算力、内存大小、内存带宽、能效比和软件生态方面全面不如美国,或者简单点说,华为代表了中国算力最高水平,这些都不如美国代表英伟达。
但好消息是,华为发明了灵衢,用光通信替代了电通信,打破了铜导线中信号随着距离增加而快速衰减的问题。
而且可以实现集群内所有CPU、GPU和内存之间的两两直接互通,避免了英伟达那种传统方式,GPU非要经过CPU才能访问内存,大大提升了内部效率。
结果就是,华为910C的单芯片性能虽然只有人家的五分之一,却能通过灵衢堆数量而性能衰减极少。
于是有了华为Atlas系列超节点,目前投产的Atlas 900 A3,最大支持384张昇腾910计算卡,算力直接达到300PFLOPS,基本追平了英伟达GB300 NVL 72。
而即将在下半年推出的Atlas 950超节点更是变态,支持8192张昇腾950DT计算卡,算力达到恐怖的4000PFLOPS,内存容量超过1000T。
如果把950超节点再通过灵衢组合,就得到Atlas 950超级集群,超过50万张卡,算力超过500EFLOPS,内存将近50P,E=1000P,P=1000T,T=万亿。
这将是人类有史以来最强算力集群,已经可以满足32000T参数训练需求,届时大模型将有希望涌现出人类智慧。
很多人对中国AI芯片的概念还停留在被卡脖子阶段,可以说对中国算力一无所知。
卡脖子归卡脖子,但像华为这样做到弯道超车的领域也不少,而且目前卡脖子也只集中在EUV光刻机一个领域。
好消息是,制程已经被物理极限锁死在了2纳米左右,相当于所有对手都只能原地踏步等我们追赶。
而一旦突破EUV,华为将拥有英伟达相同的单芯片算力和内存带宽,再加上灵衢的互联,届时算力克苏鲁就会诞生。
当然,评价一个国家的AI芯片实力,不光要看顶级算力集群,更要看统计指标,大概看以下8个指标就够了。
一是制程工艺。
简单说,制程工艺就是芯片上晶体管的个头大小,单位是纳米,数值越小,晶体管越密集,芯片的算力越强、功耗越低。
目前全球主流已从FinFET架构迈向GAA架构,2nm是当前最顶尖的量产节点,直接决定一个国家能不能自主生产高端AI芯片、高端手机SoC,是芯片产业的硬门槛。
2026年全球制程工艺排名,中国台湾的台积电主导,2纳米量产,排第一。
韩国的三星和海力士,同样2纳米量产,但整体不如台积电,排第二。
美国的英特尔和AMD等,3纳米量产,排第三。
中国中芯国际主导,因为缺少EUV光刻机,只能用DUV光刻机实现7纳米等效N+2工艺量产,也就是3次曝光,第四。
其他国家基本可以忽略。
二是晶体管密度。
单位面积芯片上的晶体管数量,和制程工艺直接相关,但不完全等同。
同样是7nm或3nm制程,晶体管密度越高,芯片的集成度和性能上限就越高,是衡量一个国家芯片制造精度的隐形标准,对AI芯片来说尤其关键。
2026年全球晶体管密度排名,中国台湾每毫米超300个,第一。
韩国超过280个,第二。
美国超过200个,第三。
中国只有100多个,第四。
三是芯片良率。
良率就是一批芯片中合格产品的比例,直接决定芯片的生产成本和量产能力。
哪怕制程再先进,良率上不去,也只能停留在实验室,无法规模化应用。
尤其是28nm及以上成熟制程,良率就是核心竞争力,直接决定一个国家在全球芯片量产市场的话语权。
2026年全球芯片良率排名,中国台湾98%,第一。
韩国97%,第二。
美国96%,第三。
中国95%,第四。
后面几个国家虽然做不出AI芯片,但生产其他成熟制程芯片。
日本94%,第五。
德国93%,第六。
新加坡91%,第七。
以色列90%,第八。
法国89%,第九。
荷兰88%,第十。
四是封装技术。
封装是芯片的外衣,负责保护芯片、连接芯片与电路板。
先进封装,比如Chiplet、3D堆叠等,能让不同制程、不同功能的芯片模块拼接在一起,实现等效先进制程的性能。
这也是中国在先进制程受限下,能实现性能突围的核心路径,更是全球芯片产业的核心竞争点之一。
根据韩国科技评估与规划研究院2025年发布的报告,中韩两国在半导体先进封装技术领域的基础能力已持平。
2026年全球先进封装技术排名,中国台湾第一,韩国和中国并列第二。美国第四,日本第五,新加坡第六,德国第七,以色列第八,法国第九,荷兰第十。
五是半导体IP与EDA工具。
半导体IP是芯片设计的预制模块,如CPU、NPU、接口等可复用模块,EDA工具是芯片设计的软件画笔。
没有这两者,芯片设计就无从谈起,直接决定一个国家芯片设计的效率和上限,也是我国长期被卡脖子的关键领域。
据WSTS世界半导体贸易统计协会2026年2月最新数据测算,2026年全球EDA市场规模将达到183亿美元,这么小的EDA市场却撬动着5000亿美元的半导体产业。
目前全球高端EDA市场仍被国际三巨头垄断。
2026年全球半导体IP与EDA工具排名,美国市场份额合计48%第一;英国17%第二,中国8%第三,日本7%第四,德国5%第五,以色列4%第六,法国3%第七,荷兰2%第八,韩国2%第九,加拿大1%第十。
六是芯片制造设备自主化率。
芯片制造设备是芯片生产的重器,自主化率直接决定一个国家芯片产业能否摆脱对外依赖,避免被卡脖子。
核心设备包括光刻机、刻蚀机、薄膜沉积设备等,自主化率越高,产业安全性越强,也是衡量国家芯片实力的重要隐性指标。
2026年全球芯片制造设备自主化率排名,美国82%第一,日本78%第二,荷兰75%第三,中国台湾68%第四,韩国65%第五,中国42%第六,德国38%第七,以色列32%第八,法国29%第九,新加坡25%第十。
中国因为被卡脖子缺少EUV光刻机,因此高端支撑相应设备都没有发展,所以整体国产化率偏低。
一旦解决EUV光刻机,我们的自主化率将快速提升到90%以上。
七是芯片产能规模。
产能规模直接决定一个国家在全球芯片供给中的地位,涵盖成熟制程与先进制程产能,产能越大,越能满足全球市场需求,掌握市场定价权和话语权,也是芯片产业规模化发展的核心体现。
2026年全球芯片产能规模排名。
中国152万片,第一。
中国台湾108万片,第二。
韩国96万片,第三。
美国62万片,第四。
日本38万片,第五。
德国29万片,第六。
新加坡25万片,第七。
以色列18万片,第八。
法国15万片,第九。
荷兰12万片,第十。
最后是芯片行业总产值。
2026年全球芯片行业总产值前十。
美国3200亿美元,第一。
中国2850亿美元,第二。
韩国2200亿美元,第三。
中国台湾1980亿美元,第四。
日本890亿美元,第五。
德国520亿美元,第六。
新加坡480亿美元,第七。
以色列350亿美元,第八。
法国290亿美元,第九。
荷兰260亿美元,第十。
综合来看,中国现在的芯片实力处于爆发前夕,万事已俱备,只欠EUV,但正是因为这个短板,整体实力要排在美国、韩国、台湾省之后,而一旦补齐则会直接跃居第一。
可即便是现在,你也不能说中国芯片有多弱。
28nm及以上成熟制程芯片,全球产能第一,良率稳定在95%以上,覆盖汽车、工业、物联网等80%以上的刚需场景。
2026年全球新增成熟制程产能约70%在中国,我们正逐步掌握成熟制程芯片的定价权,也是中国芯片出口的核心主力。
韩国专家调研显示,中国在功率半导体、新一代高性能传感技术等领域的水平,均已超过韩国。
存储芯片的长江存储、长鑫存储在NAND、DRAM领域实现关键突破,良率顺利跨过行业门槛,产能稳步爬坡。
2026年全球存储芯片价格上涨周期中,我们精准补上传统消费级存储市场的供给缺口,产品大量出口,成功打破了三星、SK海力士、美光的三巨头垄断。
韩国专家也承认,中国在高集成度、低阻抗存储芯片技术领域的水平,已超过韩国。
车规级功率芯片良率超98%,完美适配新能源汽车的高温、高可靠性需求,已配套比亚迪、蔚来、理想等国产车企,部分产品还出口欧洲,直接替代英飞凌、安森美的同类产品。
这也是中国芯片国产替代最成功的领域之一。
在AI服务器的配套芯片领域,如电源管理、接口、存储控制、传感器等,中国芯片的良率和性能已经追平国际一线,价格还更具优势。
全球AI大爆发背景下,国产AI配套芯片成为全球AI算力基础设施的隐形底座。
哪怕是英伟达、AMD的高端GPU服务器,也离不开中国的配套芯片支撑。
韩国专家调研显示,中国在高性能、低功耗人工智能芯片领域的水平高于韩国,具备明显优势。
现在真正能卡中国脖子的其实也就剩下了光刻机。
上海微电子的28纳米浸没式DUV光刻机已于2025年启动批量交付,目前处于产线验证与产能爬坡阶段。
2026年预计出货量不到50台,正陆续进入中芯国际、华虹等产线。
产线良率已突破90%,国产化率超85%,核心指标对标ASML同类机型。
但在超精密物镜的面型精度、像差控制上,与德国蔡司仍有代际差距,这限制了设备长期运行的稳定性。
整体来说,DUV光刻机已经解决了从无到有的问题,现在是从有到优的阶段。
哈工大2025年初宣布放电等离子体极紫外光源进入成果转化阶段,之后中科院上海光机所实现了激光等离子体光源能量转换效率的实验室突破,接近商用门槛。
2025年底,国内实验室传出首台EUV原型机成功激发13.5nm极紫外光,但仅停留在光源验证,尚未实现完整光刻功能。
目前官方确实没发布过EUV整机量产路线图,但业内预测2030年有望实现商用。
试想一下,以国内的封装技术,再加上华为的光通信,一旦解决了EUV,算力和显存带宽直接翻5倍,到时候的集群算力将是多么恐怖的存在,称之为算力克苏鲁恐怕并不为过吧。
参考数据来源
中国海关总署:2026年1-2月中国集成电路进出口数据
WSTS(世界半导体贸易统计协会):2026年2月全球半导体市场数据及2026年全球半导体市场规模预测
半导体产业纵横:2026年4月中国车企造芯格局报告
中国经济网:2025年2月韩国科技评估与规划研究院半导体技术水平分析报告
新华网:2025年4月全球EDA市场及国产EDA产业发展报告
华为官方:2026年昇腾芯片技术白皮书、2026年Atlas 950超节点发布公告
韩国对外经济政策研究院:2025年全球半导体产业发展调研报告
英伟达官方:2026年4月芯片及超节点参数公告
中国半导体行业协会:2026年中国芯片产业发展报告。