
英特尔至强600与锐炫Pro B70双发,CPU性能最高提升400%,16卡组512GB显存
对于专业AI创作工作者而言,消费端处理器搭配普通显卡注定不够看,更猛的创意工作站无疑是最理想的选择。在这个时间点,英特尔正式发布了至强600工作站处理器,以及目前为止旗下最强的专业独显锐炫Pro B70,组成性能相当亮眼的非常6+7,也是近段时间少有的让人兴奋的硬件新品。


至强600:86核172线程,128条PCIe 5.0!
至强Xeon 600系列工作站处理器是英特尔新一代单路极致性能平台的最终体现,处理器代号Granite Rapids-WS,旨在代替此前的至强W-2400和W-3400系列,如果说普通桌面级CPU是满足日常通勤的轿车,那至强600就是为征服恶劣环境而生的重型装甲越野车。它不再单纯追求某一维度的极限,而是要在核心数、I/O吞吐、AI加速以及企业级稳定性之间,寻找一个理想的平衡点。

全新的至强600系列旗舰型号为Intel Xeon 698X(至强698X),基于Intel 3制程工艺打造,计算核心仅使用86个Redwood Cove作为P-Core,没有E-Core,纯性能核,支持超线程,回归到了令人热血沸腾的大力飞砖节奏。

至强698X拥有86核172线程,最高睿频4.8GHz,支持Turbo Boost Max 3.0,每个核心内置Intel AMX AI加速引擎,原生支持FP16。同时处理器还支持8通道DDR5-6400,支持MRDIMM-8000,最高可以支持4TB内存容量。更夸张的是,处理器还拥有128条PCIe 5.0通道,支持最新的CXL 2.0技术。

特别是AMX-FP16在Blender的应用场景中,性能相对上一代提升400%,也就是整整5倍的性能,离谱。

CXL 2.0技术源自于服务器,可支持Type 1缓存设备,Type 2加速器设备和Type 3内存设备扩展,并且做到了架构层面的解绑与池化,包括支持交换机Switching,以及内存池化Pooling。

在发布会现场,英特尔对这款处理器进行了详细解析。虽然处理器高端86核172线程,得益于Intel 3制程工艺和架构优化,它在保持350W基础功耗不变的情况下,多线程性能比上一代64核的至强W-3595X暴增了61%,单线程性能也有9%的提升。无论是代码编译、科学计算还是视频渲染,这都将带来肉眼可见的效率质变。

同时至强600全系对专业应用和AI领域下足了功夫。它在Intel AMX高级矩阵扩展中加入了FP16数据类型的原生支持,这让它在处理AI训练和推理任务时更加得心应手,AI/ML整体性能提升了17%。同时处理器还保留了完整的 AVX-512 指令集,对于依赖高精度浮点运算的工程模拟和三维建模软件来说,依然可以保持高效运行。
工作站处理器更需要海量的外围设备带宽作为支持。至强600让内存带宽直接翻倍,不仅支持了更快的DDR5-6400内存,部分型号还能支持全新的MRDIMM,即多路复用寄存器DIMM内存,速度飙升至8000 MT/s,最大容量可达4TB,喂饱那些极度吃内存带宽的密集型任务。

更厉害的是,至强600直接给足了128条PCIe 5.0通道,可以毫无顾忌的插满数张顶级显卡,比如NVIDIA RTX Pro 6000系列,或者今天同时发布的锐炫Pro B70。在现场的DEMO展示中,OEM厂商表示最多可以扩展出16张锐炫Pro B70显卡,单张显卡32GB显存,16张锐炫Pro B70即拥有512GB显存,配合4TB DDR5-8000内存,即使在家里也不用担心有跑不动的大模型了。
作为至强家族成员,至强600全系还支持ECC纠错内存和RAS(可靠性、可用性、可维护性)技术,最大程度避免因内存位翻转导致的系统崩溃和数据损坏。搭配英特尔vPro,它还支持多密钥内存加密和一键恢复功能,让工作站无论是在办公室还是在边缘计算节点,都能被IT部门轻松纳管。

甚至,至强600还支持超频。现场给出的理由是量化交易的券商很喜欢超频的处理器。对于笔者而言,超频玩家狂喜。

与至强600搭配的W890芯片组,包括了对Wi-Fi 7和Wi-Fi 6E的支持,以及2.5GbE网口,USB 3.2 20Gbps,SATA 3.0和PCIe 4.0扩展,芯片组通过x8 Gen4 DMI通道与CPU连接。128条PCIe 5.0可以全留给GPU和SSD扩展,带劲。


英特尔至强600系列注定是一块为解决复杂计算问题的性能怪兽,它将服务器级别的核心密度、内存吞吐和I/O扩展性,融合进了单路工作站的物理形态中。对于3D 渲染与影视后期而言,Blender、Maya、Cinema 4D等软件,多出的几十个线程可以直接让渲染速度呈线性提升,同时更多的PCIe通道数也能带动多张渲染显卡。

在工程仿真与CAE领域,涉及流体力学、有限元分析等极其消耗CPU和内存带宽的计算,至强600也能大幅缩短仿真等待时间。对于时下流行的本地AI开发与数据科学,凭借内置的AMX AI加速引擎和海量PCIe通道用于扩展多卡,它也是搭建本地大语言模型LLM推理和训练平台的理想CPU。




锐炫Pro B70:16卡组512GB显存,把AI算力拉满!
现场配合至强600组建工作站的是英特尔目前旗下最强的专业显卡锐炫Pro B70。是基于Battlemage战斗法师Xe2架构打造的BMG-G31大核心GPU,拥有32个Xe2核心和256个XMX AI引擎,AI算力峰值性能高达367 TOPS Int8。


在显存配置上,锐炫Pro B70拥有32GB 256-bit GDDR6显存,支持ECC纠错,显存带宽高达608GB/s。与近段被热门讨论的统一内存架构带宽不同,统一内存标称带宽惊人,但实际可用带宽可能在200GB/s以下,锐炫Pro B70的显存带宽可是实打实的608GB/s。

在供电设计上,锐炫Pro B70的TBP在160W到290W之间,作为一张专业显卡,OEM厂商会配合客户需求进行对应配置,包括更专业的多卡互联设计。不过现场工程师也强调,即使不依赖于独立的多卡互联芯片,利用现有的PCIe 5.0和至强600系列提供的通道,配合W890主板,足够发挥多卡性能。

锐炫Pro B70在供电上可提供16pin或者12V-2x6的最新版本12VHPWR供电。显卡本身获得了海量的专业认证,包括SR-IOV虚拟化,50余家主流ISV独立软件供应商认证。

在细节上,32GB GDDR6是真正的硬通货。专业工作和AI环境下,显存容量往往比核心频率更重要。锐炫Pro B70直接给到了32GB GDDR6显存,并且支持ECC错误纠正码,这意味着它可以在本地流畅运行70B 4-bit大语言模型,不会出现显存溢出的尴尬。同时在Linux环境下,通过多卡互联,可以驾驭100GB以上显存的巨型模型。现场DEMO就展示了4卡、8卡并联案例,而OEM工程师也强调,这套工作站组合可以做到16卡并联,实现512GB显存的恐怖容量。

锐炫Pro B70的Xe2架构搭配XMX AI引擎本来就是为AI推理而生。锐炫Pro B70总共拥有256个XMX AI引擎,INT8算力为367 TOPS。在实际的多用户并发AI推理测试中,相比同级竞品,B70表现出了极强的共享承载力,多用户Token吞吐量高出85%,首字响应延迟更是降低到了竞品的1/6.2,可以很好的满足企业级AI问答系统、多智能体AI响应。

由于PCIe 5.0 x16提供了128 GB/s的双向传输带宽,配合至强600系列组工作站。确实是一套非常理想的组合。
在现实输出方面,锐炫Pro B70提供了3 个DP 2.1(支持UHBR20)和1个HDMI 2.1a接口,最高可外接4台8K显示器。

目前华擎、蓝戟、铭瑄等AIC合作伙伴都已经提供了锐炫Pro B70海量版本,包括适合常规工作站的涡轮和轴流风扇版,采用均热板和高端相变导热材料,可以很好的应对TBP 230W功耗。




同时AIC还提供了没有风扇的散热版本,完全依靠服务器机箱强大的暴力排风来带走热量。这种设计不仅零噪音,而且极其耐用,特别适合高密度服务器机架或需要在粉尘、震动环境中24小时不停机的工业电脑。当然,如果有需求,锐炫Pro B70轻松做出浸没式液冷版本,只不过在工作站中比较少见。
从整体来看,锐炫Pro B70很适合需要大显存承载模型权重,且对多用户并发响应要求高的中小企业或AI创业公司,依托于强大的32 Xe核心和硬件光追单元,在Maya、3ds Max、Blender等专业视口中能提供流畅的线框预览和最终帧渲染。同时显卡也获得了AutoCAD, SolidWorks, Inventor等ISV的严苛认证。这是一块定位非常清晰,显存非常大,性价比也很有吸引力的专业级显卡。

AI生态新格局
在现场,英特尔已经携手火山引擎、联想等伙伴,利用至强600和锐炫Pro B70的双芯协同,推出面向企业智能体、智能协作、垂直行业AI等多个场景的创新解决方案。包括:

英特尔与火山引擎共同打造的AgentSphere一体机联合方案:依托英特尔至强600与锐炫Pro B70提供的高达32GB的显存,更高密度、更高性能的本地算力,AgentSphere具备了更高并发、更低时延、更少抖动的多智能体协同能力,同时开箱即用的标准一体机方案降低了AI落地企业的使用门槛与维护成本,让AgentSphere能够更便捷地帮助企业打造AI员工管理平台,提升生产效率。

联想智能会议系统:联想智能会议系统Lenovo SCH-900S借助锐炫Pro B70的出众显存、高达367 TOPS的AI算力峰值,实现多会议室并发接入与实时AI会议纪要的生成,显著提升沟通效率与执行落地速度,打造高效、智能的现代化办公体验。
飞致云长上下文RAG解决方案:在英特尔锐炫Pro B70多卡并发能力的基础之上,飞致云打造了面向企业级场景的长上下文 RAG 解决方案,全面支持LLM/VLM高效多卡并发推理。依托高带宽显存和AI算力支撑,该方案可提升企业知识管理、智能回答等场景的处理速度与响应质量。
东华医为电子病历智能体解决方案:智慧医疗是AI未来的核心落地场景之一。东华医为借助英特尔AI工作站平台在专业AI工作负载上的优势,实现了精准的病历内涵质控与病历辅助生成应用,助力医疗机构提升诊疗质量和效率。
亦心闪绘实时创作功能:在英特尔锐炫Pro B70的32GB强大AI算力及大显存加持下,亦心闪绘在秒级响应时间内,即可将用户的手绘画作,实时生成细节饱满的画作。这种高质高效的图生图技术,极大程度释放了艺术家的创意灵感和潜能。

英特尔至强600处理器与锐炫Pro B70显卡的最强单机组合拳,可以被认为是英特尔双芯协同战略的核心载体,通过量大管饱的32GB GDDR6 ECC大显存锐炫Pro B70与86核172核的至强698X做组合,常规工作站就能不做任何调整插上至少4块锐炫Pro B70显卡,轻松组处一台拥有128GB显存的工作站。

这意味着GPT-OSS-120B这样的1200亿参数大模型对于这套组合而言轻而易举,同时处理代码编译、科学计算等传统重载任务时,比上一代暴涨61%的多线程性能可以很好的处理问题。得益于oneAPI策略的推行,英特尔oneAPI工具包以及PyTorch、vLLM等主流开源框架已经对这套硬件提供了很好的支持,配合vPro和海量ISV认证,确保至强600与锐炫Pro B70在专业应用领域游刃有余。


是的,英特尔至强600与锐炫Pro B70已经给出了一套今年最令人兴奋,性能也相当猛的工作站解决方案。







