
PBlaze7 7A40 30.72TB 体验分享:满足你对大容量 SSD 的一切幻想,除了……
2021年,我刚刚踏足 SSD 行业,那时,大家对性能还不是特别看重,市场也仍以 PCIe 3.0,以及低功耗的 PCIe 4.0 产品为主。
2023年,以 ChatGPT 为代表的大语言模型一夜爆火。AI 不再只是实验室里的代码,而是首次展现出了恐怖的商业价值。
伴随而来的,是 AIGC 引发的数据激增,资本纷纷涌入,算力芯片也是水涨船高。数据中心在追求极致算力的同时,“存力”问题也开始显现 —— 在不扩建的前提下,如何能够存的更多,吐的更快?
后面的故事,大家都看到了,PCIe 4.0 匆匆结束使命,PCIe 5.0 快速到来。
如果说,PM1743、CM7、PBlaze7 7940 生的太早,那么2024年,随着更多 PCIe 5.0 服务器问世,以及美光、Solidigm 等“原厂”相继发布 PCIe 5.0 SSD 产品,这场酝酿已久的“存力”竞赛彻底爆发。
忆联 UH812a、忆恒创源 7A40、大普微 R6101,“更快、更大、更强”,成为此后每一款企业级 SSD 新品必然追求的核心目标。

而今,我终于拿到了 PBlaze7 7A40 SSD 的 30.72TB 版本。作为最新 PCIe 5.0 旗舰,它可以满足你对高性能大容量 SSD 一切幻想。只是,在当前超级存储周期下,贵是它的必然,而我,的钱包,显然有点羞涩。
还叫 7A40?
是的,没错。它并非全新系列,而是仍然基于镇岳510控制器、忆恒创源MUFP统一架构平台及专业固件,采用长江存储最新 NAND 打造的新的 SKU。
4TB 到 32TB 采用 TLC 颗粒,注重高性能与低延迟;64TB 以及 128TB 为 QLC 颗粒,注重高读取与极致的大容量。为了更好区分它们,忆恒创源还为 QLC 两款产品加上“Ocean”字样,也就是 PBlaze7 7A40 Ocean。

回到 PBlaze7 7A40 30.72TB 本身,由于采用最新 TLC NAND,其容量密度、延迟表现都得到进一步增强。SSD 仍然使用单板设计,DRAM 容量1000:1,加上额外 ECC,其 DRAM 容量达到奢华的 40GB,而这样的设计,也在此前 7940 上面采用。
外观仍为家族式设计,壳体大量散热开槽,不仅可高效带走自身热量,也能在密集部署下降低对服务器进气的影响。当然,小海豚表示也在和服务器厂商探讨水冷方案,以配合 GPU 服务器整体水冷趋势,满足数据中心日益严苛的 PUE 指标。

根据官方文档,PBlaze7 7A40 30.72TB 的四角性能分别为 14.2GB/s、11.9GB/s、3,400K IOPS、730K IOPS,如果把用户容量减少至 25.6TB,则4K随机写性能将上升至恐怖的 1,250K IOPS。它不仅是整个 7A40 系列中最能打的,也是所有品牌大容量 SSD 中,性能最好的。
性能加量,功耗并没有“加价”。新的 7A40 满带宽顺序读功耗依然控制在13瓦,最大写功耗依旧控制在22瓦,低于所有16通道主控产品。存储省一点,留给 CPU、GPU 的可用功率就能多一点。对个人玩家来说,低功耗也意味着低发热,对寸土寸金的台式机、工作站,也会更友好。
说了这么多,这块价值一辆飞度的 SSD 实际表现如何,还是要测一下。
我的台式机为 i5-12600K,关闭小核心。在6202年来说,这个配置已经落伍了,并且并发8个以及16个任务,也会面临线程不足的问题。但往乐观想,我能跑到的,你也能跑到。基准性能方面,遵循企业级 SSD 标准测试方法,基于 Linux 系统、FIO 进行。
用于对比的 SSD 来自某国际品牌,号称 “The Fastest” 的型号,具体不点名。

首先是顺序性能测试。测试开始前,需要格式化 SSD,再进行两次顺序全盘填充,以考量长期顺序写性能,并避免读取时因空盘导致的不从 NAND 读取。
此过程使用 128K 块大小,任务数量1,队列深度2,每秒记录一次性能数据。在 30.72TB 容量下,两次全盘填充共耗时5,124秒,平均写入速度为 11,994MB/s,延迟 16μs,且写入过程中无任何明显性能抖动,非常稳定。

顺序写方面,PBlaze7 7A40 在各个队列深度下均保持明显领先优势,其中,PBlaze7 7A40 30.72TB 版本在 QD2 时便达到 11,993MB/s 写入速度,不仅明显超过了标称值,距离 12GB/s 大关也已经非常非常接近。

顺序读方面,得益于预读功能的采用,PBlaze7 7A40 在 QD1到QD8 时均能够保持领先,QD1 时更是直接达到 6.3GB/s,这对于 AI 模型加载、游戏加载、影像类的大文件读取等,会有非常大的帮助。而随着队列深度的增加,PBlaze7 7A40 30.72TB 最终读带宽达到 14,222MB/s。

4K 随机性能方面,基于前述顺序测试的预处理,叠加28,800秒4K随机填盘,将 SSD 处理至随机稳态。PBlaze7 7A40 30.72TB 的初始 4K 随机写性能约为2,900K IOPS,由于顺序填盘的存在,很快GC开始大幅度介入,并最终在大约12,000秒开始进入稳态。整个预处理过程的4K随机写性能平均为 767K IOPS。

4K 随机写方面,PBlaze7 7A40 保持了极大优势,可以看到整个系列均明显强于竞品,同时,如果增加 OP,将其改为 25.6TB,其随机写性能将进一步提升至1,314K IOPS,达到竞品的3倍,也是当前所有 TLC SSD 中随机写性能最强的产品。

4K 随机读方面,PBlaze7 7A40 30.72TB 在 QD1 压力下为 19.3K IOPS,对应延迟 51μs,而 7A40 7.68TB 为 20.1K IOPS,对应延迟 49μs。随着队列深度的增加,7A40 30.72TB 随机读性能上升,最终停留在 3,400K IOPS。作为对比,竞品 QD1 时为 18.9K IOPS,延迟 52μs,最大 IOPS 为 3,334K IOPS。

7:3随机混合读写方面,PBlaze7 7A40 同样在各个 QD 均领先竞品,最高达到1,857K IOPS。如果此时能够将 CPU 更换为拥有完整8个大核心的i7,可能性能还能得到进一步提升。

至于 8K 随机性能,这里不做测试了,30.72TB 叠加 25.6TB,实在是太费时间,还需要至少两天。
基准性能部分至此结束,实测结果完全符合小海豚官方值。可以说,在使用 X4 NAND 之后,7A40 系列有了明显的性能提升,既扩大了写性能方面的核心优势,在读性能方面也得到大幅增强,超过 “The Fastest” 产品,使其成为名副其实的全能王者。结合更低的延迟,对 AI 任务中的 RAG 向量检索、KV Cache 加载/保存、模型加载,MoE 小模型切换,乃至训练过程中大的影像类文件,小的文本等等,都能有很好的支持。
而这种容量越大,性能越强的现象,也是首次出现在 30.72TB 这种大容量 SSD 上面,忆恒创源用实力证明,力大不仅砖飞,而且可以飞的更快!
“很好,但你说的这些,关我 Windows 什么事儿?”
贴上 CrystalDiskMark 测试结果。队列压力如图所示,顺序性能完全达标,读带宽超过 14GB/s,写带宽达到 12GB/s,在随机访问环节,最大读 IOPS 约合 3379K IOPS,随机写为 2910K IOPS,SSD 的性能得到很好的释放。

在 3DMARK 存储性能测试环节,得益于预读功能的采用,可大幅加速游戏的加载速度,实测成绩为4704分,虽然距离傲腾尚有距离,但对于 TLC 直读的 SSD 而言,这样的成绩已经非常非常优秀。

至此,所有测试全部结束。最后我们聊聊功耗。
PBlaze7 7A40 是目前功耗最低的,采用16通道主控、PCIe 5.0接口的 SSD,通过标准 nvme 命令可以很轻松的获得 SSD 的功耗信息。实测在 FIO 满压力下,其顺序读取功耗只有 13W,写入最大功耗为 22W,在风扇主动散热的配合下,其持续满载写入工况下的最高温度仅有57,颗粒温度始终未超过48,低于所有你能够买得到的同规格产品。
它足够大,也足够强,可以负责任的说,新的 7A40 30.72TB,满足你对于大容量 SSD 的所有幻想。
以上就是本期内容,希望你能喜欢。