数据中心,大容量SSD开始取代HDD
SSD逐渐蚕食HDD销量。
随着 122 TB SSD(固态硬盘)的出现,用 SSD 取代HDD(机械硬盘)的情况突然变得更具吸引力。
到 2024 年底,有五家供应商推出 60 TB 以上的 SSD,三家供应商推出 122 TB 以上的 SSD:美光、群联和 SK 海力士。三星拥有 60 TB 以上的 SSD,而铠侠和西部数据则落后于 60 TB 以上的 SSD。
这对“HDD不会被SSD 取代”的论点有何影响?
本次讨论的重点是价格、性能、数据中心机架数量和用电量。我们无法检查驱动器采购价格,因为存储阵列 OEM 和超大规模制造商用于批量采购的价格并不公开。但是,我们可以了解一些影响驱动器所有权的成本指标。
我们在容量和性能方面比较了Supermicro的 2RU x 12 插槽磁盘驱动器机箱和 2RU x 24 插槽 SSD 机箱:
容量
- 2U HDD阵列:12 块 32TB 的 SMR(叠瓦式磁记录)HDD,总计 384TB
- 2U SSD阵列:24 块 122TB 的SSD,总计 2928TB,经过 3:1 的数据去重后可达 8784TB
- 40U 机架搭配 19 个 2U HDD机箱,容量为 7296TB,即 7.3PB
- 40U 机架搭配 19 个 2U SSD机箱,容量为 166896TB,即 166.9PB,是同等HDD机架容量的 22.8 倍
请注意,250 TB SSD 即将问世,这将使 SSD 机架容量密度翻倍。
表现
- 32 TB HDD 延迟:4.16 毫秒
- 32 TB HDD 持续传输速率:269 MBps
- 122 TB SSD 延迟:30 μs
- 122 TB SSD 顺序读取带宽:采用 PCIe gen 5 时为 14,600 MBps ,比 HDD 快 54.3 倍
在此基础上,一个装有 19 个 2RU SSD 机箱(包含 122 TB SSD)的 40U 机架可以取代装有 32 TB 磁盘驱动器的 23 个机架,并提供 54 倍的读取带宽。想象一下,数据中心的空间、冷却和电力节省,再加上比磁盘驱动器机架高出 50 倍的性能提升。
功耗
单个HDD和SSD的功耗可通过 Solidigm的 Signal65 研究来评估。该研究着眼于构建一个 100 兆瓦的人工智能数据中心,采用 122.88TB 的 QLC(四级单元)Solidigm SSD、TLC(三级单元)SSD,或混合 TLC SSD加上 24TB HDD的部署方案,并设有 1PB、5PB 和 10PB 的总容量选择。
对于 122.88TB 的 Solidigm QLC SSD,其平均功耗(读写比为 90% 读、10% 写时)为 14.3 瓦,闲置功耗额定值为 5 瓦;而对于 24TB 的HDD驱动器,其活动功耗为 8.2 瓦,闲置功耗为 6.5 瓦。该报告通过计算占空比,算出 “每种HDD类型的总功耗需求是通过对HDD活动功耗和闲置功耗取加权平均值来计算的”。
报告中提到,“基于每种HDD的性能和存储密度进行了占空比计算。由于HDD从闲置状态转换到活动状态所需的时间,以及工作负载对高吞吐量的要求,我们假定HDD以及与之相关的SSD缓存层始终处于 100% 的活动状态。”
报告发现,“随着容量增加,QLC SSD在能效方面的优势愈发明显。与 TLC SSD相比,当容量从 1PB 增加到 10PB 时,QLC SSD的能效优势在 3.3% 到 19.5% 之间。相较于混合HDD环境,其优势更为显著,在低容量水平时能效优势为 32.9%,在高容量水平时可达 79.5%。”
总体而言,与混合 TLC SSD和HDD相比,QLC SSD的能效高出 79.5%。QLC SSD还能使数据中心内的人工智能基础设施总量增加 26.3%。根据该报告:“尽管所模拟的三种设备具有不同的活动功耗值,其中单个HDD的活动功耗最低,但高密度的 QLC 设备以少得多的数量实现了相同的总容量,从而导致总体功耗更低。”
报告指出:“QLC HDD的高密度挑战了HDD的经济优势,同时提供了闪存性能,使其成为许多传统HDD环境极具吸引力的替代品。”
基于此,从容量、性能和电力使用情况来看,使用HDD构建近线存储系统似乎是不明智的。在主存储领域,SSD与HDD的竞争中闪存已经胜出。看看 NetApp已安装的 ONTAP 系统持续向全闪存 ONTAP 系统的转变就知道了。再看看 xAI 在其 Colossus 数据中心使用 DDN和 VAST Data的全闪存存储也是如此。
但现在,全闪存供应商正准备打入近线存储市场。Pure Storage已与一家排名前四的超大规模数据中心提供商签署协议,供应其全闪存近线存储和主存储技术。这涉及 Pure 公司专有的 75TB 和 150TB 闪存驱动器设计,而不是商用SSD。
美光在其最新的季度财报电话会议上指出,它预计高容量商用SSD将开始取代数据中心的大容量HDD。
这些迹象支持了 Pure Storage 的观点,即闪存驱动器将取代HDD驱动器。
SSD 蚕食磁盘驱动器
然而,HDD 行业宣称 SSD 不会取代 HDD,希捷指出了三个原因。
首先,SSD 价格难以与 HDD 价格抗衡。直至 2027 年,HDD 相比 SSD 在每 TB 价格上会保持超过 6:1 的优势。不过,与之相反的观点是,尽管 SSD 的采购成本可能高于 HDD,但考虑到电力消耗和数据中心空间等因素后的总体拥有成本(TCO)或许更倾向于 SSD,正如 Solidigm 的上述报告所示。
其次,SSD 制造产能无法与 HDD 制造产能匹敌。集邦科技(TrendForce)和国际数据公司(IDC)预计,2027 年总共需要 3686 EB 的 NAND 和 HDD 容量。NAND 行业届时能生产 963 EB,而 HDD 将贡献 2723 EB。若这部分 HDD 贡献的容量要由 NAND 取代,预估成本将达 2060 亿美元。希捷认为到 2027 年这根本不可能实现。
第三,SSD 不太适合近线 HDD 工作负载,因为多数企业工作负载并不需要 SSD 的速度。希捷使用“需要”一词耐人寻味。倘若企业和超大规模数据中心通过使用 SSD 既能获得速度,又能更好地利用数据中心服务器基础设施,同时节省电力和空间成本,那么他们很可能会说相比 HDD 更“需要”SSD。Pure Storage 与超大规模数据中心的交易表明这种情况是有可能的。
争议并非 SSD 制造产能永远无法赶上 HDD,而是到 2027 年 NAND 制造产能无法与 HDD 相匹配。如果 SSD 取代近线 HDD 存在切实的市场机遇——依据希捷所引用的数据,2027 年这一机遇对应的容量为 2723 EB——那么随着时间推移,NAND 制造商在 2027 年后将会扩充制造产能。
从中期来看,直至 2029 年,像汤姆·考夫林(Tom Coughlin)这样的分析师预计 HDD 的出货量和容量销量将会增长。考夫林向我们表示:“是的,这是我的评估。依我之见,鉴于热辅助磁记录(HAMR)等 HDD 方面的新进展,SSD 在二级存储领域将难以与 HDD 竞争。”
我们可以认为,市场对存储容量的需求增长速度将会超过SSD的生产产能,而SSD的生产产能将会随之增加以追赶需求。
我们觉得,随着 122TB 的 PCIe Gen 5 SSD进入市场,且真实的总体拥有成本(TCO)数据得以呈现,有关 “SSD将冲击近线HDD” 的争论在整个 2025 年都将持续下去。支持SSD的观点将会愈发有力,促使分析师们改变他们的看法。
如果市场情绪转向青睐SSD,那么这对三家HDD制造商 —— 希捷(Seagate)、东芝(Toshiba)和西部数据(Western Digital)—— 而言影响将是巨大的。HDD届时就会如同胶卷相机面对数码相机,进而又面对智能手机摄像头时那般处境。柯达在这种转变过程中表现如何呢?
随着SSD逐渐蚕食它们的近线HDD销量,这三家企业将面临一段漫长的衰退期。届时我们或许会看到东芝退出HDD业务,希捷收购一家SSD控制器制造商来巩固其 Nytro SSD产品线,而西部数据甚至可能通过同样的方式重新涉足SSD业务。
编译自blocksandfiles
*:not([class*="icon"]):not([class*="fa"]):not([class*="logo"]):not([class*="mi"]):not([class*="code"]):not(i){font-family:PingFang SC,Arial,"Material Icons Extended",stonefont,iknow-qb_share_icons,review-iconfont,mui-act-font,fontAwesome,tm-detail-font,office365icons,MWF-MDL2,global-iconfont,"Bowtie" !important;}[class*="code"]{font-family: Consolas !important}