硬盘|浪潮存储:全闪化成为数据中心主流趋势,企业如何预测SSD寿命

北京2021年11月24日 /美通社/ -- 十四五规划中指出要“加快数字化发展,建设数字中国”。IDC预测,到2022年,全球65%的GDP将由数字化推动。近几年新基建、数字经济和平台经济发展迅猛,给数据中心提出了新的挑战。全闪存数据中心具有速度快、绿色节能等优势,将会是未来数据中心的发展趋势,SSD(固态硬盘)也将会得到更加广泛的应用。
为什么关注SSD寿命预测?
企业关注SSD寿命预测技术,一是因为SSD的应用前景非常广阔,市场上使用率将越来越高。二是SSD损坏导致数据丢失带来的损失是巨大的。三是因为闪存具有擦写次数限制的特点。
与传统机械硬盘相比,SSD的优势非常明显,如SSD速度更快,数据访问比机械硬盘快100倍,吞吐量大100倍,单盘IOPS大1000倍以上,并且技术在快速发展,如NVMe、 PCIe将进一步释放SSD的性能;在可靠性表现上,SSD因质量轻、体积小、防震抗摔性更好,更加可靠。再如SSD更节能,与机械硬盘相比,能耗降低70%。今年的政府工作报告中提出要在2030年之前实现“碳达峰”,在2060年之前实现“碳中和”,使用SSD能够大幅降低数据中心的能耗。过去SSD使用率不高的原因主要是其价格昂贵,现在据IDC统计:2015年到2020年,SSD平均每年的价格降幅达到25%,未来5年也将保持这一趋势;2020年,全球范围内企业级SSD上的支出已经超过传统硬盘。
硬盘|浪潮存储:全闪化成为数据中心主流趋势,企业如何预测SSD寿命
文章插图

全球企业级机械硬盘和SSD盘支出对比(单位:百万美元),2005-2020
正是由于SSD速度快但价格相对较高,SSD通常用来存放元数据或核心数据,这部分数据丢失将会给用户带来的损失更加严重。并且,SSD闪存介质具有擦写次数限制,因此SSD使用寿命更值得被关注和重视。
SSD寿命预测如何实现
SSD,是由控制芯片和存储芯片组成的。控制芯片是SSD的大脑,用于调配数据、数据中转等,存储芯片用于存储数据。当前主流的存储芯片为NAND Flash闪存芯片,NAND采用浮栅晶体管存储数据,写入数据时需要先擦除再写入,写操作本质是向浮栅注入电荷,擦除操作是从浮栅挪走电荷,充放电的过程会损耗二氧化硅绝缘层的绝缘能力,最终无法保证浮栅中存有足够多的电荷。因此NAND的擦写次数是有限的,闪存完全擦写一次叫做1次P/E,闪存的寿命就以P/E作单位,例如常用的MLC-SSD擦写次数为10000次。SSD寿命预测,本质上就是预测NAND芯片P/E次数还可用多长时间。
硬盘|浪潮存储:全闪化成为数据中心主流趋势,企业如何预测SSD寿命
文章插图

SSD结构
硬盘厂商一般都遵循S.M.A.R.T. 标准进行数据保护,S.M.A.R.T. 标准是一种自动的硬盘状态检测与预警系统和规范。SSD S.M.A.R.T.中包含了一些与寿命相关的指标,不同接口、不同厂商的指标略有不同。浪潮自研NVMe SSD遵循NVMe 1.3标准,提供标准的S.M.A.R.T.输出。部分厂商SATA接口和PCIe接口寿命相关指标如下表所示:
硬盘接口
硬盘厂商
指标名称
指标含义
SATA
Intel
Smart_233 Media Wearout Indicator
介质磨损指示
Micron
Smart_202 Percent lifetime remaining
剩余寿命百分比
Samsung
Smart_177 Wear Leveling Count
擦写次数计数
Seagate
Smart_231 SSD Life Left
SSD剩余寿命
PCIe
Inspur等
percentage_used
已使用百分比
各个厂商通用的指标为百分比表示的闪存磨损度,SSD寿命预测基于闪存磨损度,预测SSD未来可使用的天数。同时,该寿命预测模型能友好的支持浪潮自研PCIe接口SSD。
SSD寿命预测使用时间序列预测技术,基于硬盘S.M.A.R.T.标准采集预测所需的历史时间序列数据集,再使用浪潮自研的AI预测算法,预测S.M.A.R.T.指标未来变化,得到SSD剩余寿命天数。