一点意见:在线磁盘归档压根不该存在

问题:近线磁盘存储跟纯磁盘主动归档系统有区别吗?答案:没区别 。
剑桥词典对“归档”做出的解释是:“用于存储您不需经常使用的电子信息或文档的计算机文件 。 ”
结合释义 , 就是说这些文件不需要被存储在可提供连续访问的磁盘驱动器上 。
主动归档联盟
主动归档联盟(AAA)对于主动归档的定义如下:“主动归档可在整个生命周期之内 , 实现对数据的可靠、在线且经济高效的访问 , 并与闪存、磁盘、磁带或云 , 以及文件、块或对象存储系统相兼容 。 其有助于将数据移动至适当的存储层 , 从而最大限度降低成本 , 同时保持用户访问的便利性……创建自动归档能够释放T1层存储资源 , 节约宝贵的主存储空间 , 且仍保证在线存储/组织全体数据 。 ”
换句话说 , 主动归档涵盖的是非主要数据 , 即T2(近线)和T3(离线)级数据 , 这里没有提及仅限于缓存内的在线介质 。 自动归档联盟明显认为 , 人人都该保有自己的一套在线归档系统 。
该联盟提出的四层存储模型省略掉了所有介质类型 , 其中包含一个深层归档子类:
一点意见:在线磁盘归档压根不该存在
文章图片
主动归档联盟给出的四层存储模型
这套模型也为在线归档业务打开了大门 , 各大磁盘驱动器厂商和归档联盟成员兼赞助商希捷都在为其开发相应产品 。
希捷企业归档系统
希捷将企业数据归档描述为“用于存储组织数据的存储系统或平台 , 这些数据很少被使用或访问 , 但重要度较高 。 例如财务记录、内部通信、蓝图、设计、备忘录、会议记录、客户信息以及组织今后可能需要的其他文件 。 ”
“早期企业数据归档主要强调在指定存储单元中保存的纸质记录……近年来 , 组织开始将其数据归档转移至基于云的解决方案 。 基于云的解决方案能使数据归档更易于访问 , 同时降低相关成本 。 ”
基于云的解决方案包括采用Cloudian、Scality或其他对象存储软件的基于本地对象存储磁盘的系统 。 此外 , 希捷Exos磁盘驱动器机柜和托管磁盘阵列服务IyveCloud系统也属于此类 。
这里并不涉及离线磁带或光盘盒库之上的磁盘缓存数据概念 。 对此 , HorrisonInformationStrategies的分析师FredMoore显然有不同看法 。
Horrison眼中的归档
在由高通赞助的《构建未来归档》论文中 , Moore阐述了自己理解的归档定义 。 与制作数据副本以便原始数据丢失或损坏时进行还原的备份方案不同 , 他认为归档属于原始数据一个版本 , 其作用是从中检索部分数据、而非进行数据恢复 。
WCurtisPreston在其2021年出版的《现代数据保护》一书中 , 也引用了这个定义以及恢复-检索间的区分 。
将数据转移至归档存储 , 能够释放宝贵的主存储容量 , 转而使用成本更低、容量更大、但访问更慢的长期存储介质 , 例如磁盘和光盘 。 Moore认为归档可以分为两种:由离线磁带与在线磁盘驱动器组成的主动归档;以及仅由离线存储介质提供的长期或深层归档 。
归档也可以通过特定软件来定义:对象存储软件能够对非结构化数据和对象数据进行横向扩展和跨地理分发 , 借此实现归档存储的管理和保护需求 。 这类方案涵盖智能数据移动器、数据分类和元数据等功能 。
Moore认为 , “当前 , 数据中心经理提出的普遍目标 , 就是「非数据 , 不应消耗能源 。 」”这明显是把磁带视为最环保的可用存储解决方案 。 他建议“所有数据中应有60%到80%以归档形式存在 , 但其中大部分其实被存储在错误的位置上——即磁盘驱动器上 。 到2025年 , 全球总归档数据量约在4.5至6ZB之间 , 而归档仍是其中占比最高的类型 。 ”请注意其中的表述 , “被存储在错误的位置——即磁盘驱动器上 。 ”