从硬件角度解析分布式存储是什么?

什么是分布式存储系统?
分布式存储又称去中心化存储 , 要理解它 , 首先我们需要了解中心化存储 。
中心化存储从概念上可以看出来是具有集中性的 , 也就是整个存储是集中在一个系统中的 , 但集中式存储并不是一个单独的设备 , 是集中在一套系统当中的多个设备 。 这个存储设备虽然可以纵向扩展 , 但还是共享同一个机头 , 设备本身会成为系统性能的瓶颈 , 同时也是系统可靠性和安全性的焦点 , 无法满足大规模存储应用的需要 。 在这个存储系统中包含很多组件 , 除了核心的机头(控制器)、磁盘阵列(JBOD)和交换机等设备外 , 还有管理设备等辅助设备 。
从硬件角度解析分布式存储是什么?
文章图片
结构中包含一个机头 , 这个是存储系统中最为核心的部件 。 通常在机头中有包含两个控制器 , 互为备用 , 避免硬件故障导致整个存储系统的不可用 。 机头中包含前端端口和后端端口 , 前端端口用户为服务器提供存储服务 , 而后端端口用于扩充存储系统的容量 。 通过后端端口机头可以连接更多的存储设备 , 从而形成一个非常大的存储资源池 。
在整个结构中 , 机头中是整个存储系统的核心部件 , 整个存储系统的高级功能都在其中实现 。 控制器中的软件实现对磁盘的管理 , 将磁盘抽象化为存储资源池 , 然后划分为LUN提供给服务器使用 。 这里的LUN其实就是在服务器上看到的磁盘 。
当然 , 一些集中式存储本身也是文件服务器 , 可以提供共享文件服务 。 无论如何 , 从上面我们可以看出集中式存储最大的特点是有一个统一的入口 , 所有数据都要经过这个入口 , 这个入口就是存储系统的机头 。 这也就是集中式存储区别于分布式存储最显著的特点 。
从硬件角度解析分布式存储是什么?
文章图片
分布式存储系统是将数据分散存储在多台独立的设备上 , 并且能够横向扩展 , 利用多台存储设备分担存储负荷 , 利用元数据服务器定位存储信息 , 它不但易于扩展 , 还提高了系统的可靠性、可用性和存取效率 。
同时 , 可以将这些分散的存储设备构建成一个虚拟的大存储池 , 供上层应用来使用 。
市场上诸多集群存储、并行存储 , 云存储等 , 其实都是基于分布式的架构 , 只是厂商不同叫法不同 。
最近几年 , 这种分布式架构的存储系统正在逐步替代传统的存储架构 , 尤其是在非结构化数据的存储领域发展非常迅猛 。
从硬件角度解析分布式存储是什么?
文章图片
分布式存储最早是由谷歌提出的 。 其目的是通过廉价的服务器来提供使用与大规模 , 高并发场景下的Web访问问题 。 它采用可扩展的系统结构 , 利用多台存储服务器分担存储负荷 , 利用位置服务器定位存储信息 , 它不但提高了系统的可靠性、可用性和存取效率 , 还易于扩展 。
分布式存储系统特点
大容量:系统节点可采用通用的X86架构存储服务器作为构建单元 , 可根据用户需要横向无限扩展存储节点 , 并且形成一个统一的共享存储池 。
高性能:相比传统存储而言 , 分布式存储系统能提供高出数倍的聚合IOPS和吞吐量 , 另外可以随着存储节点的扩容而线性增长 , 专用的元数据模块可以提供非常快速精准的数据检索和定位 , 满足前端业务快速响应的需求 。
更可靠:整个系统无任何的单点故障 , 数据安全和业务连续性能够得到保障 。 每个节点可看成是一块硬盘 , 节点设备之间有专门的数据保护策略 , 可实现系统的设备级冗余 , 并且可在线更换损坏的硬盘或者节点设备 。