现有的存储系统经过长期发展,种类及其繁多,架构也各不相同,按照从底层到上层的思路,大致可以分为:物理层、协议层、架构层、连接层四个层次。接下来我们由下往上详细分析。
物理层:顾名思义,就是用来存储数据的各种设备。企业级存储中的存储介质包括机械磁盘(HDD)、固态硬盘(SSD)、磁带(TAPE)、光盘(Optical Disk)等,其中最常见的是以HDD和SSD为介质的存储系统。从存储介质的维度进行分类,存储系统可分为磁盘存储、全闪存储、混闪存储、磁带库、光盘库等。
协议层:在各种物理介质内,数据统一抽象成0和1的字符串,但面对各种具体的数据使用场景和不同的数据接受者,我们需要用不同的形式来传输、呈现这些数据,这就需要不同的协议。主流协议可分为文件存储、块存储、对象存储三种。 文件存储:文件存储的目标用户是自然人。根据不同的应用要求,有不同类型的文件,每个文件一个易于理解和记住的名称。当有很多文件时,我们会以某种方式将这些文件分组到目录中。当然,我们还需要命名这些目录。除文件外,该目录还可能包含子目录,形成一个树状结构。主要的的文件系统有:Windows的FAT、FAT32、NTFS,Linux的EXT2、EXT3、EXT4、XFS、BtrFS等。在网络存储中,基础数据不是存储在本地存储介质中,而是存储在另一台服务器上,不同的客户端可以以类似于文件系统的方式访问此服务器上的文件,即网络文件系统。常见的网络文件系统包括 Windows 的 CIFS、UNIX 的 NFS 等。而除了网络文件系统外,FTP、HTTP也是文件存储的特殊实现,可以通过网址访问文件。 块存储:块存储是为物理层的硬盘设计的协议,所有数据被分成固定大小的块,每个块被分配一个可访问的号码。硬盘通常称为块设备。当然,除了硬盘之外,还有其他块状设备,如软盘、光盘、磁带等。块存储的常用协议是SCSI、NVMe等。在网络存储中,服务器可以使用某些协议模拟块设备。远程客户端(可能是物理服务器或虚拟机)使用相同的协议将块设备作为本地存储介质连接起来,以分区和格式化。常见的网络块存储协议是 iSCSI。 对象存储:对象存储适用于海量、无内部结构的数据,这些数据以对象的形式堆放在无数大容量的“存储桶”里。每个对象有一个唯一的标识符,其他系统可以使用标识符访问对象。当然,访问单个对象可能无法从传统意义上获取有价值的东西,它可能是一个值、一组值、一个文件的一部分、多个文件的组合,甚至一个块设备。对象存储的常用协议包括S3、SWIFT等。
架构层:在协议层,我们了解了存储设备是如何对使用者呈现数据的,再往上,我们需要考虑如何对各个服务器、机房、资源池进行管理,我们将这一层称为架构层,可分为集中式存储和分布式存储两种。集中式存储是基于双控制器或多控制器架构的企业级存储系统,具有较强的纵向扩展能力,有高可靠、高可用、高性能的特点。分布式存储是采用分布式架构的存储集群,将数据分布在不同物理位置,并通过网络把它连接起来。与传统的高端服务器、高端存储器和高端处理器不同的是,互联网公司的分布式存储系统由数量众多的、低成本和高性价比的普通 PC 服务器通过网络连接而成,横向扩展能力很强。
连接层:连接层描述了存储系统如何与其他系统对接,形成一个面向一般用户的整体系统,因此把它放在最上层。最初的连接方案是直连存储(DAS),是指直接和计算机相连接的数据储存方式,实际上“直连式存储”这一名称本身是在网络存储方式出现以后才有的称谓;像固态硬盘、机械硬盘、光盘驱动器这一类和计算机直接相连的存储设备都是属于直连式存储设备。之后的解决方案是存储区域网络(SAN)和网络附加存储(NAS)。存储区域网络指通过光纤通道交换机、以太网交换机等连接设备将磁盘阵列与相关服务器连接起来的高速专用存储网络。网络附加存储是一种专业的网络文件存储及文件备份设备,对不同主机和应用服务器提供文件访问服务。
了解存储系统的各个层级之后,让我们接着从技术架构角度来深入分析一下未来的存储发展方向。根据市场现状与技术发展趋势,各个层级大致的方向是:物理层闪存化,协议层标准化,架构层弹性化,连接层灵活化。
物理层闪存化:闪存普遍被认为是存储行业的发展方向,其具备远高于传统磁盘存储的数据吞吐能力及更低的时延。数据显示,固态硬盘对比机械硬盘,拥有更快的读取速度、更低的功耗以及更低的故障几率,实现了对机械硬盘性能的全面超越,为底层存储介质的替换提供了客观条件。未来的存储产品应该像天翼云存储资源盘活系统一样,在物理层是支持全闪和混闪的。存储资源盘活系统是用户态进程级的软件定义存储控制器,只需3个命令即可在Linux操作系统上完成安装,从安装包解压到集群初始化不超过3分钟。可安装在物理服务器、裸金属服务器以及虚拟机中。
协议层标准化:软硬解耦、易于扩展、自动化、基于策略或者应用的驱动是存储系统发展的特征。就业务应用来说,即不限制上层应用,不绑定下层硬件;除了提供块存储,也可以在同一平台提供文件、对象、HDFS 等存储服务,实现非结构化数据的协议互通;同时应具备完善的监控能力,实现应用感知。例如天翼云的存储资源盘活系统,提供标准化iSCSI接口,使客户能够直接迁移数据,避免应用的大量修改。支持部署全闪存或混合 SSD/HDD 存储节点,允许集群中每个实例具有不同的硬件配置。可以与多种虚拟化平台,数据库系统,应用系统整合。
架构层弹性化:在移动互联网环境下,业务应用的负载量是突发式、潮汐式、难以精确预测的,应用要求存储的容量和性能都必须能够线性扩展以满足上层应用需求。存储资源盘活系统的扩展性可以作为参考:可在不中断业务的情况下,从3台服务器扩展到数千台服务器,也可从数千台服务器逐台缩小到3台服务器,可以对抗能源供给不稳定的导致网络不稳定、电压电流不稳定等弱网弱电场景。当遇到因断电等极端条件导致的服务器宕机情况时,存储资源盘活系统可以在供电恢复服务器重启后,无缝恢复至断电前的运行状态,具备可靠的自愈能力。可作为本地与云端存储之间的桥梁,将全量数据自动同步到天翼云对象存储OOS中,本地仅保留热数据以节省本地存储空间,或者保留全量数据以保障本地I/O性能,实现混合云存储。
连接层灵活化:随着数据量的爆发式增长,许多企业产生数据的量级由原有的TB 级别迅速的提升到 PB 甚至 EB 级别。企业付出成本来存储这些数据的同时自然也想通过挖掘数据信息辅助商业决策,提升管理效率。面对众多的数据与信息来源,未来的存储系统在连接层上必须更普适,更丰富。例如存储资源盘活系统的按需流动功能,基于数据冷热和应用负载分析,使得数据按需流动在本地的不同磁盘与云端,满足不同生命周期阶段性能及成本诉求。它的多云对接也是灵活化的典范:通过 API、脚本和插件等多种方式对接云管平台,确保融入客户流程不改变客户习惯。
各类型数据存储技术仍在不断的完善和创新,以适应日益增长和不断变化的数据存储需求,形成了多层级、广泛覆盖的产品体系结构。随着物理层闪存化,协议层标准化,架构层弹性化,连接层灵活化的发展,未来的存储系统让企业用户无需关心存入数据的类型,系统自行选择最优形式进行存储。同时,弹性灵活的架构使得系统能够存储海量异构数据,构筑统一的数据底座,提供统一存储访问接口,解决系统间数据孤岛、各类应用统一访问问题,真正做到“存储资源盘活”。 ?
|