深信服超融合架构技术白皮书文档密级:内部
故障后可以自动重建数据副本;第三,高扩展:没有集中式机头,支持平滑扩容,容量几乎不受限制;第四,易管理:存储软件直接部署在服务器上,没有单独的存储专用硬件设备,通过Web UI的方式进行软件管理,配置简单。
1.2.1.3.1.3 深信服aSAN概述
在充分掌握了用户需求的基础上,深信服的超融合架构中,推出以aSAN分布式存储软件为核心的解决方案,
深信服虚拟存储(简称aSAN)是基于分布式文件系统开发的面对存储虚拟化趋势的一款产品。当前aSAN集成在虚拟化管理平台上面,通过网络整合管理集群内所有服务器的硬盘(系统盘除外)。
aSAN属于超融合解决方案中专门为云计算环境而设计、面向一体化市场应用的新一代产品,融合分布式缓存、SSD缓存加速、全局负载均衡、及多重数据保护等诸多存储技术,能够满足关键业务的需求,保证客户业务高效稳定运行。
1.2.1.3.2 aSAN技术原理
aSAN通过主机管理、磁盘管理、缓存技术、存储网络、冗余副本等技术,管理集群内所有硬盘,“池化”集群所有硬盘存储的空间,通过向VMP提供访问接口,使得虚拟机可以进行业务数据的保存、管理和读写等整个存储过程中的操作。
1.2.1.3.2.1 主机管理
aSAN需要基于VMP集群获取集群内主机信息,因此在构建aSAN时,首先会要求建立VMP集群,所以在aSAN的环境中,至少需要2台节点来构建aSAN主机。
深信服超融合架构技术白皮书文档密级:内部
1.2.1.3.2.2 文件副本
由于下一节磁盘管理的策略与副本设置有直接管理,因此在讲解磁盘管理前,我们要先介绍文件副本技术。
所谓文件副本,即将文件数据保存多份的一种冗余技术。aSAN副本颗粒度是文件级别。例如2副本,即把文件A同时保存到磁盘1和磁盘2上。并且保证在无故障情况下,2个副本始终保持一致。
技术特点:
1. 存储池可用空间=集群全部机械磁盘空间/副本数(同构情况),因此副本是会
降低实际可用容量的。
2. 服务层是提供给上层服务的访问入口,以目录挂载点的方式提供。服务层看到
的文件A实际是个被底层管理转化后的逻辑视图。
3. 底层管理的副本对上层服务是透明的,上层无法感知副本的存在。磁盘管理、
副本分布由底层服务负责,副本颗粒度是文件级。
4. 在没有故障等异常情况下,文件副本数据是始终一致的,不存在所谓主副本和
备副本之分。
5. 如果对文件A进行修改,如写入一段数据,这段数据会被同时写到2个副本文
件。如果是从文件A读取一段数据,则只会从其中一个副本读取。
深信服超融合架构技术白皮书文档密级:内部
1.2.1.3.2.3 磁盘管理
aSAN磁盘管理服务根据集群内主机数和aSAN初始化时所选择的副本数决定集群内所有受管磁盘的组织策略。
在多主机集群下,采用2副本或3副本组建aSAN的磁盘管理,为了支持主机故障而不影响数据完整性的目标,复制卷的磁盘组的每个磁盘都必须是在不同主机上。即需要做到跨主机副本。跨主机副本的关键在于复制卷磁盘分组算法。
注意:下面的例子讨论的主机都属于同构情况,即可每台主机的磁盘个数、磁盘容量是一样的情况,主机磁盘数异构场景后文再另外叙述。
我们先从简单的场景开始,当主机数、集群磁盘数都可以被副本数整除时。如2主机,每主机3个磁盘(共6个)组建2副本aSAN为例:
2副本下,2主机,主机磁盘数相同时。主机间的磁盘会一一对应组成复制卷。逻辑视图如下:
深信服超融合架构技术白皮书文档密级:内部
从逻辑视图上,可以看出来和前文的单主机逻辑视图并没有本质上的区别,只是最底层的磁盘分组时,保证了复制卷内下面的磁盘不在同一主机内,从而达到了文件跨主机副本的目标。如果采用3主机建立3副本,分组方式也是类似的。
1.2.1.3.2.4 SSD读缓存原理
在aSAN里面,会默认把系统内的SSD磁盘作为缓存盘使用。在aSAN1.X版本,SSD磁盘只作为读缓存使用,aSAN2.0开始支持SSD写缓存。下面介绍aSAN SSD读缓存原理。
首先需要区分aSAN客户端和服务端概念。在aSAN里面,负责处理底层磁盘IO称为服务端;负责向上层提供存储接口(如访问的挂载点)称为客户端。aSAN SSD读缓存工作在客户端,而aSAN2.0的SSD写缓存则工作在服务端。逻辑视图如下:
深信服超融合架构技术白皮书文档密级:内部
下面抛开底层的分布卷、复制卷、磁盘分组等概念,仅在客户端上理解SSD读缓存的原理。
简单地看,SSD读缓存模块工作在文件访问入口和服务端通信层之间。所有对文件的IO动作都会经过SSD读缓存模块进行处理。下面分别针对首次文件读取、二次文件读取、文件写入3个过程说明工作流程。
SSD读缓存的缓存颗粒度是按文件数据块缓存,不是文件整体。例如,A、B、C 3个文件,可以分别各缓存读过的一部分数据,没读过的部分不缓存。