华为FusionStorage技术白皮书 3 解决方案/Solution
3.2 产品特性介绍
3.2.1 性能卓越
FusionStorage通过创新的架构把分散的、低速的SATA/SAS机械硬盘组织成一个高效的类SAN存储池设备,提供比SAN设备更高的IO,把性能发挥到了极致。
FusionStorage支持使用SSD替代HDD作为高速存储设备,支持使用Infiniband网络替代GE/10GE网络提供更高的带宽,为对性能要求极高的大数据量实时处理场景提供完美的支持。
分布式机头
FusionStorage采用无状态的分布式软件机头,机头部署在各个服务器上,无集中式机头的性能瓶颈。单个服务器上软件机头只占用较少的CPU资源,提供比集中式机头更高的IOPS。
分布式缓存
FusionStorage实现了计算和存储的融合,缓存和带宽都均匀分布到各个服务器节点上。 FusionStorage集群内各服务器节点的硬盘使用独立的I/O带宽,不存在独立存储系统中大量磁盘共享计算设备和存储设备之间有限带宽的问题。
FusionStorage支持将服务器部分内存用作读缓存,NVDIMM和SSD卡用作写缓存,数据缓存均匀分布到各个节点上,所有服务器的缓存总容量远大于采用外置独立存储的方案。即使采用大容量低成本的SATA硬盘,FusionStorage仍然可以发挥很高的IO性能,整体性能提升1~3倍,同时提供更大的有效容量。
FusionStorage支持PCIe SSD用作数据缓存,除具备通常的写缓存外,增加热点数据统计和缓存功能,加上其大容量的优势,进一步提升了系统性能。
图3-4 FusionStorage 计算和存储融合
文档版本V3.02 (2013-04-15)
华为专有和保密信息 版权所有 ? 华为技术有限公司
7
华为FusionStorage技术白皮书 3 解决方案/Solution
全局负载均衡
FusionStorage的实现机制保证了上层应用对数据的IO操作均匀分布在不同服务器的不同硬盘上,不会出现局部的热点,实现全局复负载均衡。
第一,系统自动将数据块打散存储在不同服务器的不同硬盘上,冷热不均的数据会均匀分布在不同的服务器上,不会出现集中的热点。
第二,数据分片分配算法保证了主用副本和备用副本在不同服务器和不同硬盘上的均匀分布,换句话说,每块硬盘上的主用副本和备副本数量是均匀的。
第三,扩容节点或者故障减容节点时,数据恢复重建算法保证了重建后系统中各节点负载的均衡性。
分布式SSD存储
FusionStorage支持为高性能应用设计的分布式SSD存储系统,拥有比传统的机械硬盘(SATA/SAS)更高的读写性能。 华为SSD卡具有如下特点
? ?
高带宽:采用PCIe 2.0 x8的接口,提供高达3.0GB的读/写带宽。
高IO:4KB数据块,100%随机,提供高达600K的持续随机读IOPS和220K的持续随机写IOPS。
FusionStorage分布式SSD存储系统通过以下措施增强了可靠性:
? ? ?
内嵌的ECC检错/纠错引擎和RAID5引擎, 数据通道间形成二维的检错/纠错机制。 内置DATA Scrubbing引擎定时检测存储数据,提前预防数据错误的产生。 通道间使用Dynamic RAID算法,实现通道间的资源共享,确保在芯片坏块过多甚至是多个芯片故障的情况下均能正常工作。
内部实现冷热数据分类与管理,配合先进的磨损算法,最大程度上提升回收效率,降低写磨损,从而提升SSD的使用寿命。
?
文档版本V3.02 (2013-04-15)
华为专有和保密信息 版权所有 ? 华为技术有限公司
8
华为FusionStorage技术白皮书 3 解决方案/Solution
图3-5 FusionStorage 支持分布式SSD存储系统
高性能快照
FusionStorage提供了快照机制,将用户的逻辑卷数据在某个时间点的状态保存下来,后续可以作为导出数据、恢复数据之用。
FusionStorage快照数据基于DHT机制,快照不会引起原卷性能下降。通过一次Hash查找即可判断有没有做过快照,以及最新快照的存储位置,因此效率很高。
图3-6 FusionStorage 快照
文档版本V3.02 (2013-04-15)
华为专有和保密信息 版权所有 ? 华为技术有限公司
9
华为FusionStorage技术白皮书 3 解决方案/Solution
高性能链接克隆
FusionStorage基于增量快照提供了链接克隆机制,基于一个快照创建出多个克隆卷,各个克隆卷刚创建出来时的数据内容与快照中的数据内容一致,后续对于克隆卷的修改不会影响到原始的快照和其他克隆卷。
FusionStorage支持1:256的链接克隆比,提升存储空间利用率。
FusionStorage支持批量进行虚拟机卷部署,能够在秒级批量创建上百个虚拟机卷。 克隆卷继承普通卷所有功能:克隆卷可支持创建快照、从快照恢复以及再次作为母卷进行克隆操作。
图3-7 FusionStorage 链接克隆
高速Infiniband网络
FusionStorage支持为高带宽应用设计的Infiniband网络,存储交换无瓶颈。
? ? ? ? ? ? ?
56Gbps FDR InfiniBand,超高速互联。 标准成熟多级胖树组网,平滑容量扩容。 近似无阻塞通信网络,数据交换无瓶颈。 纳秒级通信时延,计算存储信息及时传递。 无损网络QOS,数据传送无丢失。 主备端口多平面通信,冗余通信无忧。
单口56Gbps带宽,完美配合极速SSD存储吞吐,性能无限。
3.2.2 高可靠
集群管理
FusionStorage分布式存储软件采用集群管理方式,不会出现单点故障,一个节点或者一块硬盘故障自动从集群内隔离出来,不影响整个系统业务的使用。
文档版本V3.02 (2013-04-15)
华为专有和保密信息 版权所有 ? 华为技术有限公司
10
华为FusionStorage技术白皮书 3 解决方案/Solution
集群内选举进程Leader,Leader负责数据存储逻辑的处理,当Leader出现故障,系统自动选举其他进程成为新的Leader。
多数据副本
FusionStorage存储系统中没有使用传统的RAID模式来保证数据的可靠性,而是采用了多副本备份机制,即同一份数据可以复制保存多个副本。在数据存储前,对数据进行分片,分片后的数据按照一定的规则保存集群节点上。
如下图所示,对于服务器Server1的 磁盘Disk1上的数据块P1,它的数据备份为服务器Server2的磁盘Disk2上P1’,P1和P1’构成了同一个数据块的两个副本。 图3-8 FusionStorage 多数据副本
数据一致性
数据一致性的要求是:当应用程序成功写入一份数据时,后端的几个数据副本必然是一致的,当应用程序再次读时,无论在哪个副本上读取,都是之前写入的数据。 保证多个数据副本之间的数据一致性是FusionStorage的重要特点,FusionStorage采用强一致性复制技术确保各个数据副本的一致性。
FusionStorage还支持Read Repair机制。Read Repair机制是指在读数据失败时,会判断错误类型,如果是磁盘扇区读取错误,可以通过从其他副本读取数据,然后重新写入该副本的方法进行恢复,从而保证数据副本总数不减少。
快速数据重建
FusionStorage内部具备强大的数据保护机制。数据存储时被分片打散到多个节点上,这些分片数据支持分布在不同的存储节点、不同的机柜之间,同时数据存储时采用多副本技术,数据会自动保存多份,每一个分片的不同副本也被分散保存到不同的存储节点上。在硬件发生故障导致数据不一致时,FusionStorage通过内部的自检机制,通过比较不同节点上的副本分片,自动发现数据故障。发现故障后启动数据修复机制,在后台修复数据。由于数据被分散到多个不同的存储节点上保存,数据修复时,在不同的节点上同时启动修复,每个节点上只需修复一小部分数据,多个节点并行工作,有效避免单个节点修复大量数据所产生的性能瓶颈,对上层业务的影响做到最小化。数据故障自动恢复流程如下图所示。
文档版本V3.02 (2013-04-15)
华为专有和保密信息 版权所有 ? 华为技术有限公司
11