提供安全、可靠、实时、高吞吐的数据存储。虚拟化存储集群集中管理、集中运营、集中维护,以更小的硬件资源和人力资源投入,提供更坚实的存储平台。 9.2.2 例行操作 9.2.2.1 监控
虚拟存储资源监控主要监控各软硬件的运行状况和指标。具体内容参见表4,包括但不限于:
表4 虚拟存储资源主要监控内容
服务对象 监控内容 服务控制器CPU负载情况 服务控制器内存消耗情况 服务控制器整体数据吞吐带宽、IOPS、响应时间和请求队列时间 服务控制器后端数据吞吐带宽、IOPS、响应时间和请求队列时间 服务控制器间数据吞吐带宽、IOPS、响应时间和请求队列时间 服务控制器cache利用情况 存储资源池分配策略与空间使用情况 虚拟存储卷访问吞吐率、IOPS、响应时间和请求队列时间 仲裁控制点(磁盘、服务器等)健康性 服务控制器前后端IO链路 服务控制器后端分布式物理存储健康性 服务控制器各服务网络端口监听情况 服务控制器服务进程的运行状态 服务控制器日志 虚拟存储资源
9.2.2.2 预防性检查
在监控服务的基础上,对虚拟存储资源进行预防性检查,包括:性能检查、脆弱性检查。对虚拟存储资源的预防性检查参见表5,包括但不限于:
表5 虚拟存储资源预防性检查表 服务对象 虚拟存储资源 性能检查内容 检查服务控制器下列场景的数据吞吐带宽、IOPS、响应时间和请求排队时间 -整体 -后端 -控制器间 检查虚拟存储卷访问吞吐率、IOPS、响应时间和请求队列时间 检查各服务控制器cache利用率,做为后端存储优化依据 检查存储资源池分配策略与空间使用率 检查虚拟存储卷后端存储的性能匹配 检查服务控制器日志 检查用户请求的错误率 检查所有服务所接受的请求错误率 脆弱性检查内容 检查服务控制器冗余度 检查服务仲裁控制点健康性 检查服务控制器微码版本 检查存储资源池分配策略避免过度分配 检查控制器存储虚拟化软件版本一致性 检查虚拟存储资源授权的全局性和统一性 检查数据副本数 检查数据保存的出错率 检查数据传输的出错率 检查数据副本的一致性 统计数据恢复的时间
9
9.2.2.3 常规作业
对虚拟存储资源的常规作业参见表6,包括但不限于:
表6 虚拟存储资源常规作业表
服务对象 虚拟存储资源 常规作业内容 SAN拓扑,端口,Zoning配置维护 服务控制器配置备份和恢复 虚拟存储资源划分 虚拟存储资源权限设置 扩充存储资源池容量 制定和实施异构存储资源池数据快照,镜像,容灾计划 存储资源池内数据在线迁移 数据分层管理 维护数据副本数 资源使用情况统计 用户使用情况统计 服务控制器软件升级 更换损坏硬件 日志文件分析和备份 9.2.3 响应支持 9.2.3.1 事件驱动响应
针对虚拟存储资源的软、硬件故障而进行的响应服务,包括但不限于: a) 解决存储虚拟化软件缺陷或故障; b) 解决服务控制器宕机、重启、死机等; c) 解决服务控制器前后端网络故障; d) 数据恢复; e) 硬件损坏更换; 9.2.3.2 服务请求响应
根据应用系统运行需要或需方、服务相关方的请求,而进行的响应服务,包括但不限于: a) 数据统一备份; b) 数据容灾计划制定,实施与演练; c) 数据访问性能优化; d) 数据在线迁移; e) 数据分级存储,降低存储成本; f) 新增主机分配存储空间; g) 现有主机存储空间调整; h) 主机端多路径软件的安装配置。 9.2.4 优化改善 9.2.4.1 适应性改进
根据应用系统特点和运行需求,对虚拟存储资源进行调整,包括但不限于: a) 服务控制器内存、数量和磁盘数量、容量间的配比;
10
b) 根据数据生命周期,进行存储资源分层调整; c) 数据存储平衡算法调整;
d) 服务控制器前后端网络(SAN或IP)端口吞吐速率的调整。 9.2.4.2 增强性改进
根据应用系统的特点和运行需求,通过对虚拟存储资源的运行记录、趋势的分析,对存储设备进行调整、扩容或升级,包括但不限于: a) 存储容量增加; b) 服务控制器数量增加; c) 服务控制器内存容量增加; d) 服务控制器CPU增强; e) 服务控制器前后端网络(SAN或IP)端口增加; f) 存储虚拟化软件升级。 9.2.4.3 预防性改进
根据对虚拟存储资源的运行记录、趋势的分析,结合应用系统的需求,发现存储设备的脆弱点,有针对性地进行改进性作业,包括但不限于: a) 收集磁盘空间的使用情况,及时清理垃圾数据或增加存储设备容量; b) 监控负载情况,必要时增加硬件数量,或提高硬件规格; c) 监控硬件出错率,替换存在问题的硬件; d) 服务控制器微码升级; e) 存储虚拟化软件升级。 9.2.5 咨询评估
通过对虚拟存储资源的运行记录、运行趋势进行分析,根据应用系统的特点和运行需求,提出处理或改进的建议和方案。 9.3 网络资源池
9.3.1 服务实施对象和活动
运维对象是虚拟网络资源(虚拟网卡、虚拟网络资源池、虚拟机网络)和网络设备,基本活动包括例行操作、响应支持、优化改善、咨询评估。 9.3.2 例行操作 9.3.2.1 监控
重点是对虚拟网络资源的运行状态、运行性能、资源使用分配情况进行监控,以便了解其是否满足运行要求。监控应当采用合适的装备与手段,分配专门人员定期或全时段进行监控。对虚拟网络资源的监控内容参见表7,包括但不限于:
表7 虚拟网络资源监控内容表
运维对象 虚拟网络资源 监控内容 虚拟网络资源的健康状态 虚拟网络资源池分配状况 虚拟网络资源的链路状况如端到端时延变化、链路端口工作稳定性、链路负载百分比 虚拟网络资源配置变动监控 11
虚拟网络资源操作日志监控 虚拟网络资源安全事件监控
9.3.2.2 预防性检查
应在监控服务的基础上,对虚拟网络资源进行预防性检查。包括:性能检查、脆弱性检查。对虚拟网络资源的预防性检查内容参见表8,包括但不限于:
表8 虚拟网络资源预防性检查内容表 运维对象 虚拟网络资源 性能检查内容 检查虚拟网络资源健康状态 检查虚拟网络资源CPU使用峰值情况 检查虚拟网络资源内存使用峰值情况 检查虚拟网络资源端口的吞吐率 检查虚拟网络资源链路的健康状况,包括IP包传输延时、IP包丢失率、IP包误差率、无效IP包(包括攻击性IP包、欺骗性IP包、垃圾IP包等) 脆弱性检查内容 检查虚拟网络资源的链路冗余度要求 虚拟网络资源使用度和调度情况评估 虚拟网络资源可用性周期性检查 虚拟网络资源安全事件周期性整理分析 9.3.2.3 常规作业
虚拟网络资源的常规作业内容参见表9,包括但不限于:
表9
运维对象 虚拟网络资源 常规作业内容 虚拟网络资源配置备份及存档 监控虚拟网络资源日志备份及存档 虚拟网络资源日志数据分析与报告生成 虚拟网络资源配置变更文件的审核 虚拟网络资源配置变更的操作 虚拟网络资源配置变更的记录
9.3.3 响应支持 9.3.3.1 事件驱动响应
针对虚拟网络资源故障引起的业务中断或运行效率无法满足正常运行要求,而进行的响应服务,包括但不限于: a) 故障定位; b) 虚拟网络资源更换; c) 中断、连通网络连接; d) 关闭、启动端口; e) 更改、恢复配置; f) 停止、启动进程; g) 虚拟网络资源重新调配。 9.3.3.2 服务请求响应
12
根据应用系统运行需要或需方、服务相关方的请求,而进行的响应服务,包括但不限于: a) 增加、降低虚拟网络资源网络接入数量或速率; b) 更改虚拟网络资源配置; c) 启动、关闭端口或服务; d) 更换、更新或升级虚拟网络资源硬件或软件; e) 调配虚拟网络资源。 9.3.4 优化改善 9.3.4.1 适应性改进
根据应用系统特点和运行需求,对虚拟网络资源进行调整,包括但不限于: a) 设备或链路负载调整; b) 安全策略调整; c) 监控对象覆盖范围调整; d) 路由策略调整; e) 局部交换优化; f) 局部冗余优化; g) 虚拟网络资源调配。 9.3.4.2 增加性改进
根据应用系统的特点和运行需求,通过对虚拟网络资源的运行记录、趋势的分析,对虚拟网络资源进行调整、扩容或升级,包括但不限于: a) 虚拟网络资源调整,如CPU、内存、端口的调配、扩容回收 b) 虚拟网络资源网络架构变动; c) 网络架构容量变化,如网络子系统的增减等; d) 系统功能变化,如新增安全系统、新增审计系统等; e) 路由协议应用及部署调整; f) 整体安全策略收紧; g) 虚拟网络资源冗余优化。 9.3.4.3 预防性改进
根据对虚拟网络资源的运行记录、趋势的分析,结合应用系统的需求,发现虚拟网络资源的脆弱点,有针对性地进行改进性作业,包括但不限于: a) 配置参数优化,例如虚拟网络资源的VLAN、QoS、ACL、带宽等; b) 部署路由策略情况下端到端选路变化、端口流量变化、路由条目变化 9.3.5 咨询评估
咨询评估服务包括但不限于: a) (整体或局部)虚拟网络资源实际负荷与承载能力分析; b) (整体或局部)虚拟网络资源预期负荷与承载能力分析与建议; c) (整体或局部)虚拟网络资源架构变动分析与建议; d) (整体或局部)虚拟网络资源路由策略变动分析与建议; e) (整体或局部)虚拟网络资源安全策略变动分析与建议; f) (整体或局部)虚拟网络资源配置调优分析与建议等。 9.4 机房基础设施、软件和数据
13