1 引言
由于Internet中信息的数量呈指数级增长,其中的主要信息是Web信息,因此,基于单一系统映像的Web服务器集群系统是满足当前应用的有效方法。该方法把若干性能较低的服务器用局域网连成一个性能较高的整体,即Web服务器集群[1],系统结构如图1所示,前端分发器依据一定的原则将客户请求分发给后台服务器,后台服务器执行客户请求后返回给客户,使其从客户端看来就如同一台服务器。图1 Web集群系统模型图 高可用性是Web集群系统提出的三大目标(高性能、高可用、易扩展)之一,它起初主要是利用系统中后台服务的冗余来达到系统的高可用性,但是随着研究的深入和基于内容的前端分发器的发展,并不要求后台服务是同一的,这就增加了系统的灵活性,提高了处理机的利用率,同时允许系统进行动态配置,如负载均衡调度等,这也给系统可用性设计与调度提供了更多的要求。但值得指出的是:一直少有对系统可用度的研究,特别是利用数学模型建模来进行定性与定量分析的实时容错调度算法研究。现有的可用度研究大多只针对冗余服务的可用性,而对它们的性能考虑得不够全面[2,3]。 本文的研究工作主要在于:首先对Web集群系统运用Markov模型描述了其可用性,从理论上建立了集群高可用模型。然后,着重针对Web集群系统中区分服务对不同请求采取不同的服务质量,对可用度的指标要求也不相同的情况,提出了一种基于概率的实时容错调度算法,算法采用了请求的主从备份技术。通过延迟从备份请求重新转发时间,来为可能因处理机故障而执行失败的主请求实现容错功能,并通过对无错时停止重发来提高处理机的利用率和系统对任务的接收率,实验结果证实了算法的有效性。