宝鸡文理学院
论文题目:校园网络流量估算模型
09级姓名:王军涛 系别与专业:数学系数学与应用数学 09级姓名:李静 系别与专业:数学系数学与应用数学 09级姓名:马华璐 系别与专业:物理系测控技术与仪器
校园网络流量估算模型
摘要
随着时代的发展,校园网已经在各个高校相当普遍,由于网络互联环境的复杂,导致了网络的可靠性越低,网络服务越容易出现问题,网络的性能就更容易受到影响。传统的网络管理是在网络报警之后,根据网络日志或网络提示解决潜在的或已经出现的问题,是一种响应式的行为。这个时候的网络服务可能已经受到影响。为了使学校的网络部门提前处理掉潜在的问题,从而使校园网络能更好的服务学校的教学和生活,我们必须精确地估计和预测校园网流量的数据高峰,从而对校园网流量的周期性、突发性作出准确地预测,以达到防患于未然。为此,我们以某学院某个周期(一周内)按照固定时间间隔统计的两个核心服务器的网络发送请求数据(单位:字节)和收到数据(单位:字节)以及平均发送和收到的数据(单位:字节)信息为依据,通过数学建模提出了一套完整的预测方案。具体做法如下:首先,我们基于自相似性提出了校园网络模型为:
其次,从所给数据我们分析得到了每天各个时间段的网络流量有较大的差别,为此根据数据流量的多少,我们将每天划分为网络高峰期,正常期,空闲期三个时期,并采用了R/S分析法表示出了自相似性参数H的表达式,然后通过MATLAB软件编程计算出了上述三个时期H的值分别为H1?0.844,H2?0.735H3?0.713 接着我们通过相关的流量数据和每天各个量得数据关于时间的走势图对校园网络实际流量数据周期性、突发性进行了分析,得到结论是七天中每天都是有周期的,但是每天的最高峰,最低峰都是不同的,每天的流量都会对本周的流量产生影响,而且波峰总在星期六和星期日之间游动,波谷总在星期二和星期四之间游动随后我们通过题中所给的数据对我们的预测模型进行了验证与检验,发现我们预测的与实际测量的比较接近。最后我们通过所建的模型以及得出的结论对相关部门提出了如下建议1.加强校园网络安全管理;2.构建多功能校园网络系统,实现网络资源高度共享;3.网络速度慢,稳定性差,制约了社会对学校的关注度;4. 师生共同建设高水平的管理团队,取长补短,完善网络应用及维护;5.实行同域内高校共建主干网,分而自治,加强网络信道的建设。
r(k)?2.6?(k?11,5?2k1.5?k?11.5)k?1,2,3?关键词:自相似性 长相关性 Hurst参数 R/S分析方法
1
一 问题重述
随着时代的发展,校园网已经在各个高校相当普遍,精确地估计和预测校园网流量的数据高峰,可以对校园网流量的周期性、突发性作出预测,以便于学校的网络部门提前做好预案,更好的服务学校的教学和生活。本题给出了某学院某个周期(一周内)按照固定时间间隔统计的两个核心服务器的网络发送请求数据(单位:字节)和收到数据(单位:字节)以及平均发送和收到的数据(单位:字节)信息的详细统计资料。
按照这个实际统计资料完成下列题目:
1、提出校园网流量模型(可以基于自相似性);
2、基于小波构造与小波包分解估计Hurst自相似性参数H的算法;
3、利用MATLAB求解校园网络实际流量数据的自相似性参数H,并给出实现过程;
4、给出校园网络实际流量周期性、突发性分析;(参见《基于流量特性的校园网网络性能分析与研究',》第三章)
5、利用所给数据对你所建立的校园网络流量预测模型进行检验与验证;(参见《基于流量特性的校园网网络性能分析与研究',》第四章)
6、根据你所做的模型对学院网络相关部门给出一些合理的建议。
二 问题分析
要对校园网流量的周期性、突发性作出预测,我们必须提出一种可以预测校园网流量的周期性、突发性的模型,并且对模型的正确性进行检验和验证,从而便于学校的网络部门提前做好预案,更好的服务于学校的教学和生活。
对于第一问,我们基于自相似性,在网络流量分析中,根据在时间维度上表现出自相似性的流量时间序列,由表中所给流量数据,将一周期七天的数据进行拟合,具体是分别拟合出这七天的的最大接收数据流量、最大发送数据流量、最小接收数据流量、最小发送数据流量、平均接收数据流量、平均发送数据流量。由图象初步判断网络流量不管在哪个分辨率上都表现出相同的特征,具有自相似性。我们通过建立自相似的模型得出自相关函数
对于第二问得求解,要估计Hurst的自相似性参数H,有以下几种方法:小波分析法;频域潽法,R/S方法。由于小波分析法只用了分解得到的小波系数,丢失了对尺度系数的信息分析,因此,估计出的参数不太准确,会偏大,所以我们采用比较精确且操作简便的R/S方法。并利用MATLAB编程,求解校园网络实际流量数据的自相似性参数H。
对于校园网络的周期性、突发性,主要采用Hurst参数H描述随机过程的自相似程度,反映流量的突发特征,当1/2〈H〈1时随机过程是自相似的。H越大,则流量越呈现为突发。若H=1/2则,随机过程是不相关的。
第五问,我们采用表中所给数据,从中抽取几组数据,通过所抽取的数据,我们建立了季节预测模型,并采用上述模型对6月15日的流量变化图与实际流量图进行比较,从而验证了预测流量的合理性。
第六问我们通过所建的模型以及得出的结论进行了阐述。
2
三 模型假设
1.所有监测数据无误,校园网长期运作情况符合7天监测数据的统计规律。 2.连接到每一个节点的网络用户总数在一定时期内几乎不变。
3.就每一个节点而言,连接到该节点的用户没有差别,即他们对流量(包括流入和流出两个方面)的贡献相同。
4.把网络用户按网络使用流量的多少不同分类,各类别中用户使用的流量无差别。
5.所考虑的网络故障问题仅由用户数量或流量引起,与其他因素无关。 6.正常运行时的网络流量保持相对平稳,即只在统计平均值上下作小范围波动。
四 符号说明
1、H:Hurst参数
2、E?xi?:经过平滑后的X期望 3、 u:X的恒定均值 4、j: 每日得时间段序号 5、t:代表总的时间段序号
6、 Tij:每个时间段流量的大小
7、Ti :日平均值
8、gij:每个时段流量与当日流量的比例系数
9、m:任意的自然数
五 模型建立及求解
5.1 模型的建立与分析:
5.1.1.自相似校园网络模型:(选取的计算数据见附录1)
设
X?{xj:j?1,2,??????}为协方差平稳的随机过程,即X具有恒定均值
,其自相关函数
u?E[xi],和有限方差
2???E[(xi?u)]r(k)?E[(xi?u)(xi?k?u)]? 仅与k有关,假设X的相关函数具有如下形式:
3
r(k)?k??limL1(tx)/L1(t)?1L1(k),当k??,其中0???1,L1满足?x?0,有t??
令
Xk(m)?(Xkm?m?1???Xkm)/m(k?1,2,3?)为?Xi?的m阶平滑过程,并记
时间序列
X(m)?(X1(m),X2(m),?)的自相关函数为r(m)(m?1,2,3?)由自相似定义1:过程X被称为严格二阶自相似的且由自相似系数
H?1??/2,如果mr(m)(k)?r(k)阶平滑过程X(m)具有与原过程X相同的相关函数,即
对所有m?(1,2,3?)都成立。
有定义2我们知道过程被称为渐进二阶自相似的,且具有相似系数
H?1??/2如果
r(m)?21221???1,当m??
)r(m)k??(k22??当m??k?(2,3?)
式中?(f(k))表示作用在f上的二次差分算子,即
?(f(k))?f(k?1)?2f(k)?f(k?1)
2最后再以AMAR参数为滤波器系数进行滤波的结果,分型高斯噪声的自相关
函数满足:
r(k)??22(k?12H?2k2H?k?12H)k?1,2,3?
当时,分形高斯噪声为具有Hurst系数为H的严格二阶自相似过程。 代入表格中的数据我们得到:
r(k)?2.6?(k?11,5?2k1.5?k?11.5)k?1,2,3?
5.2模型的建立与分析:
R/S分析法的基本内容是:(计算所用数据见附录2)
对于一个时间序列{xt},把他分为A个长度为N的等长子区间,对于每一个区间,设
txt,n??(xu?1u?Mn)······ (1)
t,n其中,Mi为第n个区间xu的平均值,X4
为第n个区间的累积离差,令