图九 11号电机功率概率分布图
图十 13号电机功率概率分布图
9
图十一 14号电机功率概率分布图
为定量比较各分布函数的拟合效果,定义拟合指标:
I??(yi?Ni)2,yi?i?1Mf(Ci)
式中:i?1,2,?,M,其中M为频率分布直方图的分组数;Ni和Ci分别为第i个直方柱的高度及中心位置;f为拟合的概率密度函数;yi?f(Ci)在中心位置Ci上拟合概率密度函数对应的值。拟合值表I越小,拟合越精确。
将拟合分布时得到的参数代入得到相应的拟合的概率密度函数,并按照定义的拟合指标与频率分布直方图分组中心高度值进行运算后课得下表:
表一 各个电机的拟合值分布表 电机编号 正态分布 Logisic分布 T分布 7 0.0119 0..01011 0.0072 9 0.0105 0.0087 0.0059 11 0.0121 0.0106 0.0089 13 0.0137 0.0117 0.0085 14 0.0103 0.0088 0.0066
故从表中可知,按照定义的拟合指标,t分布为最好的拟合分布。5个机组不同分布对应的拟合指标差异明显,但是都满足正态分布的指标大于logistic分布的指标大于t分布指标的规律。 对于以日为时间窗宽的情况下,仍然去掉连续功率为0的区间后采用滑动平均法获取波动值数组,使用由前面得到的最好的t分布进行检验。由于MATLAB中并未直接提供t location-scale分布的分布积累函数,因此不能直接使用MATLAB自带的kstest函数以Kolmogorov-Smirnov方法进行分布检验。由于拟合得到的分布函数经计算得到在|x|>1000时对应的概率已经非常小,故本文采取以-2000作为积分下界代替t分布积分下界为负无穷的情况,对于概率密度函数存在题目涉及范围到的x的情况下有从-2000至x的数值积分视作该分布在x处的积累分布函数。通过该替代后使用kstest函数进行检验,发现日时间窗宽内波动情况仍然满足t分布。这说明30日的总分布不会受到每日分布不同间的相互抵消,而是由日分布积累叠加而成。
问题二: 模型建立:
每分钟取样一次所得的数据密度较5s取一次小很多,因此直观上认为数据将更平滑,更容易服从已知分布。使用与问题一同样的方法进行计算与拟合即可。
10
模型求解:
对所给源数据每隔11个抽样一次,然后与问题一类似地处理数据后画出频率分布直方图并进行拟合。得到的结果如下:
图十二 7号电机功率概率分布图
图十三 9号电机功率概率分布图
11
图十四 11号电机功率概率分布图
图十五 13号电机功率概率分布图
图十六 14号电机功率概率分布图
计算可以拟合指标值分别为:
表二 各个电机的拟合值分布表 电机编号 正态分布 Logisic分布 0.0054 0.0047 7 0.0048 0.0041 9 0.0049 0.0044 11 0.0059 0.0051 13 0.0046 0.0040 14
从图像和计算均可得知,t分布对于1分钟为间隔的波动情况同样可以得到
T分布 0.0042 0.0036 0.0041 0.0044 0.0035 最好的拟合结果。
问题三:
模型的建立与求解:
由于在计算时按分钟间隔取样,则一分钟之内仅能得到一个数值作为一分钟
12
功率的代表值,无法对于较小时间尺度的波动进行监测,只能反映在分钟尺度上
I?I'???100%I的功率波动情况。不妨定义为波动信息损失率。I为实际测量
有意义的最小时间尺度的波动拟合指标,I’为目标需要比较的时间尺度下的波动
拟合指标。可以认为,当波动信息未损失时,波动将呈现更多的随机性,此时典型分布拟合度越差,反之波动信息越少,拟合越平滑。在问题一和问题二中的反应为问题二中的数据相同分布拟合程度都比问题一的要好。有理由适当外推相信,当时间尺度很大的时候,所取的点很可能稳定在均值附近,波动度为0。
问题四: 模型建立:
初步判断,各个电机之间互相叠加,由于风在空间大尺度上也存在不均匀性,故不同的电机之间所得的数据会相互正负抵消一部分。将数据求和,同样做出频率分布直方图拟合。
模型求解:
通过用MATLAB编程可以做出图像,结果如下:
图十七 1分钟的总功率概率分布图
13