主元数(m) 1 3 5 10 18 (预测标准误差)SEP 0.0223 0.0073 0.0068 0.0064 0.1101 (复相关系数)R2 0.9485 0.9921 0.9953 0.9961 -0.0545
讨论:由模型回归和预测分布散点图以及误差分析表格可知,当主元数较少时,PLS算法可以获得较好的回归精度和预测精度。但当主元数接近样本组分的个数时,则会使模型回归和预测能力都减弱,甚至不能对模型进行预测。实验仿真发现,对样本进行均值化处理模型预测精度没有未进行均值化处理的高。
4.2.3 分析不同噪声水平在PLS下对预测的影响
根据Xtrain和最初设定的主元数8,以及PLS1算法,可求得预测值。观察不同噪声强度m下的散点分布图:
噪声强度系数m 5 10 20 50 预测标准误差(SEP) 0.0066 0.0133 0.0255 0.0547 复相关系数(R2) 0.9954 0.9867 0.9393 0.7504
讨论:由以上散点分布图和误差表格可知,当噪声水平较小时,PLS下模型的预测能力较好。但当噪声强度逐渐增大时,模型预测能力亦越差。当噪声强度系数过大时到和X中的数据大小相当时,PLS算法不能很好地实现模型预测。