最常见的近红外光谱的预处理技术的综述(4)

2019-03-10 15:35

其中,m中的点数平滑窗口围绕电流测量的点i

2. 对于一阶求导,以区别两个平滑值与一个给定他们之间缺口大小(大于零);对二阶求导,

采取两倍的平滑值点我和平滑值在一个间隙距离两边:

图14派生的影响在添加剂(绿色)和添加剂加上乘法(红色)的影响。蓝色光谱是光谱没有任何补偿,黑色虚线是零线。

xi'?xsmooth,i?gap?xsmooth,i?gapxi''?xsmooth,i?gap?2?xsmooth,i?xsmooth,i?gap(13)

可以看到从方程(13),实际的推导模仿一个有限差分(方程(10)和(11))。通过应用一个平滑之前的计算,通过引入一个缺口大小的问题,降低信噪比降低。

在文学、NW推导往往是紧随其后的正常化修正光谱。诺里斯和威廉姆斯[20]提出了规范化光谱强度相当于在一个选定的波长,但更复杂的归一化方法可以使用。使用一个缺口很难捍卫在近红外光谱。这个概念经常使用的一个缺口,如果有一个(固定)频率分量在数据,大小的地方缺口将对应于两峰之间的距离值的信号。然而,在光谱学,有通常没有这样的背景频率的贡献。西北的衍生作品由于高度的co变异和平滑的近红外光谱和不一定由于光谱推理(见图16)。

一个有趣的注意在西北存在推导几个设置(组合的差距和平滑窗口),给相同的估计导数。再见。数,三分的差距有五个平滑等于一个四点平滑与一个缺口大小的三个;类似地,一个threepoint平滑有缺口的七是一样的sixpoint平滑与一个缺口大小的三个。这可以推广到m点平滑与一个缺口大小的k等于一个k 1点平滑和一个缺口大小的m。 4.2Savitzky-Golay推导

Savtizky和戈利(SG)[21]推广一个方法推导的数值一个向量,包括一个平滑的一步。为了找到导数在中心点我,一个多项式拟合在一个对称窗口的原始数据(参见图17)。当参数对

于这个多项式计算,任何顺序的导数的这个函数可以很容易地发现分析,这个值随后被用作导数估算出这个中心点(参阅图。18)。这个操作是应用于所有分光谱顺序。点的数目用来计算多项式(窗口大小)和程度的拟合多项式都决定要做,。最高的衍生物,可以确定取决于学位的多项式拟合过程中使用(即一个三阶多项式可用于估计的三阶导数)。

图15估计的一阶导数,诺里斯威廉姆斯。支持率窗口用于平滑,和一个缺口大小3应用于派生。

我们注意到有一个内在的冗余的层次结构SG推导。对于每个派生,随后的两多项式适合将给相同的估计的系数。第一导数,一个一级多项式和二级多项式将给出同样的答案(如将第三和第四度)。对二阶导数,第二和第三等级的多项式将给出同样的答案(如将第四和第五度),等。当这个方法是首先引入了Savitzky和戈利[21],它仍然是计算繁琐的计算参数的估算导数。出于这个原因,作者报道一组表列值几个不同类型的衍生品和多项式组合。然而,错误在他们的第一篇文章介绍了,Steinier et al。[22]发表一个修正和扩展版本的原始表。这些餐桌是后来甚至进一步扩大,发狂[23]。然而,随着现代计算机,不再有任何真正的需要为这些表。

原始形式的NW,SG推导使用对称窗口平滑,要求数据点的数量在每一边的中心点是相同的。因此,忽视一些点技术在每一端在预处理。为NW推导,点的数目失去了数等于分用于平滑加上差距的大小减去一个。对于SG推导,点的数目失去了数等于分用于平滑减一。因此吸收更多的点NW推导比SG推导。如果谱向量是长(即超过500点),这个问题不重要,但是,对于较短的光谱(例如,二极管阵列仪器),这个损失的波长可能是重要的。

天天p和舍伍德在1980年[24]和[25]天呀在1990年提出一个解决方案,包括使用一个基于非对称多项式拟合的终端窗口。在实践中,这意味着米的第一个得分谱估计从2 m + 1

第一分光谱,和一个类似的估计去年米点。然而,这样的解决方案将介绍,显然工件精度的衍生品随距离中心点(m + 1)。此外,估计的端点并不拥有内在的冗余提到:没有两个后续的SG多项式秩序配件将给相同的估计。此外,估计的潜孔导数相等的所有端点如果谱是平滑的潜孔秩序多项式。

NW推导类似于有限的差异,但引入了平滑和缺口大小为counteractions在估计衍生物光谱保持信号-噪音比例。这两个步骤在NW派生或多或少是独立的。然而,SG推导使用更多的常见的过滤技术来估算导数光谱,而不是使用有限差分方法,适合一个多项式通过一系列的点来维持一个可接受的信噪比。一般来说,NW,SG派生不给相同的估计。唯一的一双设置,让相同的结果是三个平滑分两,SG使用一阶多项式配合,在西北气隙的大小等于1。然而,更复杂的(和现实)设置为SG和/或NW自动导致(稍微)不同的推导的结果。

图16诺里斯威廉姆斯二阶导数使用9点平滑和一个缺口大小的3。

5. 间隔和联合版本

提到的预处理技术迄今为止,只有估计的衍生品是由一个移动窗操作,只有一个本地部分(窗口)的光谱用于任何时间估计校正。然而,所有其他的方法同样能够在一个窗口明智的方式执行。

伊萨克松和科瓦尔斯基[26]建议这详尽分析,并将其命名为分段MSC(PMSC)。Andersson[27]预处理方法相比替代两个版本的PMSC:移动窗或当地的预处理(划分成几部分波长轴和执行预处理在每一个部分分别)。

这个移动窗版本的预处理技术获得了一些利益,从近红外光谱的社区,可能是因为正确的选择的窗口大小是至关重要的,它是远离琐碎要正确做到这点。过小窗口会导致引进大型

工件在纠正光谱和降低信噪比。然而,更大的窗口的大小,较小的完整和移动窗之间的区别预处

图17估计的,Savitzky-Golay一阶导数。 支持率窗户,一个二阶多项式是用来平滑

理(见图19)。本地窗口预处理是有用的,尤其是在记录的情况下测量光谱从视觉范围或短波近红外光谱的中期红外范围。在这个宽光谱区,几个不同的散射问题并存,和光谱应该相应的分割,执行单独的散射纠正在不同的部分。然而,由于这不是本质上不同于在区域划分光谱的预处理方法,应用独立,我们不讨论它进一步。

使用预处理方法的组合是丰富的文学,原则上,任何序列的预处理是可能的。然而,以下简单的规则可以作为最初的指导方针。

1) 散射校正(除了标准化)应该被执行之前,分化。这些技术都是设计用于修正原始光谱,

从未被认为是修正一个分化或基线纠正谱。

2) 可以使用规范化的两端校正,尽管它是容易评估正常化的影响如果是任何其它操作之前

执行。

3) SNV之间的基本差异与随后的消除趋势和MSC与参考和基线校正是,在MSC,同时应

用两个修正,而不是连续的。因此,通常会给一个较小的MSC基线校正比SNV加德趋势。

4) 其次是SNV执行de趋势并不推荐Barnes et al。[13],基于以上原因,不推荐进行消除

趋势第一。 6. 一个定量的例子

图18Savitzky-Golay估计的二阶导数使用9分和一个二阶多项式的平滑。

现在我们将应用所有的预处理方法的讨论到一个定量分光任务涉及32杏仁蛋白软糖样品测量六非常不同的光谱分析仪作为预测变量两种不同的响应变量:水分和糖含量。这些数据来自一项由克里斯腾森et al。[3]。图20显示了一个,光谱集。对于一个总结的数据,见表1。在这里,我们展示了pls回归模型,建立所有的六个近红外光谱仪器,和响应分别(所谓的PLS1模型[5])。

杏仁糖近红外光谱数据集是不同的预处理技术处理本文中描述的。除了设置用于理论部分,一些更极端的参数设置进行估算,以显示分段MSC使用合理的选择的重要性。没有样本被看成是例外,因为所有样本表现不错在最初的探索性分析。引导错误估计[28]被用作验证方法。共有1000引导图纸进行每种组合的数据集、引用和预处理。同一套图纸是用于所有数据集,除了仪器1,只有十五32样品进行了测量。0.632引导估计的预测误差进行了计算见方程(14),按照Wehrens et al。[28]

RMSEf?0.368?RMSEf?0.632?RMSEPf(14)

其中RMSEf预测误差估计并且RMSEf和RMSEPf一般的校准(样本每一个引导得出选择)和预测(不是每一个样本选择引导画)错误在所有引导图纸。最优数量的因素,f,是决定基于0.632引导估计,选择第一个最低或的地方RMSEf曲线作为函数的因素变得平缓(RMSEf曲线的斜率是常数)。


最常见的近红外光谱的预处理技术的综述(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:工商企业管理专业人才培养方案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: