多变量光谱分析-自学教程(5)

2019-09-02 13:26

统以所有组分循序出现-衰减的顺序提供浓度曲线。

渐进因子分析

在常规因子分析计算系统的成分(因子)数,它相当于求数据阵X的秩,即协方差Z=X’X的对角化阵的非零特征值数。Z的特征值与其行和列的次序无关。某些测定系统中(如色谱),所得谱图是随着洗脱过程按一定次序排布的,就是说在数据X中隐含着“顺序”的信息,这种信息在常规因子分析中未被利用。渐进椅子分析的基本思想是按照洗脱过程的进展,来跟踪X子阵的秩的变化。洗脱过程中,当某一成分出现时,子阵的秩会显著的增大,当某一成分消失时,子阵的秩会显著的减小。 初级渐进因子分析

首先对原始数据阵[X]进行主因子分析或奇异值分解,便可产生S个有意义的因子。第一个子阵X1由原数据阵X的第一列组成,第二子阵X2由[X]的第一、二列组成,第三子阵X3由[X]的第一、二、三列组成,依此类推。计算各个子阵的特征值。

把计算得到的特征值作为洗脱过程的函数作图。因为特征值通常跨越几个数量级,所以取其对数值更适合于图形的表示:一个较大的有意

义的特征值出现就意味着一个新的吸光化合物在洗脱过程中形成;在洗脱过程的任意阶段,如果有新的与已有化合物线性无关的化合物流出,则就有一个新的特征值开始以较大的正值出现;如果新加的测量值只包含原来就有的混合物的信息,那么,将会计算出另外的新的特征值。在完成以上的分析步骤后,再从数据矩阵相反方向重复类似于步骤2和3的方法重新计算特征值,即对数据矩阵的后i个列组成的子矩阵重新进行特征值分析:得到特征值的对数对洗脱过程的逆过程作图,这一步称为反向EFA;在此过程中新的因子(较大特征值)的逐渐出现表示成分随洗脱过程而消失。将第j条正向EFA所得的曲线和反向EFA的第(s+1-j)条曲线合并,这样就得到如图所示的多个成分的相切范围,这一范围被称为“浓度窗口”。用这种方式联结成的曲线类似于真实的成分分布曲线并称之为抽象成分分布曲线。

HPLC-DAD的结果为一数据点表X(P×Q), 在数据表中,行P为在规定的时间间隔侧得的吸收光谱。列Q为在不同波长上测得的的吸收。图1数据表拥有时间和波长两个坐标轴。每一行对应于一个在一特定时间测定的光谱(Fig.1a)。每一列可

以看成一张在特定波长下侧得的色谱图。对应的,可以将这一数据点表看成一组连续测量的光谱;或者看成在不同波长下侧得的色谱图的堆积。HPLC有两种方法将混合物分离成不同的纯的物质。大部分情况下,人们会采用优化色谱仪参数,如固定相和流动相的组成以及温度,来达到分离的目的。这种方法比较繁琐。在这种情况下数值反褶积的方法应运而生。依据一些对根本数据的基本假定,如非负假定,各种各样的自模拟曲线分辨方法被用来将重叠的峰分成单独的化学物质。这些方法的最终目的是在不对化学组分以及每种组分的光谱和浓度曲线的形状和位置进行假设的前提下计算出它们。

在进行计算时有两个步骤:1)探测化学组分数和它们相应的位置;2)确定浓度曲线和光谱。EFA特别适合用来进行第一步的计算。为了对分析系统进行详尽的数学描述,数据矩阵X必须分解成C(P×N)列因素矩阵(如一浓度矩阵)A(N×Q)行因素矩阵(如一摩尔吸收系数矩阵)和一噪音矩阵E(N×Q)。其中N为出现的物质种类数,写成矩阵的形式为X?CA?E。

EFA的根本观点是跟踪数据矩阵X的秩(rank)随着规定变量的变化,可以通过对增加的数据矩阵进行PCA分析。从数据矩阵的第一行开始,如第一个测量的光谱,计算出所有子矩阵Xi的特征值(eigenvlues)。Xi是通过X前i=1…P行形成的。

根据Xi?SL?E, 其中S(i×N)为得分矩阵,L(N×N)为装载矩阵。正确地确定N是最先和最重要的一步。首先要计算出所有的Q个特征值;举例来说,矩阵S的大小开始时i×Q, 矩阵L为Q×Q。对于第一个子矩阵X1(由X数据表的第一行组成 Fig.2a),要计算出其特征值。然后加上第二行并计算出此矩阵的特征值(Fig. 2b.)。然后对前三行进行PCA分析(Fig. 2c.),等等。在每一步都要加上一行并且对其进行PCA分析,直到对整个数据矩阵X进行分析。此一步为前向渐进因子分析。

这些特征值或者它们的对数被用来对观察变量的顺序进行作图。为了使图像清晰,我们用先将所有顺序点的第一个特征值链接起来,再将所有顺序点的第二个特征值链接起来,等等。当特征值增加并大于噪音水平时,意味着一个新的成分的出现,导致秩的瞩目增加一个。实际上,理论上化合物的种类很容易地能够从EFA上找出,即为特征值高于噪音水平的数目,数据矩阵的秩,等于潜在的化合物种类数目。

类似EFA,我们可以进行反向渐进因子分析。

结束

b、 限制条件

非负性:这一限制条件要求生成的浓度曲线为正值。可以在计算时将

负值用0替换或者直接利用相应的程序,如非负最小二乘法或者快速非负最小二乘法。

单峰态:每一物质的浓度曲线要求只有一个峰值出现。 封闭性:即为质量守恒。 与已知纯物质的光谱相吻合。 ……

多元曲线分析结果的不确定性

多元曲线分析中的不确定性与不确定性和噪音的传播有关系。不明确的概念意味着浓度曲线和光谱的不同组合可以以同样的拟合效果再生出原始数据表。我们可以观察到三种不同的不确定性: 1、 排列的不确定性

MCR组分的排列是无规则的。所以,它们可以在浓度矩阵和光谱矩阵内进行互换位置,但是浓度矩阵和光谱矩阵要一一对应。 2、 强度的不确定性

一对组分在浓度曲线和光谱上拥有同样的形状但是不同的相对比例可以再生出同样的原数据矩阵。这就解释了为什么Ci和SiT中浓度值和纯光谱强度可以选择任意强度,除非有可用的实际强度的参考信息。对浓度曲线或者分析出来的光谱进行归一化或者参考光谱的使用可以抑制强度的不确定性。


多变量光谱分析-自学教程(5).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:2017尔雅走进黄帝内经最新答案+期末考试答案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: