拉曼多元曲线分辨技术
Raman Multivariate Curve Resolution
(MCR)
拉曼多元曲线分辨技术是通过研究溶质溶解对溶剂结构的影响来研究溶液中分子之间的相互作用。其结果能够揭示溶质溶剂化层的振动光谱的变化,从而从新的角度来研究溶剂化。这种方法在很多关键的方面不同于以往的差别,溶剂化层,和溶剂化层扰动光谱。特别地,就溶剂或者溶质产生光谱的形状,这种方法也不做任何假设。1与传统方法不同的是,这种方法提取出来的结果都为正的光谱,对应于溶质诱导产生的振动光谱。这种光谱的特征峰与孤立溶质(要求溶液为稀溶液)的溶剂化层有关,不等同于在高浓度溶液下的光谱。2更确切地说,溶质诱导光谱不仅包含溶质本身的特征峰而且包含受溶质扰动的溶剂的特征峰。1 首先我们测得需要导入的不同浓度溶液(通常为1-5wt%)的拉曼光谱。然后我们利用多元曲线分辨(Multivariate curve resolution, MCR)的方法3来提取溶剂本体以及不同浓度溶液的溶质诱导光谱。在应用MCR的方法来提取测量光谱中的溶质扰动部分时涉及到以下关键的假设:每套光谱都是两种组分的线性组合,并且这两种组分的权重都为非负;这两种组分中的其中一种必须和溶剂本体的光谱相同,而另外一种组分包含溶质扰动的信息。这就要求溶液的浓度要足够稀,以至于可以忽略溶液中溶质与溶质之间的相互作用。
应用实例
Dor Ben-Amotz1利用MCR技术研究了多种溶质(乙腈,丙酮,吡啶,四氢呋喃和环己烷)对水结构扰动的振动光谱特征。经过MCR处理的光谱能够揭示新的OH
伸缩振动峰。这种新峰来自于水分子与极性溶质的相互作用。产生的新峰的振动频率较高,表明与本体溶液中的水分子相比这些水分子收到较弱的氢键作用。在一些情况下,会出现两个清晰的OH伸缩振动峰。这表明有两种不同的水的结构或者两种不同的氢键。另外,Dor Ben-Amotz发现溶质的极性会扰动1,2-二氯乙烷溶剂中溶剂化层的斜式-反式构象平衡。
MCR数据处理方法
1多元曲线分辨-交替最小二乘法(MCR-Alternating least squares)MCR-ALS
MCR-ALS是一种基于双线性的化学计量学方法,对于一个二维光谱数据矩阵D表示如下:
D=CSt+E
其中D和E分别是光谱矩阵和误差矩阵,C(m*N)是浓度变化矩阵,St(N*n)是纯物种光谱矩阵,m是时间扫描点数,n是波数点数,N是化学组分数。
2多元曲线分辨
多元曲线分辨对数据的要求是3:实验产生的数据为双线性的数据矩阵,各个数据矩阵所代表的化学成分相同并且矩阵之间相互独立。多元曲线分辨首先将各个数据矩阵堆叠从而建立一个扩展的二维数据矩阵。新产生的二维数据矩阵其中的一维与扩展前相同。具体的扩展方法见图1。然后可以对新生成的扩展矩阵进行多元曲线分辨分析。在利用交替最小二乘法优化解时,可以加入来自于数据结构的限制条件。3
图1.将几个二维矩阵扩展成为一个新的二维矩阵的方法。1a列式的扩展矩阵;1b行式的扩展矩阵;1c管式的扩展矩阵
多元曲线分辨分析方法是基于展开的扩展的列式数据矩阵。以下是这种方法的简介。
多元曲线分析假设实验数据遵循线性模型,如同吸收光谱遵守比尔吸收定律(Lambert-Beer’s law)一样。按照矩阵的方式,这种模型可以写成
D=CSt+E--------------------(1)
D为在某一变量(时间,pH,浓度等)为不同值时采得的光谱所组成的数据矩阵。C和S为与浓度和物种光谱有关的数据矩阵。E为实验误差。以上三矩阵的维数分别为D(I*J),C(I*N),S(J*N)和E(I*J)。I为被用来分析的光谱的数量。J为每个光谱的点数。N为样品中物种的种数。曲线分辨的主要目的是通过对D矩阵分析反解出真实的C矩阵和S矩阵。可以从测试纯的物质或者从渐进因子分析中可以获得C矩阵和S矩阵的初始值。进而通过利用交叉最小二乘法迭代地解方程(1)而优化C矩阵和S矩阵。在优化的过程中,每次迭代都会产生一个新的C和S矩阵:
C+D*=C+CST=ST and D*(ST)+=C(ST)(ST)+=C
D*是PCA产生的数据矩阵,用来选择组分数。C+是C的伪逆矩阵。(ST)+是ST的伪逆矩阵如果能够正确地选择物种的数量,C和ST就分别为满秩列矩阵和满秩行矩阵。在每次迭代循环中都可以加入以下限制条件:(1)非负性;(2)选择性和零浓度窗口;(3)单峰性;(4)封闭性。
3主元分析-principal component analysis(PCA)
主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。即在力保数据信息丢失最少的原则下,对多变量的数据进行最佳综合简化。主元分析被广泛地用来处理光谱数据而获得样品中的主要信息。4-7下面以一个简单的模型来介绍主元分析。
假设有m个变量来描述n个样本,这样得到的数据就形成了一个m×n的矩阵Xm×n。
?x11x12?x21x22?X??????xn1xn2??x1m???x2m????
??xnm??假设X有p个特征值以及对应的特征向量为:
??,u?,??,u?,…,??p,up?
1122??1??2????p
?u1i???u2i???ui???????umi?
i=1,2,…,p (p≤m)
由特征向量组成的载荷矩阵为
???U??u1,u2?up??u11u12?u21u22????????um1um2
?u1p???u2p??????ump??主元分析就是把一组变量X通过线性变换,转换成一组线性无关的变量Y:
Y1?u11X1?u21X2???um1XmY2?u12X1?u22X2???um2XmYp?u1pX1?u2pX2???umpXm写成矩阵的形式为
?????????????
Y?XU
主成分分析的目的就是使得Y的协方差矩阵Cov(Y)为对角阵,即Yi之间不相关。这样就可以以少量的变量来研究数据,使得数据中的变化规律更清晰。Yi为主成分,Y为主成分矩阵。 3.1数据的预处理