应用实例12进行某工艺试验,测得参数改进前后某有害化学指标的降低情况,问该工艺改进有无效果? 应用―t-检验: 成对双样本均值分析‖.认为该工艺改进对降低该有害化学指标的效果达5%的显著水平.试验样品改进前11.521.431.541.4551.3561.471.481.591.4101.35改进后1.451.351.451.51.41.41.351.41.351.3t-检验: 成对双样本均值分析改进前改进后1.4251.3950.0034720.00358310100.669374091.9639610.0405631.8331140.0811262.262159思考题1 为研究某烟草新品种是否比原有品种增加产量150kg/hm2以上, 选择土壤肥力和其他条件相对较为一致的相邻小区10对, 每对中随机确定1区种植新品种, 另1区种植老品种, 得烟叶产量下。小区新品种老品种1236975747073056900711069604568107335658572006774857065735068708967956915631568251071556870平均方差观测值泊松相关系数假设平均差dft StatP(T<=t) 单尾t 单尾临界P(T<=t) 双尾t 双尾临界3.3.3 方差的检验方差(或标准差)是衡量分析操作条件是否稳定的一个重要标志,反映了测定结果的精密度和测试条件的稳定性。方差的检验,对指导生产与科学实践是很有意义的。例如在工厂,在生产正常的情况下,方差有着一个相对稳定的数值,如果某个工作日发现方差有了较大的变化,超过了所允许的范围,这说明生产中出现了异常情况,提醒人们加以注意,迅速查明原因。又比如几个分析人员用同一种分析方法,测定同一试样,得到的标准偏差不同,这时就有必要研究产生这种差异的原因,是偶然因素引起的,还是得到较大标准偏差的那位分析人员在工作中出现了什么异常现象呢?诸如此类的问题,通过方差的检验,可以获得满意的解决。3.3.3.1 单个总体方差的检验一个总体方差的检验采用统计量n?2??(x?x)ii?12?2?1?2(n?1)s2式中s2是样本方差,?2是总体方差,统计量?的大小反映样本方差与总体方差的差异程度,在约定的显著性水平和自由度2222下,???(1?a/2,f)或???(a/2,f),则说明样本方差与总体方差有显著性差异,反之,样本方差和总体方差是一致的。临界值可2从?分布表中查得,或利用EXCEL电子表格中的函数CHIDIST( ? ,df)直接计算P值(单尾概率)。22应用实例13某卷烟企业在正常生产的情况下,生产的某卷烟产品烟气焦油量的方差为0.25,经工艺改进后,随机抽取35个样品,测得的方差为0.15,试问工艺改进对降低焦油的波动是否有效?依题意,本问题为单侧检验。依据样本计算统计量:应用实例14某质检站在正常生产的情况下,用分光光度法测定某烟叶原料某重金属含量,测定方差为0.182,分光光度计经检修后,用它测定同样烟叶原料该重金属含量,重复测定6次,方差为0.041,试问仪器经检修后稳定性是否有了显著变化?依题意,本问题为双侧检验。依据样本计算统计量:??2(n?1)s2?2?(35?1)0.150.25?20.4??2(n?1)s2计算P值:P值=MIN((1-CHIDIST(20.4,34)), CHIDIST(20.4,34))=0.0316推断:因为原假设成立的概率为0.0316,小于0.05,应接受备择假设,说明工艺对降低焦油的波动是有效的。?2?(6?1)0.041?6.3270.182计算P值:P值=2*MIN((1-CHIDIST(6.327,5)), CHIDIST(6.327,5))=0.5514推断:因为原假设成立的概率为0.5514,大于0.05,应接受原假设,说明仪器经检修后稳定性没有变化。3.3.3.2 两个总体方差的检验两个总体方差的检验即F检验,它的统计量是2s1F(f1,f2)?2s2式中s1和s2分别是样本1和样本2的方差,通常把数值大的作为分子,数值小的作为分母。f1和f2分别为相应的自由度。2应用实例15A与B两人用同一分析方法测定烟叶中某重金属。测得的该重金属含量如下,试问A与B两人测定该重金属的精密度是否存在显著性差异?分析人员A8.08.010.010.06.06.04.06.06.08.0分析人员B7.57.54.54.05.58.07.57.55.58.0这一个双侧检验问题。F-检验 双样本方差分析平均方差观测值dfFP(F<=f) 单尾F 单尾临界分析人员A7.203.731091.620.24143.18分析人员B6.552.301092两个总体方差的检验即F检验,可以通过EXCEL中的数据分析工具直接完成。 应用实例16用新旧两种工艺生产某卷烟产品,分别从用两种工艺生产的产品中抽取样品,测定某化学成分的含量,结果如下,试问新工艺是否比旧工艺生产更稳定?旧工艺2.692.282.572.32.232.422.612.642.723.022.452.952.51新工艺2.262.252.062.352.432.192.062.322.343.4 区间估计在质量分析中的应用在分析和解决实际质量问题时,要取得分析对象的全部数据是困难的,也是不现实的。比较可行的方法是从总体中抽取一定数量的样本,取得样本的测量数据,再通过样本数据对总体数据进行估计。区间估计就在已知样本状况时,估计总体值的可能区间的方法。这一个单侧检验问题。F-检验 双样本方差分析旧工艺新工艺2.56852.2511平均0.05860.0164方差139观测值df128FP(F<=f) 单尾F 单尾临界3.57160.03973.28393.4.1 单样本正态总体均值的区间估计例:某产品质量指标的目标值为10.88mm,现随机抽样一批产品中的10个样本进行检测,以判断该质量指标的平均值与目标值是否相同。10.8810.8910.8710.8810.8710.8910.8910.8610.8810.86计算样本均值和标准差样本量=10 均值=10.877 标准差=0.0116从计算的样本均值可发现均值与目标值存在差异,那么这种差异是偶然因素还是特殊因素造成的?计算总体均值的置信区间(95%的置信度)总体标准差未知时,置信区间计算公式Snta(n?1)?0.0116/10^0.5*2.262?0.0082式中,2.262为查临界值ta/2(n-1),df=10-1对应的t分布表所得。通过EXCEL函数:TINV(probability,degrees_freedom)计算。Probability为双尾t分布的概率,Degrees_freedom为自由度。还可通过EXCEL描述统计分析得到置信区间的置信限。由此可得,总体均值95%的置信区间为10.877±0.008,即(10.869,10.885)。分析:由计算可知,目标值包含在置信区间内。即有95%的把握总体均值在(10.869,10.885)之间。结论:没有证据表明该质量指标不在目标值范围内,即样本均值与目标值存在差异,这种差异是偶然因素造成的。?SS?,x?t?(n?1)?x?t?(n?1)?nn??22样本大小对置信区间的影响对于上例,假定样本均值和标准差不变,而样本量为100。此时,总体均值95%的置信区间为(10.874,10.879)。总体标准差已知时,置信区间计算公式??,?x?u?n?2x?u?2???n?此时,可通过EXCEL函数直接计算置信区间:CONFIDENCE(alpha,standard_dev,size)从上表可以发现,随着样本量增加,置信区间变小。即样本量越大,样本越能反映总体的实际情况。a值对置信区间的影响对于上例只改变a值,则置信区间为:其中,Alpha是用于计算置信度的显著水平。置信度等于100*(1-alpha)%,即若alpha为0.05,则置信度为95%。Standard_dev是数据区域的总体标准偏差,假设为已知。Size为样本容量。从上表可以发现,随a值的减小,置信区间变大。例随机从一批产品中抽取16个样本,测得某质量指标为:1.14 1.10 1.13 1.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.14 1.16.设服从正态分布,求总体均值μ的0.95的置信区间.已知σ=0.01.在EXCEL中可以求得95%的置信区间为:(1.148225,1.158025)3.4.2 单样本正态总体方差的区间估计在实际应用中,有时需要估计总体的分布状况,即根据样本方差来估计总体方差的置信区间,仍以前述实例中的数据来估计95%置信度下总体方差的置信区间。纵高χ2分布(chi-square distribution)图0.50.40.3自由度=110.8810.8910.8710.8810.8710.8910.8910.8610.8810.86计算样本标准差和方差样本量=10 标准差=0.0116 方差=0.0001344方差置信区间计算公式0.20.1自由度=2自由度=3由度=6?2?(n?1)s,?2??(n?1)?2??(n?1)s???2?(n?1)?1?2?2方差的置信区间是不对称的.0036912卡方值1518 EXCEL函数:CHIINV(probability,degrees_freedom) Probability 为χ2分布的单尾概率。Degrees_freedom为自由度。χ2分布下限临界值:=CHIINV(0.025,9)=19.02277χ2分布上限临界值:=CHIINV(0.975,9)= 3.4.3 双样本正态总体均值差的区间估计在解决实际问题时,常会遇到对多个样本进行比较的情况,如比较同一品牌不同加工点的产品质量、不同供应商同一种来料的品质等,这时可用双样本区间估计进行分析比较。若双样本正态总体均值差的置信区间包括0,则表明两者间差异不显著(可以推论二总体均值等),否则差异显著(可以推论二总体均值不等)。若双样本正态总体或方差比的置信区间包括1,则表明两者间差异不显著(可以推论二总体方差相等),否则差异显著(可以推论二总体方差不等)。 2.70039置信区间下限:=9*0.000134444/CHIINV(0.025,9)=0.000064置信区间上限:=9*0.000134444/CHIINV(0.975,9)=0.000448结论:95%置信度下总体方差的置信区间为(0.000064,0.000448)。若知道以前生产时的总体方差,则可判断产品质量是否发生显著波动。例在甲、乙两个加工地随机抽取同一卷烟品牌的样本,其容量分别为5和7,分析其烟气总粒相物含量为甲:12.6 13.4 11.9 12.8 13.0?乙:13.1 13.4 12.8 13.5 13.3 12.7 12.4烟气总粒相物含量符合正态等方差条件,试估计甲、乙两地产烟气总粒相物含量差μ1–μ2所在的范围。(取α=0.05)计算两个样本的均值和标准差样本量: n1=5 n2=7 均值:x1?12.74x2?13.02857标准差:s1=0.55497 s2=0.407080等方时的合并标准差:22计算两个总体均值差的置信区间222μ-μ2的置信区间计算公式σ1=σ2=σ但未知时,1样本均值差:=-0.288571置信区间下限:=-0.288571-TINV(0.025,10)*0.471835*SQRT(1/ 5+1/7)=-1.01622置信区间上限:=-0.288571+TINV(0.025,10)*0.471835*SQRT(1/ 5+1/7)=0.439082结论甲、乙两地产烟气总粒相物含量均值差,95%置信度下的置信区间为(-1.01622,0.439082),因为置信区间包括0,所以有95%的把握认为两地间的烟气总粒相物含量无显著差异。???(x1?x2)?t(n1?n2?2)sw1?1??n1n2????2sw?n1s1?n2s2?0.471835n1?n2?23.4.4 双样本正态总体方差比的区间估计在实际应用中,有时需要比较两个样本的分布状况,这时可通过计算两样本正态总体方差比的置信区间来进行比较。仍以上例数据为例,计算两产地95%置信度下的方差比置信区间。计算两个样本标准差样本量: n1=5 n2=7标准差:s1=0.55497 s2=0.407080方差:s12=0.308000 s22=0.165714计算两总体方差比的置信区间?2?2?s11s11??s2F(n?1,n?1),2s2F?(n1?1,n2?1)?12?2??1??22?置信区间下限:=0.308000/(0.165714*FINV(0.05/2,5-1,7-1))=0.29847置信区间上限:=0.308000/(0.165714*FINV(1-0.05/2,5-1,7-1))=17.09434结论两产地95%置信度下的方差比置信区间为(0.29847,17.09434),因为置信区间包括1,所以有95%的把握认为两地间的烟气总粒相物含量的方差(即波动)无显著差异。3.5 方差分析在质量分析中的应用根据偏差平方和的加和性,总偏差平方和可以分解成为组间偏差平方和与组内偏差平方和,前者反映了因素对试验结果的影响,后者反映了误差对试验结果的影响.根据组间偏差平方和与组内偏差平方和的比值即F的大小,来确定试验处理的显著性.说明:在方差分析中,总是每个处理下的试验指标服从正态分布,并且方差相等,同时还要求试验数据独立性,即符合随机化试验的原则.方差来源组间组内总和偏差平方和自由度方差估计值F值F0.01F0.05显著性 分差分析是将总变异分解为各个因素的相应变异,从而推断各个因素在变异中所占的重要程度。Excel 提供了3 个方差分析工具,即―单因素方差分析‖、―可重复双因素方差分析‖、―无重复双因素方差分析‖。其中―单因素方差分析‖适用于单向分组资料,如单因素完全随机试验。―可重复双因素方差分析‖适用于两因素完全随机试验。―无重复双因素方差分析‖适用于两向分组资料,如单因素随机区组试验。一、单因素方差分析应用实例17 研究6 种氮肥施肥法对烟叶含氮量的影响,每种施肥法重复5 次,完全随机设计,结果如下表,试进行方差分析。这是一个单因素完全随机设计试验的单向分组资料,所以用―方差分析:单因素方差分析‖工具。氮肥ABCDEF重复 Ⅰ 12.91412.610.514.614 Ⅱ 12.313.813.210.814.613.3 Ⅲ 12.213.813.410.714.413.7 Ⅳ 12.513.613.410.814.413.5 Ⅴ 12.713.61310.514.413.7方差分析差异源SS组间44.463组内1.3总计45.763df52429MSFP-valueF crit8.8926164.17119.62E-182.6206540.054167思考题对某年采购5个地区的烟叶进行等级合格率检验,每地区分别抽取5组C1F样品,测得合格率如下,试比较5个地区C1F等级合格率是否有差异?地区ABCDE样品1(%)样品2(%)样品3(%)样品4(%)样品5(%)71.570.269.573.57572.374.27672.870.669.569.873.174.576.472.173.474.168.867.978.175.677.173.474.5二、无重复双因素方差分析应用实例18 研究6 种氮肥施肥法对烟叶含氮量的影响,每种施肥法设置5 个小区,随机区组设计,结果如下表,试进行方差分析。这是一个单因素随机区组设计试验的两向分组资料,所以用―方差分析:无重复双因素方差分析‖工具。氮肥ABCDEF Ⅰ 12.91412.610.514.614 Ⅱ 12.31111133043.....82863区组 Ⅲ 12.21111133043.....84747 Ⅳ 12.51111133043.....64845 Ⅴ 12.713.61310.514.413.7方差分析差异源行列误差总计SS44.4630.0481.25245.763df542029MSFP-valueF crit8.8926142.05436.48E-152.710890.0120.1916930.939912.8660810.0626应用实例19考察热风温度和热风风速对烘后烟丝填充值的影响,热风温度和热风风速都设2个水平(80-120℃,0.5-1.0 m/s) 9个组合,每组合不设重复试验. 思考题对某年采购5个地区的烟叶进行等级合格率检验,每地区分别抽取5个烤烟品种C1F样品,测得合格率如下,试比较不同地区、不同品种C1F等级合格率是否有差异?地区ABCDE品种1(%)品种2(%)品种3(%)品种4(%)品种5(%)71.570.269.573.57572.374.27672.870.669.569.873.174.576.472.173.474.168.867.978.175.677.173.474.5热风风速0.501.00方差分析差异源SS行0.0049列0.0169误差0.0004总计0.0222df热风温度801204.945.094.895.00MS0.00490.01690.0004FP-valueF crit12.250.17717161.44642.250.09718161.4461113三、可重复双因素方差分析应用实例20 某地进行烟草氮肥用量(因素B) 及施用时期(因素A) 试验,其中氮肥用量取3 个水平,施用时期取2个水平。各处理组合重复5 次,完全随机排列。小区产量结果如下表,试作方差分析。这是一个完全随机设计的两因素试验,采用〔方差分析:可重复双因素方差分析〕工具进行方差分析。因素B1 5059A1 4552585560A2 566245B2 60535862557165757880B3 64666771635559586360方差分析差异源SS样本116.0333列708.0667交互689.2667内部576.8总计2090.167dfMSFP-valueF crit1116.03334.8280170.0378944.2596772354.033314.730936.7E-053.4028262344.633314.339818E-053.4028262424.0333329 应用实例21考察烘焙温度和时间对白肋烟处理感官质量的影响,烘焙温度和时间都设3个水平(7-9-11分钟,110-120-130℃)9个组合,每组合重复3次. 烘焙温度120889786455烘焙时间7911烘焙时间7911110565898566130676655445110565898566烘焙温度120889786455130676655445方差分析差异源样本列交互内部总计SS21.62969.1851921.25937.3333359.4074df2241826MSFP-valueF crit10.814826.54554.3E-063.554564.5925911.27270.000673.554565.3148113.04553.7E-052.927750.407413.6 相关分析在质量分析中的应用应用实例22 测得22 个土样的全氮量(y) 与有机质含量(x) 列于表7 ,分析全氮量(y) 与有机质含量(x) 的相关性。EXXEL中只能计算相关系数的大小,而不能进行显著性判断,为此可以运用下式计算临界值:=SQRT((TINV(0.05,20))^2/((TINV(0.05,20))^2+20))显著水平自由度=n-2XXY10.913893Y10.05水平0.4227140.01水平0.5368简单相关分析应注意的问题相关系数的大小和正负只能反映变量间的线性关系,而不能反映变量间是否存在较强的非线性关系。
课件1:质量分析中的常用统计技术 - 图文(3)
2019-05-26 17:16
课件1:质量分析中的常用统计技术 - 图文(3).doc
将本文的Word文档下载到电脑
下载失败或者文档不完整,请联系客服人员解决!