不考虑交互作用的正交试验设计
(1)根据需要选取合适的正交表 选取原则:①水平数s表?s实际;
②因子数r表?r实际;
③试验次数n尽可能小
(2)设计表头
①将各因子安排在正交表各列的上方,每个因子占一列;
②不考虑交互作用时,表头上的因子可以任意安放(一般自左往右顺序安放); ③表头上不放因子的列称为空白列。
(3)按照表中的设计做试验,获得试验指标值
按照正交表中所示的每一种水平组合各做一次试验,获得
n个试验指标值
Y1,Y2,?,Yn.
(4)求均值、离差平方和 ①求出总均值、总离差平方和
n1nY??Yi,QT??(Yi?Y)2?nSY2
ni?1i?1②在表中第值ki(ij列(j?1,2,?,r,包括空白列)求出各个水平i对应的试验值的均
?1,2,?,s)、离差平方和Qj. 如上例中,j?2时
k1?Y1?Y4?Y7Y2?Y5?Y8Y?Y6?Y9,k2?,k3?3
333nsQj??(ki?Y)2?nSk2
si?12其中Sk是将ki(i1n1s?1,2,?,s)视为子样值(其均值Y??Yi??ki)时的子样
ni?1si?1n方差. Qj的表达式中有因子n是因为每个水平i在n次试验中均出现次.
ss(5)做显著性检验,列方差分析表
①离差平方和:如某因子被放置在第
j列,则Qj即该因子引起的离差平方和;而总离
差平方和QT是表中各列的Qj之和,故QT减去各因子引起的离差平方和,即得误差QE,亦即QE为空白列的Qj(之和)。
②自由度:各因子对应的自由度是水平数减1,即fA?fB???s?1;QT对应的自
由度是试验次数减1,即fT?n?1;QE对应的自由度是
③均方离差:各离差平方和除以相应的自由度。 ④检验统计量:各因子的均方离差除以均方误差,即
fE?fT?(fA?fB??).
2SA当因子A的影响不显著时,FA?2~F(fA,fE);
SE2SB当因子B的影响不显著时,FB?2~F(fB,fE);
SE⑤拒绝域W:给定显著水平?后,有
假设“因子A的影响不显著”的拒绝域,FA?F?(fA,fE); 假设“因子B的影响不显著”的拒绝域,FB方差分析表: 来 源 因子A 因子B 平方和 QA QB 自由度 fA?s?1 fB?s?1 ?F?(fB,fE);
均方 离差 2 SA2SBF值 临界值 22F?(fA,fE) F?S/SAAE 22 FB?SB/SE? 误差E 总和T ? QE ?fT?n?1 ? F?(fB,fE) QT 2 fE?(n?1)?(s?1)?实际因子数 SE? ? (6)寻找最优水平组合
①对每一因子,在以它为表头的那一列中,比较各水平下均值ki(i?1,2,?,s)的大小,从而确定哪一水平最优;
②由于不考虑交互作用,故只要将各因子的最优水平组合在一起,就得到最优水平组合;
③其中,对试验指标影响不显著的因子,其水平可选取试验成本最经济的; ④有时需要在最后选定的最优水平组合上或其附近再多做几次试验进一步确认
第五章 回归分析
回归分析,就是一种研究自变量(是可控变量时)与因变量(随机变量)之间的统计相关关系的统计方法. 从自变量和因变量的一组观测数据出发,寻找一个函数式,将变量之间的统计相关关系近似表达出来,这个能近似表达自变量与因变量之间关系的函数,称为回归函数.
§5.1 一元线性回归中的参数估计
一元回归的数学模型 一元回归模型:
设x是一元可控变量,Y是依赖于
x的随机变量,二者具有相关关系,通常称x为
自变量或预报变量;Y为因变量或响应变量.
设想Y的值由两部分组成:一部分是由x能够决定的,记为f(x);另一部分是由其它未加考虑的因素(包括随机因素)所产生的影响,看作随机误差,记为?,且有理由要求
E(?)?0. 故有 ?称(5.1-1)式为Y对
?Y?f(x)?? (5.1-1)
?E(?)?0x的一元回归模型,f(x)为回归函数;其中E(Y)?f(x),称
y?f(x)为回归方程.
②一元线性回归模型:
若进一步假定回归函数为f(x)?β0?β1x,且存在D(?)??2,则有
?Y?β0?β1x?ε ?2 (5.1-2)
?E(ε)?0, D(ε)?σ称(5.1-2)式为Y对归系数,而E(Y)?x的一元线性回归模型,其中β,β,σ012均为未知参数,?0,?1称为回
β0?β1x,此时回归方程y?β0?β1x是线性方程,称为回归直线.
2③一元正态线性回归模型:
应用中,为对回归方程的合理性进行检验,还假定?~N(0,σ),于是模型(5.1-2)化为
?Y?β0?β1x?ε? (5.1-3) 2?~N(0,σ)?称(5.1-3)式为Y对
为研究
x的一元正态线性回归模型,此时Y~N(β0?β1x,σ2).
x与Y之间的内在关系,在x?x1,x2,?,xn的点上,做n次独立试验,得
到y?y1,y2,?,yn,于是有点(x1,y1),(x2,y2),?,(xn,yn). 画出散点图,如果这
n个点(n很大时)分布在一条直线附近,直观上就可认为x与Y的关系具有(5.1-3)
式的模型。
将yi视为Yi的子样值,模型(5.1-3)又化为
?Yi?β0?β1xi?εi , (i?1,2,?,n) (5.1-4) ?2?εi~N(0,σ), 且相互独立显然此时有Yi~N(β0?β1xi,σ2),且当i?1,2,?,n时相互独立.
?由(x1,y1),(x2,y2),?,(xn,yn)求出回归系数β0,β1的估计值β0,方程y?β0?β1x,称为经验回归直线. (2)一元线性回归的主要问题
①对未知参数β0,β1,σ2的估计; ②对参数及回归模型的假设检验; ③对因变量Y的预测。 对未知参数?0,?1,?2的估计 ①β0,β1的最小二乘估计
??β1后得到直线
??已知x与Y试验值 (x1,y1),(x2,y2),?,(xn,yn),构造Yi的试验值归值E(Yi)?β0?β1xi的离差平方和
yi与理论回
Q(β0,β1)???i ??(yi?β0?β1xi)2 (5.1-5)
2i?1i?1nn以使Q(β0,β1)取得最小值的?0,?1为令
??β0,β1的估计值,称之为最小二乘估计. 为此,
n??Q??2?(yi?β0?β1xi)?0???β0i?1 ?n?Q???2?(yi?β0?β1xi)xi?0??βi?1?1于是有关于β0,β1的线性方程组
nn? nβ0?(?xi)β1??yi??i?1i?1 (5.1-6) ?nnn? (?xi)β0?(?xi2)β1??xiyi?i?1i?1?i?1(5.1-6)式的解?0,?1是由容量为n的子样值得到的,只在这n个点处Yi的试验值
??yi与理论回归值β0?β1xi的离差平方和最小,因此,解?0,?1不是β0,β1的真值,只
是估计值。故有
???? β0?xβ1?y???2?? xβ0?xβ1?xy?? (5.1-7)
11n其中x??xi,y?nni?1称为正规方程组. 解得
?i?1nnn11yi,x2??xi2,xy??xiyini?1ni?1. (5.1-7)式
??xy?xy?β1?22?x?x????β0?y?xβ1??(5.1-8)式中的β0?? (5.1-8)
,β1称为未知参数β0,β1的最小二乘估计。
于是经验回归直线回归直线恒过点(x,2y??0??1x?(y?x?1)??1x??1(x?x)?y,即:经验
?????y).
②?的矩估计
1n2??~N(0,σ),???D(?)?E(?),则可用?的子样均值??i去估计
ni?12222其母体均值?但?i估计为
22?E(?21n2),即有????i.
ni?1?2?(Yi?β0?β1xi)2,其中β0,β1未知,以其最小二乘估计代替,于是?2的矩
??1n1???(Yi?β0?β1xi)2?Qmin (5.1-9)
ni?1n?2