第6章直线回归与相关(6)

2019-04-16 21:44

图6-6 指数函数图形(y?debx)

②y?deb/x(d?0,x?0) (图6-7)

若令 y??lny,x??1x,a?lnd (d?ea) 则有 y??a?bx?

图 6-7 指数函数(y?debx)

(4)对数函数(logarithmic function)

y?a?blgx (x>0) (图6-8) 若令x??lgx,则有y?a?bx?

图 6-8 对数函数曲线(y?a?blgx)

(5)S型曲线 y?1 (a>0)(图6-9) a?be?x若令 y??1y, x??e?x 则有 y??a?b?x

图6-9 S型曲线y?1(a>0) ?xa?be 26

进行曲线回归分析时,由于有时不能准确确定曲线的类型,我们可以尝试多种类型(包括直线回归),然后比较它们的优劣。可以用2个指标来进行比较,一是离回归平方和SSr?,二是决定系数R2。

?i) (6-73) SSr???(yi?y2?i是用配合的曲线方程所计算的yi的估计值。注意,这里的yi是原始的(转换前的)依变量观测值,y

R2?(y?1??(yii?i)2?y?yi)2 (6-74)

离回归平方和越小,决定系数越大,曲线配合的拟合度就越好。

5.3 曲线回归分析实例

上面提到的曲线类型都可以经过适当的转换后,再进行直线回归。但对同一张散点图,选择什么样的曲线去拟合数据,往往会有许多不同的选择方法。

【例6-4】 试求表6-7资料中酶的比活力与底物质量浓度之间的回归关系,并进行显著性检验。 根据由观测值(xi,yi)所作的散点图(图6-3)知,可先分别选择以下回归曲线:

(1)双曲线函数 1y?a?bx (2)幂函数 y?dxb (3)对数函数 y?a?blgx (4)指数函数 y?debx

(5)二次二项式 y?b0?b1x?b2x2

来表示酶比活力(y)与底物浓度(x)之间的关系,然后以拟合度最优者为所选择的回归曲线(二次多项式的配合须有多元线性回归的知识)。

为配合以上曲线先将原观测值及有关变换值列于表6-8。

表6-8 底物浓度、酶比活力数据表

序号 1 2 3 4 5 6 7 8 9

底物浓度(x)

1.25 1.43 1.66 2.00 2.50 3.30 5.00 8.00 10.00

酶比活力(y) 17.65 22.00 26.32 35.00 45.00 52.00 55.73 59.00 60.00

x??1/x

0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.13 0.10

y??1/y

0.0567 0.0455 0.0380 0.0286 0.0222 0.0192 0.0179 0.0169 0.0167

lnx

0.223 0.358 0.507 0.693 0.916 1.194 1.609 2.079 2.303

lny

2.871 3.091 3.270 3.555 3.807 3.951 4.021 4.078 4.094

lgx

0.097 0.155 0.220 0.301 0.398 0.519 0.699 0.903 1.000

根据有关变换值拟合四种直线回归方程,进而还原成相应曲线回归方程(过程略),四种曲线拟合结

果见表6-9。

27

表6-9 5种曲线拟合结果

曲 线 类 型

直 线 方 程

直线相关 (r?)

拟 合 的 曲 线 方 程

双曲线函数

?'?0.0064?0.0547x? yr??0.9524?? r??0.8994?? r??0.9414?? r???0.9817?? R?0.9605??

??yx(0.0064x?0.0547)

幂函数

???3.0328?0.5508x? y??20.7553x0.5508 y对数函数

??18.6952?47.6337x? yy??4.3806?1.7930x?

??18.6952?47.6337lgx y指数函数

??79.8890e?1.7930x y??2.5343?17.2892x?1.1901x2 y二次二项式 ---

?)与实际观测值(y)对照并计算离回由表6-9中的四种曲线回归方程分别求得酶比活力的预测值(y归平方和(SSr??i)2)决定系数(R2),结果列于表6-10.。 ??(yi?y表6-10 预测值(?)与原观测值(y)的对照及拟合度评价 y?) 预 测 值 (y实 际 观 测 值 x 1.25 1.43 1.66 2.00 2.50 3.30 5.00 8.00 10.00 y 17.65 22.00 26.32 35.00 45.00 52.00 55.73 59.00 60.00 双曲线函数 幂函数 对数函数 指数函数 二次二项式 19.936 22.396 25.412 29.630 35.361 43.524 57.670 75.543 84.246 1016.0158 0.5372 23.470 25.275 27.439 30.404 34.381 40.061 50.364 65.246 73.778 579.3374 0.7361 23.311 26.094 29.180 33.034 37.651 43.394 51.990 61.713 66.329 249.9611 0.8861 19.034 22.801 27.127 32.594 38.995 46.400 55.815 63.849 66.776 145.7983 0.9336 22.286 24.824 27.955 32.352 38.319 46.629 59.229 64.684 56.421 170.0228 0.9225 ?i)2 SSr???(yi?yR2 可见,对于本例来说,指数函数回归方程的拟合效果最好,其次是二次二项式回归,双曲线函数回归

28

最差,虽然它也达到了显著水平(F=8.124,P<0.05),但决定系数却只有53.72%。

习题

1.什么叫回归分析?直线回归方程和回归截距、回归系数的统计意义是什么? 2.什么叫相关分析?相关系数、决定系数的意义是什么?如何计算? 3.相关系数与配合回归直线有何关系? 4.进行回归、相关分析应注意哪些问题?

5.常见的能直线化的曲线类型主要有哪些?能直线化的曲线回归分析的基本过程是什么?

6.采用碘量法测定还原糖,用0.05mol/L浓度硫代硫酸钠滴定标准葡萄糖溶液,记录耗用硫代硫酸钠体积数(mL),得到如下数据,

硫代硫酸钠(mL) x 葡萄糖(mg/mL) y

0.9 2

2.4 4

3.5 6

4.7 8

6.0 10

7.4 12

9.2 14

试求y对x的线性回归方程,并进行回归方程有效性检验。

7.采用考马斯亮蓝法测蛋白质含量,在作标准曲线时得到蛋白质含量(y)与吸光度(x)的关系数据,

吸光度 x 蛋白质(?g/mL) y

0 0

0.198 0.2

0.346 0.4

0.483 0.6

0.622 0.8

0.786 1.0

0.952 1.2

试求y对x的线性回归方程、相关系数r,并进行有关区间估计和预测。 8.在进行乳酸菌发酵实验时,为了测得乳酸菌生长曲线,得到如下数据,

培养时间(h)x 活菌数y(×10个/mL)

7

0 4.07

6 6.03

12 13.49

18 31.62

24 87.10

30 141.25

36 199.53

试分析y对x的回归关系(包括直线回归与曲线回归),比较它们的拟合度。

29


第6章直线回归与相关(6).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:鼎信诺审计软件常见问题汇总 - 图文

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: