统计学

2018-11-23 21:47

1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)

n?49是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。

已知:x?12.6,S?2.8 ??0.0455 则有: Z??Z0.022752S22.8??0.4 ?2 平均误差=n7S2?2?0.4?0.8 nS2?x?? n极限误差??Z?2据公式 x?Z?2代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)

3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下: 产品产量(台)xi 生产费用(万元)yi 540 130 550 140 50 145 70 150 80 156 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R2。 附:

?(xi?x)i?12?1080

5?(yi?y)i?122?392.8 x?58 y?144.2

?xii?152?17900

?yii?1 ?104361?xyi?1i5i?42430

① 计算估计的回归方程:

?1??n?xy??x?y5?42430?290?7213060==0.567 ?25400n?x2?(?x)25?17900?290?y?0??n??1??xn?144.2 – 0.567×58=111.314

估计的回归方程为:y=111.314+0.567x

② 计算判定系数:

?R?

2?12?(x?x)2?(y?y)20.5672?1080??0.884

392.84、某家具公司生产三种产品的有关数据如下: 产品名称 写字台 椅子 书柜 总生产费用/万元 基期 报告期 45.4 30.0 55.2 53.6 33.8 58.5 报告期产量比 基期增长(%) 14.0 13.5 8.6 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。

① 拉氏加权产量指数

q1?qp0q01.14?45.4?1.135?30.0?1.086?55.20=??111.60%

45.4?30.0?55.2?p0q0?p1q1?53.6?33.8?58.5?100.10% ② 帕氏单位成本总指数=

q11.14?45.4?1.135?30.0?1.086?55.2p0q0?q0

2、根据下面的方差分析表回答有关的问题:

方差分析 差异源 组间 组内 总计 SS 0.001053 0.000192 0.001245 df 2 12 14 MS F P-value 0.000527 32.91667 1.34E-05 0.000016 F crit 3.88529 注:试验因素A有三个水平。 ⑴写出原假设及备择假设;

⑵写出SST,SSA,SSE,fT,fA,fe,MSA,MSE,n以及P值; ⑶判断因素A是否显著。

⑴ 原假设 H0:?1??2??3

备择假设 H1:?i?i?1,2,3?不全等

⑵ SST=0.001245 SSA=0.001053 SSE=0.000192 fT?14 fA?2 fe?12 MSA=0.000527 MSE=0.000016 n?15

P值=1.34E-05

⑶ F值=32.91667>F??2,12??3.88529

拒绝原假设,因素A显著。

1、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。

(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(Zα/2=2)

(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设边际误差E=0.08)

(1) n = 50 p = 32/50 =64%

0.64?0.36?13.58%E= n50置信区间为64%?13.58%即?50.42%,77.58%???2?2?

p?1?p??(2)n???2?p?1?p??2E222?0.8?0.2?0.08?2?100

2、下面是某商店过去9周的营业额数据: 1 2 3 4 5 6 7 8 9 周序号 473 470 481 449 544 601 587 644 660 营业额 (1)采用指数平滑法(平滑系数α=0.5)预测第十周的营业额(F8=555.19);(2)若经过计算,平滑系数α=0.5时误差均方=3847.31,平滑系数α=0.3时误差均方=5112.92,问用哪一个平滑系数预测更合适?

(1)?F10??Y9?(1??)F9F9??Y8?(1??)F8?F10??Y9??(1??)Y8?(1??)F82

?0.5?660?0.5?0.5?644?(1?0.5)2?555.19?629.80 (2)平滑系数α=0.5时误差均方=3847.31<平滑系数

α=0.3时误差均方=5112.92

? 用平滑系数α=0.5预测更合适。

3、某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:

方差分析表 df SS MS F Significance F 变差来源 1 A 1422708.6 C 2.17E-09 回归 10 220158.07 B 残差 11 1642866.67 总计 参数估计表 Coefficients 标准误差 t Stat P-value Intercept 363.6891 62.45529 5.823191 0.000168 X Variable 1 1.420211 0.071091 19.97749 2.17E-09 ①求A、B、C的值;②销售量的变差中有多少是由于广告费用的变动引起的?

③销售量与广告费用之间的相关系数是多少?④写出估计的回归方程并解释回归系数的实际意义。⑤检验线性关系的显著性 (a=0.05)

3题 解

(1)A=SSR / 1=1422708.6 B=SSE / (n-2)=220158.07/10=22015.807 C=MSR / MSE=1422708.6/22015.807=64.6221

(2)R?2SSR1422708.60??86.60% SST1642866.67表明销售量的变差中有88.60%是由于广告费用的变动引起的。 (3)R?R2?0.8660?0.93

(4)估计的回归方程:

??363.6891?1.420211x y??1.420211表示广告费用每增加一个单位,销售量平均增加1.420211个单位。 回归系数?1 (5)检验线性关系的显著性:

H0 :?1?0

∵Significance F=2.17E-09<α=0.05

∴拒绝H0,, 线性关系显著。

4、某企业三种产品的出口价及出口量资料如下: 出口价 出口量 基期p0 报告期p1 基期q0 报告期q1 100 150 80 82 甲 80 140 800 1000 乙 120 120 60 65 丙 (1)计算拉氏出口量指数;(2)计算帕氏出口价指数 (1)Iq(2)Ippq???pqpq???pq01??001101100?82?80?1000?120?6596000??121.210?80?80?800?120?6079200150?82?140?1000?120?65160100??166.770?82?80?1000?120?6596000

4题 解:

② 拉氏加权产量指数

q1?qp0q01.14?45.4?1.135?30.0?1.086?55.20=??111.60%

pq45.4?30.0?55.2?00② 帕氏单位成本总指数=

?pq11q1?qp0q00?53.6?33.8?58.5?100.10%

1.14?45.4?1.135?30.0?1.086?55.2

1.举例说明总体、样本、参数、统计量这几个概念及他们之间的区别和联系(8分)

答:区别:总体是具有某种共同性质的多个个体组成的集合;样本是从总体中抽取的一部分个体构成的集合;参数是用来描述总体特征的概括性数字的度量;统计量是用来描述样本特征的概括性数字度量。

联系:样本是从总体中抽取的一部分个体组成的集合;参数是用来描述总体的特征的;统计量是用来描述样本的特征的。

例如:河南省的所有工业企业构成一个总体,从中抽取100个企业就构成一个样本,对这100个企业构成的样本计算的企业平均工资、企业平均产值等就是统计量,而河南省所有工业企业的平均工资、平均产值则是参数。 2.简述众数、中位数和均值的特点和应用场合。(7分)

答:众数是一组数据中出现次数最多的变量值,是一种位置代表值,不受极端值的影响,具有不唯一性,也可能没有众数,主要用于分类数据集中趋势的测度;中位数是一组数据排序后处在中点位置的变量值,也是位置代表值,不受极端值的影响,主要用于排序型数据集中趋势的测度,均值是根据数值型数据计算的,利用全部的数据信息,具有优良的数学性质,是实际中最广泛的集中趋势的测度值。 五、计算分析题

1.从一个正态总体中随机抽取样本容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。(已知t0.025(8?1)?2.365)。(12分)

解:已知n=8,总体服从正态分布,?未知,样本抽样分布服从t分布 t0.025(8?1)?2.365 x??x?800?10

n802s??(x?x)n?1?3.46

E?t?2s3.46?2.365??2.89n8

置信下限=10-2.89=7.11

置信上限=10+2.89=12.89

总体均值?的95%的置信区间为 [7.11,12.89] 2.已知某企业连续5年钢产量资料如下: 年份 钢产量(千吨) 发展速度(%) 增长速度(%) 环比 定基 环比 定基 1997 200 1998 240 1999 360 2000 540 2001 756 试根据上表资料填出表中数字。(注意没有的数字划“—”,不准有空格)(10分)


统计学.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:银行账户管理办法(征求意见稿)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: