统计学习题区间估计与假设检验..

2018-11-14 13:08

第五章

一、单项选择题

抽样与参数估计

1、某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( B )

A、样本容量为10 B、抽样误差为2 C、样本平均每袋重量是估计量 D、498是估计值

2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( D )

A、N(100,25) B、N(100,5/

n)

C、N(100/n,25) D、N(100,25/n)

3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( C )

A、一半 B、一倍 C、三倍 D、四倍 4、在其他条件不变时,置信度(1–α)越大,则区间估计的( A )

A、误差范围越大 B、精确度越高 C、置信区间越小 D、可靠程度越低

5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( C )

A、1/4 B、4倍 C、7/9 D、3倍 6、在整群抽样中,影响抽样平均误差的一个重要因素是( C )

A、总方差 B、群内方差 C、群间方差 D、各群方差平均数

7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( B )尽可能小

A、总体层数 B、层内方差 C、层间方差 D、总体方差 8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( D )

A、简单随机抽样 B、分层抽样 C、等距抽样 D、整群抽样

9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( A )

A、分层抽样 B、简单随机抽样 C、等距(系统)抽样 D、整群抽样

10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选( A )

A、85% B、87.7% C、88% D、90%

二、多项选择题

1

1、影响抽样误差大小的因素有( ADE )

A、总体各单位标志值的差异程度 B、调查人员的素质 C、样本各单位标志值的差异程度 D、抽样组织方式 E、样本容量

2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。根据抽样结果进行推断,下列说法正确的有( ADE )

A、n=200 B、n=30 C、总体合格率是一个估计量 D、样本合格率是一个统计量 E、合格率的抽样平均误差为2.52%

3、用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布( BCE )

A、np≤5 B、np≥5 C、n(1–p)≥5 D、p≥1% E、n≥30

三、填空题

1、对某大学学生进行消费支出调查,采用抽样的方法获取资料。请列出四种常见的抽样方法: 、 、 、 ,当对全校学生的名单不好获得时,你认为 方法比较合适,理由是 。

四、简答题

1、分层抽样与整群抽样有何异同?它们分别适合于什么场合? 2、解释抽样推断的含义。

五、计算题

1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求: (1)平均每包重量的置信区间,若总体标准差为5克; (2)平均每包重量的置信区间,若总体标准差未知; (t0.025,9; ?2.2622,t0.025,10?2.2281,t0.05,9?1.8331,t0.05,10?1.8125)

2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,试问样本量应该为多大?

3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。

(1)试对家庭每天平均看电视时间进行区间估计。

(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在(1)的水平,问此时需要

调查多少户才能满足要求?(α=0.05)

2

答案:

一、B,D,C,A,C;C,B,D,A,A。 二、ADE,ADE,BCE。

三、简单随机抽样,分层抽样,等距抽样,整群抽样,分层抽样,不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不

宜用整群抽样。

四、1、答:都要事先按某一标志对总体进行划分的随机抽样。不同在于:分层抽样的划分标志与调查标志有关,而整群抽样不是;分层

抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。

2、答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中

的一部分单位进行调查,利用调查的结果来推断总体的数量特征。 五、1、解:n=10,小样本

(1)方差已知,由x±zα/2

?nsn得,(494.9,501.1)

(2)方差未知,由x±tα/2

得,(493.63,502.37)

22z?(1?p)1.6448?0.5?0.5/2?p? 2、解:n===1691 220.02?x 3、解:(1)x±tα/2

sn=6.75±2.131×

2.2516=(5.55,7.95)

(2)边际误差E= tα/2

sn=2.131×

2.2516=17

=1.2

22z?1.962?2.52/2?? n==2E1.22第六章

练习题

一、单项选择题

假设检验

1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。若要检验该机实际运行状况是否符合设计标准,应该采用( C )。

A、左侧检验 B、右侧检验

3

C、双侧检验 D、左侧检验或右侧检验

2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定元假设,则可认为( C )。

A、抽样是不科学的 B、检验结论是正确的 C、犯了第一类错误 D、犯了第二类错误

3、当样本统计量的观察值未落入原假设的拒绝域时,表示( B )。

A、可以放心地接受原假设 B、没有充足的理由否定与原假设 C、没有充足的理由否定备择假设 D、备择假设是错误的

4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( A )。

A、都减少 B、都增大

C、都不变 D、一个增大一个减小 5、关于检验统计量,下列说法中错误的是( B )。

A、检验统计量是样本的函数 B、检验统计量包含未知总体参数

C、在原假设成立的前提下,检验统计量的分布是明确可知的 D、检验同一总体参数可以用多个不同的检验统计量

二、多项选择题

1、关于原假设的建立,下列叙述中正确的有( CD )。

A、若不希望否定某一命题,就将此命题作为原假设 B、尽量使后果严重的错误成为第二类错误

C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”

D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设 E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论 2、在假设检验中,α与β的关系是( CE )。

A、α和β绝对不可能同时减少 B、只能控制α,不能控制β

C、在其它条件不变的情况下,增大α,必然会减少β D、在其它条件不变的情况下,增大α,必然会增大β E、增大样本容量可以同时减少α和β

三、判断分析题(判断正误,并简要说明理由)

1、对某一总体均值进行假设检验,H0:X=100,H1:X≠100。检验结论是:在1%的显著性水平下,应拒绝H0。据此可认为:总体均值的真实值与100有很大差异。

2、有个研究者猜测,某贫困地区失学儿童中女孩数是男孩数的3倍以上(即男孩数不足女孩数的1/3)。为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。那么原假设可以为:H0:P≤1/3。

4

四、简答题

1、采用某种新生产方法需要追加一定的投资。但若根据实验数据,通过假设检验判定该新生方法能够降低产品成本,则这种新方法将正式投入使用。

(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。 (2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?

五、计算题

1、某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。假设产品重量服从正态分布。 (1)建立适当的原假设和备择假设。

(2)在α=0.05时,该检验的决策准则是什么? (3)如果x=12.25克,你将采取什么行动? (4)如果x=11.95克,你将采取什么行动?

答案:

一、1、C 2、C 3、B 4、A 5、B 二、1、CD 2、CE

三、1、错误。“拒绝原假设”只能说明统计上可判定总体均值不等于100,但并不能说明它与100之间的差距大。

2、错误。要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P(或男孩所占的比例P*)所以原假设为:H0:P=3/4(或P≤3/4);H1:P>3/4。

也可以是:H0:P*=1/4(或P≥1/4);H1:P*<1/4。 四、1、(1)H0:x≥350;H1:x<350。

(2)针对上述假设,犯第一类错误时,表明新方法不能降低生产成本,但误认为其成本较低而被投入使用,所以此决策错误会增加成本。犯第二类错误时,表明新方法确能降低生产成本,但误认为其成本不低而未被投入使用,所以此决策错误将失去较低成本的机会。 五、1、(1)H0:μ=120;H1:μ≠12。

(2)检验统计量:Z=

x??0

?/n

。在α=0.05时,临界值zα/2=1.96,故拒绝域为|z|>1.96。

(3) 当x=12.25克时,Z=

x??0

?/n

12.25?120.6/25=2.08。

由于|z|=2.08>1.96,拒绝H0:μ=120;应该对生产线停产检查。

(4) 当x=11.95克时,Z=

x??0

?/n

11.95?120.6/25=-0.42。

5

由于|z|=-0.42<1.96,不能拒绝H0:μ=120;不应该对生产线停产检查。

第七章

相关与回归分析

一、单项选择题

1、下面的关系中不是相关关系的是( D )

A、身高与体重之间的关系 B、工资水平与工龄之间的关系 C、农作物的单位面积产量与降雨量之间的关系 D、圆的面积与半径之间的关系

2、具有相关关系的两个变量的特点是( A )

A、一个变量的取值不能由另一个变量唯一确定 B、一个变量的取值由另一个变量唯一确定

C、一个变量的取值增大时另一个变量的取值也一定增大 D、一个变量的取值增大时另一个变量的取值肯定变小 3、下面的假定中,哪个属于相关分析中的假定( B )

A、两个变量之间是非线性关系 B、两个变量都是随机变量

C、自变量是随机变量,因变量不是随机变量 D、一个变量的数值增大,另一个变量的数值也应增大

4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为( A )

A、完全相关关系 B、正线性相关关系 C、非线性相关关系 D、负线性相关关系 5、根据你的判断,下面的相关系数取值哪一个是错误的( C )

A、–0.86 B、0.78 C、1.25 D、0

6、设产品产量与产品单位成本之间的线性相关关系为–0.87,这说明二者之间存在着( A ) 绝对值大于0.8A、高度相关 B、中度相关 C、低相关 D、极弱相关

7、在回归分析中,描述因变量y如何依赖于自变量x和误差项ε的方程称为( B )

A、回归方程 B、回归模型 C、估计回归方程 D、经验回归方程 8、在回归模型y=?0??1x??中,ε

反映的是( C )

A、由于x的变化引起的y的线性变化部分 B、由于y的变化引起的x的线性变化部分

6

C、除x和y的线性关系之外的随机因素对y的影响 D、由于x和y的线性关系对y的影响

9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误( B )

??A、y=25–0.75x B、y= –120+ 0.86x ??C、

y=200–2.5x D、y= –34–0.74x

10、说明回归方程拟合优度的统计量是( C )

A、相关系数 B、回归系数 C、判定系数 D、估计标准误差

11、判定系数R2是说明回归方程拟合度的一个统计量,它的计算公式为( A )

A、

SSRSST B、

SSRSSE C、

SSESST D、

SSTSSR

12、已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R2=( A )4854/(4854+146)

A、97.08% B、2.92% C、3.01% D、33.25%

13、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中不正确的是( D )A、较高的男子趋于较重 B、身高与体重存在低度正相关 C、体重较重的男子趋于较高 D、45%的较高的男子趋于较重 14、下列回归方程中哪个肯定有误( A )

A、y??=15–0.48x,r=0.65 B、y= –15 - 1.35x,r=-0.81 C、

y?=-25+0.85x,r=0.42 D、y?=120–3.56x,r=-0.96

15、若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R2为( C )

A、0.8 B、0.89 C、0.64 D、0.40 16、对具有因果关系的现象进行回归分析时( A )

A、只能将原因作为自变量 B、只能将结果作为自变量 C、二者均可作为自变量 D、没有必要区分自变量

二、多项选择题

1、下列现象不具有相关关系的有( ABD )

A、人口自然增长率与农业贷款 B、存款期限与存款利率 C、降雨量与农作物产量 D、存款利率与利息收入 E、单位产品成本与劳动生产率

2、一个由500人组成的成人样本资料,表明其收入水平与受教育程度之间的相关系数r为0.6314,这说明( E ) 中度

A、二者之间具有高度的正线性相关关系 B、二者之间只有63.14%的正线性相关关系

7

C、63.14%的高收入者具有较高的受教育程度 D、63.14%的较高受教育程度者有较高的收入 E、通常来说受教育程度较高者有较高的收入

三、判断分析题(判断正误,并简要说明理由)

1、一项研究显示,医院的大小(用病床数x反映)和病人住院天数的中位数y之间是正相关,这说明二者之间有一种必然的联系。( ) 2、应用回归方程进行预测,适宜于内插预测而不适宜于外推预测。( )

四、简答题

1、解释相关关系的含义,说明相关关系的特点。 2、简述狭义的相关分析与回归分析的不同。

五、计算题

1、研究结果表明受教育时间与个人的薪金之间呈正相关关系。研究人员搜集了不同行业在职人员的有关受教育年数和年薪的数据,如下:

受教育年数 x 8 6 3 5 9 3 年薪(万元) y 3.00 2.00 0.34 1.64 4.30 0.51 受教育年数 x 7 10 13 4 4 11 年薪(万元) y 3.12 6.40 8.54 1.21 0.94 4.64 (1)做散点图,并说明变量之间的关系; (2)估计回归方程的参数;

(3)当受教育年数为15年时,试对其年薪进行置信区间和预测区间估计(α=0.05)

(t0.025,11?2.201; ,t0.025,10?2.2281,t0.05,11?1.7959,t0.05,10?1.8125)

2、一国的货币供应量与该国的GDP之间应保持一定的比例关系,否则就会引起通货膨胀。为研究某国家的一段时间内通货膨胀状况,研究人员搜集了该国家的货币供应量和同期GDP的历史数据,如下表: 单位:亿元

年份 1991 1992 1993 1994 1995

货币供应量 2.203 2.276 2.454 2.866 2.992

该国GDP 6.053 6.659 8.270 8.981 11.342

8

1996 1997 1998 1999 2000 2001 2002

3.592 4.021 4.326 4.392 4.804 5.288 5.348

11.931 12.763 12.834 14.717 15.577 15.689 15.715

(1)试以货币供应量为因变量y,该国家的GDP为自变量x,建立回归模型;

(2)若该国家的GDP达到16.0,那么货币供应量的置信区间和预测区间如何,取α=0.05。

答案:

一、D,A,B,A,C;A,B,C,B,C。 A,A,B,A,C;A 二、ABD,AE。

三、1、×,这种正相关是因为二者同时受到疾病的严重程度的影响所致。

2、√,因为用最小平方法在现有资料范围内配合的最佳方程,推到资料范围外,就不一定是最佳方程。

四、1、答:变量之间存在的不确定的数量关系为相关关系,可能还会有其他很多较小因素影响;特点是一个变量的取值不能由另一个变

量唯一确定。

2、答:变量性质不同,相关分析不必区分自变量和因变量,而回归分析必须区分;作用不同,相关分析用于测度现象之间有无相关

关系、关系方向、形态及密切程度,而回归分析是要揭示变量之间的数量变化规律。 五、1、解:(1)

???9876年5薪4321002468受教育年数101214 (2)建立线性回归方程

y??0??1x,根据最小二乘法得:

9

???n?xiyi????xi?yi1??n2

??x2i?(?xi)

?????yi??0?n????xi1n??? 由此可得?1=0.732,?0=-2.01,则回归方程是

y=-2.01+0.732x

(3)当受教育年数为15年时,其年薪的点估计值为:

y?=-2.01+0.732×15=8.97(万元)

估计标准误差:

? Si)y=

?(y?y2in?2=

SSEn?2=MSE=0.538=0.733 ? 置信区间为:

y?t1?/2Sn?(x0?x)2y

?n(xi?x)2i?1 =8.97±2.228×0.733×

1(15?6.917)212?120.9167 =8.97±1.290

? 预测区间为:

y?t?/2S1?1(x0?x)2yn?

?n(xi?x)2i?1 =8.97±2.228×0.733×

1?112?(15?6.917)2120.9167 =8.97±2.081 ??? 2、解:(1)建立线性回归方程

y??0??1x,根据最小二乘法得:

???n???xiyi??xi?yi1??n

??x22i?(?xi)

?????yi??0?n????xi1n?? 由此可得?0=0.0093,?1=0.316,则回归方程是

y?=0.0093+0.316x

(3)当GDP达到16时,其货币供应量的点估计值为:

10

y?=0.0093+0.316×16=5.065亿元

估计标准误差:

S?y?i)y=

?(y2in?2=

SSEn?2=MSE=0.09294=0.305 ? 置信区间为:

y?t1?/2Sn?(x0?x)2y

?n(xi?x)2i?1 =5.065±2.228×0.305×

1(16?11.711)212?135.21863 =5.065±0.318亿元

?2 预测区间为:

y?t?/2S1?1(x0?x)yn?

?n(xi?x)2i?1 =5.065±2.228×1?1(16?11.711)20.305×

12?135.21863 =5.065±0.750亿元

11

y?=0.0093+0.316×16=5.065亿元

估计标准误差:

S?y?i)y=

?(y2in?2=

SSEn?2=MSE=0.09294=0.305 ? 置信区间为:

y?t1?/2Sn?(x0?x)2y

?n(xi?x)2i?1 =5.065±2.228×0.305×

1(16?11.711)212?135.21863 =5.065±0.318亿元

?2 预测区间为:

y?t?/2S1?1(x0?x)yn?

?n(xi?x)2i?1 =5.065±2.228×1?1(16?11.711)20.305×

12?135.21863 =5.065±0.750亿元

11


统计学习题区间估计与假设检验...doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:花卉复习题精装版

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: