《应用统计学》课后习题
第一章 概率论基础知识 P26 1. 试述以下基本概念:
随机实验;基本事件;样本空间;随机事件;相容事件与不相容事件;独立事件;概率;概率运算的主要性质;条件概率;乘法定律与全概率公式;贝叶斯公式;相互独立的随即事件的概率公式;离散型随机变量的概率;离散型随机变量的累积概率;连续性随机变量的概率;连续性随机变量的累积概率;连续性随机变量的概率密度;离散分布与连续分布的区别与对应关系;两个随机变量的联合概率分布;边缘分布;条件分布;均匀分布。 2. 某大公司有南方和北方两大生产基地。2004年某产品的产量为20万件,其中60%是由南方基地生产的,南方基地的非正品率为0.1%,北方基地的正品率为99.6%。
问:在市场中抽查到一件次品,是北方基地生产的概率是多少,是南方基地生产的概率是多少?试用条件概率表来计算。
3. 检查下面的函数以决定它是否是一个概率函数,并画出它的直方图。 P(x)=(X2+5),x=1,2,3,4 (注意:X2表示X的平方) 4. 随机变量X有下面的概率分布,求X得均值和标准差 X P(x) 1 0.5 2 0.2 3 0.1 4 0.1 5 0.1 5. 两点分布(0—1)与二项分布的关系是什么?
6. 某超市经理保证,他的一打一盒的蛋中,不会有多于一个的坏的蛋。如果有多于一个坏的蛋,他将赔一整盒(一打)的鸡蛋,并允许顾客保有原来的那盒蛋。如果一个蛋是坏的概率是0.01,那么经理必须赔送鸡蛋的概率是多少 7. 某篮球运动员在比赛时发球得分的概率是0.8,他在下5个罚球中将失去3个的概率是多少?
8. 在任意一天,某港口的到船数X是一个随机变量。X的概率分布如下表,求在指定的一天中:①恰有14艘船到达的概率;②至少有12艘船到达的概率;③至少11艘船达到的概率。 X P(x) 10 0.4 11 0.2 12 0.2 13 0.1 14 0.1 9. 某公司的决策都由一个3人委员会作出,问:①如果每个成员独立做决策的正确的概率为p,委员会按照简单多数的原则正确作出决策的概率是多少? ②若p=0.1,委员会作出正确决策的概率是多少? ③若p=0.8,委员会作出正确决策的概率是多少?
④当p取什么值时,委员会按照简单多数规则决策,比总经理一个人决策(假设其正确决策的概率也是p)的正确率高? 10. 举出实际生活中服从泊松分布的例子。
11.正太分布是最常见的分布之一,试画出正态分布的密度函数的示意图。
第二章 数据与数据的获得P63 1. 试述以下基本概念:
总体(或母体);个体;变量(或指标);变量值(指标值);数据;便利抽样;滚雪球抽样;简单随机抽样;量表;连续量表;分项量表;Likert量表;测量信度;复本信度;测量效度;表面效度;内容效度 2. 数据测度分为几个类别?试举例说明。 3. 不同测度的数据的应用范围的主要区别是什么?
4. 企业质量管理员在生产线上某环节随机地抽取被加工的部件,并检验记录所抽取的部件的下列信息::①有无缺陷;②加工此部件工人的工号;③部件的重量。
问:①被研究对象的总体是什么;②此总体是有限总体还是无限总体;③样本是什么;④上述三个变量是属性变量还是数值变量? 5. 学生上学时所带书本的重量,是什么测度类型的变量?
6. 研究用某群体中个体的网瘾严重程度时,把严重程度的测度标准设为:无、轻度、重度、严重、非常严重。试:①给关心的变量命名;②判别这个变量的测度类型。
7. 在刚入学的某专业的新生中随机的抽取10名学生,并收集如下三个变量的数据:X:选课课程的门数;Y:课本总费用;Z:被抽取学生的性别。
问:①总体是什么;②此总体是有限总体还是无限总体;③样本是什么;④上述三个变量的测度类型是什么? 8. 观察数据与实验数据的主要区别是什么? 9. 普查与抽样调查的区别是什么? 10.试述百丽抽样与非概率抽样的区别。
11.某研究者从四位数的随机数字表示,按照顺序取出500个数字,凡是电话号码后4位的数字在那500个数字范围内,都欧式 被调查对象。 问:这位研究者所得到的是不是一个随机样本?为什么? 12.分层抽样(分类抽样)的做法和适用条件是什么? 13.如何确定分层抽样(分类抽样)各层的样本个数?
14.在分层抽样中,决定各层样本数的方差分配法(最优分配法)的方差如何合理得获得?
15.整群抽样的做法和适用条件是什么? 16.试述系统抽样(等距抽样)的做法。
17.某研究组在网站上发了一个调查问题,“在您的开销中,通过网络购买的比例是多少?”请问:①这是何种抽样方法;②其结果能够代表消费者网上消费的比例吗?为什么?
18.在基于问卷的研究中,为什么说问卷的深度决定了研究的深度? 19.构成问卷的问题的主要类型有哪些?
20.如下问卷问题是否恰当?如不恰当,存在什么问题? 1) 您多久上一次网?
A.1个月 B.2—3个月 C.半年 D.半年以上 2) 国家队政府官员以权谋私打击,是(选一)
A.非常坚决的 B.有一定的效果 C.效果甚微 D.。。。。。。 3) 领导干部的家属经商,与领导干部的关系是(选一)
A.无关 B.领导自律不严 C.领导纵然包庇 D.权钱交易 E.。。。。。。 4) 您是烟民吗?
A.是 B.不是
5) 如果您没有手机的话,您准备购买吗? A.肯定会 B.可能会 C.不会 D.不确定 6) 您每月上西餐馆的状况是?
A.从不 B.偶尔 C.有时 D.经常
21.试述设立问卷问题的4个思考角度。
22.对变量(特征)之间的相互关系的猜想,对设计问卷的影响是什么? 23.为什么说文献阅读是设立问卷问题的最重要的来源之一? 24.事先考虑数据处理方法对设计问卷的影响是什么? 25.如何判断一个问题可能得到诚实回答(或不诚实回答)?
26.应当如何处置“不能获得诚实回答”和“怀疑的不到诚实回答”的问题? 27.当选问题的备选答案应当满足什么条件? 28.多选题的备选答案如果有交集,会带来什么后果? 29.备选答案的多重含义对问题的分析产生什么影响? 30.试判断如下陈述的正误:
1) 备选答案如果分布在一个维度(例如资金维度)上,可以多选 2) 备选答案必须分布在两个或两个以上的维度才可以多选 3) 备选答案只要是互斥的就可以作为单选问题
4) 备选答案只要分布在一个维度上就可以作为单选问题
5) 多选问题的备选答案是必须是互斥的(即不能有交集)
6) 多选问题的备选答案对于应答者而言必须是相容的(可以有交集) 7) 设置被排序的对象,不必考虑对象的个数
8) 问卷长一些好,可以获得较多的信息
31.为什么说问卷设计一定要通过小规模访谈来修改? 32.测量“重测信度”的要点是什么? 33.拆半信度的适用条件是什么?
34.有内在效度的测量工具,就一定有外在效度吗? 35.有信度就一定有效度吗? 36.如何改进信度与效度?
37.获得数据的实验方法主要适用于哪三种特殊类型的数据? 38.获得数据的实验方法主要有哪三类手段?
39.什么是获得数据的实验的外部因素?应当如何处理外部因素? 40.什么是获得数据的实验的内部因素?应当如何处理外部因素? 41.什么是获得数据的实验的混合因素?应当如何处理外部因素?
42.在什么情况下随机分组较为恰当?什么情况下交替交错分组较为恰当?
第三章 样本数据特征的初步分析P96
1.对于一个数据集合(样本值集合)而言,除了关心样本值本身以外,我们还关心样本值(数据值)出现的_________和_________
2.对于一个数据集合而言,什么是样本值(变量值)的频次?什么是样本值(变量值)的频率?
3.哪些测度等级的数据集合,适合于做频次与频率的饼图? 4.哪些测度等级的数据集合,适合于做频次与频率的条形图? 5.频次与频率的饼图有差异吗?为什么? 6. 频次与频率的条形图有差异吗?为什么? 7.对于一个数据集合而言,什么是累计频率? 8.能够用饼图来表示一个数据集合的累积频率吗? 9.哪些测度等级的数据集合才能计算累积频率?
10.除了表格法以外,还可以用_________图来表示一个数据集合的累积频率分布状况?
11.什么是一个数据集合的茎叶图?
12.对于一个数据集合而言,什么是茎叶?什么是茎叶的宽度?什么是叶?如何依据数据集合来确定茎节和叶?
13.什么是茎节得长度?举例说明茎节的宽度和茎节得长度的区别。
14.在如右茎叶图中:①茎宽=0.1是什么意思? ②在这张茎叶图上显示了多少个数据? ③列出头四个数据值。 N=16 茎宽=0.1 1 3 5 4 2 1 59 60 61 62 63 64 7 148 02669 0247 58 3 15.以下是某班级男生的体重数据(单位:公斤),请作该数据集合的茎叶图。
72.0 65.8 67.1 68.6 71.1 70.5 68.0 68.0 75.0 67.5 76.0 62.7 55.9 50.2 68.4 76.6 80.5 76.4 63.3 73.9 16.什么是直方图?
17.直方图与条形图的区别是什么? 18.什么测度级别的数据,适宜做直方图?
19.作直方图时,一般是先确定区间长度还是先确定区间个数?哪个更好一些? 20.做直方图时,在区间长度确定后,如何确定区间个数? 21.做直方图时,如何确定最左端区间的中心位置? 22.依据如下直方图,判断亵渎Skewness的正负号
23.什么是组频次?什么是组频率? 24.什么是数据集合的众数?
25.什么是单一众数?什么是复众数? 26.什么测度级别的数据集合可以求众数?
27.某国对该国博士的子女数量做了一项调查,结果如下表,请计算子女数的样本均值、方差和标准差。
博士数目 孩子数目 13 0 11 1 18 2 12 3 4 4 1 6