定性数据分析第二章课后答案

2020-03-26 19:44

第二章课后作业

【第1题】

解:由题可知消费者对糖果颜色的偏好情况(即糖果颜色的概率分布),调查者

取500块糖果作为研究对象,则以消费者对糖果颜色的偏好作为依据,500块糖果的颜色分布如下表1.1所示:

表1.1 理论上糖果的各颜色数

橙色 150 黄色 100 红色 100 棕色 50 绿色 50 蓝色 50 由题知r=6,n=500,我们假设这些数据与消费者对糖果颜色的偏好分布是相符,所以我们进行以下假设:

原假设:H0:类Ai所占的比例为pi?pi0(i?1,...,6) 其中Ai为对应的糖果颜色,pi0(i?1,...,6)已知,?i?1pi0?1 则?2检验的计算过程如下表所示:

颜色类别 6ni 172 124 85 41 36 42 500 npi0 150 100 100 50 50 50 500 (ni?npi0)2npi0 3.2267 5.7600 2.2500 1.6200 3.9200 1.2800 A1 A2 A3 A4 A5 A6 合计 ?2?18.0567 在这里r?6。检验的p值等于自由度为5的?2变量大于等于18.0567的概率。

,5)”??0.05,在Excel中输入“?chidist(18.0567,得出对应的p值为p?0.0028762故拒绝原假设,即这些数据与消费者对糖果颜色的偏好分布不相符。

【第2题】

解:由题可知 ,r=3,n=200,假设顾客对这三种肉食的喜好程度相同,即顾客

选择这三种肉食的概率是相同的。所以我们可以进行以下假设:

1原假设 H0:pi?(i?1,2,3)

32?则检验的计算过程如下表所示:

肉食种类 猪肉 牛肉 羊肉 合计 ni 85 41 74 200 npi 66.67 66.67 66.67 200 (ni?npi)2npi 5.03958 9.88374 0.80589 ?2?15.72921 在这里r?3。检验的p值等于自由度为2的?2变量大于等于15.72921的概率。

,2)”,得出对应的p值为在Excel中输入“?chidist(15.72921p?0.0003841??0.05,故拒绝原假设,即认为顾客对这三种肉食的喜好程度是

不相同的。

【第3题】

解:由题可知 ,r=10,n=800,假设学生对这些课程的选择没有倾向性,即选

各门课的人数的比例相同,则十门课程每门课程被选择的概率都相等。所以我们可以进行以下假设:

原假设H0:pi?0.1(i?1,2,...,10) 则?2检验的计算过程如下表所示: 类别(课程) 1 2 3 4 5 6 ni 74 92 83 79 80 73 npi0 80 80 80 80 80 80 (ni?npi0)2npi0 0.4500 1.8000 0.1125 0.0125 0.0000 0.6125 7 8 9 10 合计 77 75 76 91 800 80 80 80 80 800 0.1125 0.3125 0.2000 1.5125 ?2?5.125 在这里r?10。检验的p值等于自由度为9的?2变量大于等于5.125的概率。在

,9)”??0.05,Excel中输入“?chidist(5.125,得出对应的p值为p?0.823278349故接受原假设,即学生对这些课程的选择没有倾向性,各门课选课人数的频率为0.1。

【第4题】

解:(1)由题可知,r=3,n=5606,假设1997年8月中国股民投资状况的调查

数据和比较流行的说法是相符合。所以我们可以进行以下假设: 原假设:H0:类Ai所占的比例为pi?pi0(i?1,2,3)

其中Ai(i?1,2,3)为股票投资中对应的赢、持平和亏,pi0(i?1,2,3)已知,

?3i?1pi0?1

则?2检验的计算过程如下表所示: 股票投资状况 ni 1697 1780 2129 5606 npi0 560.6 1121.2 3924.2 5606 (ni?npi0)2npi0 2303.61213 387.10082 821.24842 A1 A2 A3 合计 ?2?3511.96137 在这里r?3。检验的p值等于自由度为2的?2变量大于等于3511.96137

,2)”的概率。在Excel中输入“?chidist(15.72921,得出对应的p值为p?0??0.05,

故拒绝原假设,即认为1997年8月中国股民投资状况的调查数据和比较流行的说法是不相符合的。

(2)解:由题知股票投资中,赢包括盈利10%及以上、盈利10%以下,符合条件

的股民共有151+122=273人;持平可以指基本持平,符合条件的股民共有240人;亏包括亏损不足10%和亏损10%及以上,符合条件的股民共有517+240=757人。

由题可知,r=3,n=1270,假设2003年2月上海青年报上的调查数据和比较流行的说法是相符合。所以我们可以进行以下假设:

原假设:H0:类Ai所占的比例为pi?pi0(i?1,2,3)

其中Ai(i?1,2,3)为股票投资中对应的赢、持平和亏,pi0(i?1,2,3)已知,

?3i?1pi0?1

则?2检验的计算过程如下表所示: 股票投资状况 ni 273 240 757 1270 npi0 127 254 889 1270 (ni?npi0)2npi0 167.84252 0.77165 19.59955 A1 A2 A3 合计 ?2?188.21372 在这里r?3。检验的p值等于自由度为2的?2变量大于等于188.21372的

,2)”概率。在Excel中输入“?chidist(188.21372,得出对应的p值为p?0??0.05,

故拒绝原假设,即认为2003年2月上海青年报上的调查数据和比较流行的说法是不相符合的。

【第5题】

解:由题意,我们将“开红花”、“开白花”和“开粉红色花”分别记为A1,A2,A3,并记Ai所占的比例为pi(i?1,2,3),本题所要检验的原假设为:

H0: p1?p2, p2?q2, p3?2pq

其中p?q?1,这些pi都依赖一个未知参数p。在原假设H0成立时的似然函数为

L(p)?(p2)24(q2)36(2pq)60?p108(1?p)132

则对L(p)取对数得

lnL(p)?108lnp?132ln(1?p)

从而有对数似然方程

?lnL(p)108132???0 ?pp1?p??0.45,从而得到pi的极大即108(1?p)?132p。据此求得p的极大似然估计p?i?pi(p?),i?1,2,3。它们分别为0.2025、0.3025和0.495。由此得各似然估计 p?i,i?1,2,3。它们分别为24.3、36.3、132.20和59.4。类的期望频数的估计值np2?所以统计量的值为

(24?24.3)2(36?36.3)2(60?59.4)2?????0.01224

24.336.359.42这里r=3,m=1,r-m-1=1。检验的p值等于自由度为1的?2变量。利用Excel

,1)?0.911893??0.05,故接受原假设,即我们可以算出p值p?chidist(0.01224认为以上数据在0.05的水平下与遗传学理论是相符的。

【第6题】

解:由题意,我们可以得到以下信息:

① 遗传因子的分布律为:(其中p+q+r=1)

遗传因子 概率 ②血型的分布律为:

血型 概率 O A B AB A B O p q r r2 p2?2pr q2?2qr 2pq 将“O”血型、“A”血型、“B”血型和“AB”血型这四类血型分别记为A1, ......,A4,并记Ai所占的比例为pi (i?1,......,4),本题所要检验的原假设为:


定性数据分析第二章课后答案.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:AB角工作制度

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: