是这样进行的:设某个团体中具有某种敏感特征人的比例为α,称具有这种特征的人为团体A。直接向被调查者询问你是否属于团体A是会引起反感的。瓦纳设计的方法是提出两个问题
问题1:你属于团体A; 问题2:你不属于团体A。
调查者准备好一叠题号卡,其中百分比p的卡标有数字1,百分比1-p的卡标有数字2。调查时,调查人请被调查人从题号卡众任抽一张,并告诉被调查人不要把抽到的结果告诉调查人,若抽到标有1的卡就回答问题1,若抽到标有2的卡应回答问题2,请他们选择“是”或“非”。由于被调查人认为调查人并不知道他究竟回答那一个问题,所以做出真实回答的可能性比较大。
社调查了n个人,其中有m人回答“是”,我们要用概率论的方法估算总体中属于团体A的比例。
由概率的加法公式和乘法公式,我们计算回答“是”的概率: P{回答“是”}=P{抽到标有1的卡且回答“是”}+P{抽到标有2的卡且回答“是”}=P{抽到标有1的卡}P{回答“是”/抽到标有1的卡}+P{抽到标有2的卡}P{回答“是”/抽到标有2的卡}。
上述公式实际上是概率论中的全概率公式。
由于样本数位n,回答“是”的总数为m,回答“是”的概率可以用
m来估计。设属于团体A的概率为α,于是上式可写成 nm?p??(1?p)(1??) n从中解出
??1m1(p?1?).p? 2p?1n2其中?是总体中属于团体A的概率的估计值。
3、模型的应用
为调查大学生中某一年级学生参加外语考试作弊的比例,用随机回答法进行调查,设计的两个问题为
问题1:你在这次考试中有作弊行为; 问题2:你在这次考试中无作弊行为。
设计得题号卡共100张,其中75张标有数字1,25张标有数字2。请200名学生根据任意抽得的卡上的标号对问题1或问题2用“是”或“否”回答(抽出的卡再放回),结果有60名回答为“是”,求该年级学生外语考试作弊的比例。
有n=200,p=0.75,m=60,用公式
??1m(p?1?). 2p?1n计算,得
??160(0.75?1?)?0.1
2?0.75?1200因此,估计作弊的人数比例为10%。
这一方法无法推算某一个人是否具有某种特性,只能估计总体中具有这种特性的人数比例。瓦纳证明,随机问答法在很多情形下均优于直接询问法。
4、模型的改进
瓦纳的随机问答法中所设计的两个问题都是与敏感特性直接有关
的,很有可能引起人们的戒备。有人对此方法作了改进,将第二个问题改为与敏感特性不相关的问题,其余的做法与上述随机问答法相同。
第二个问题可以是:你是冬季出生的吗?你的学生证号码末位是奇数码?你出生在长江以南?等等。这些问题都可使抽象为:你属于团体B。这些问题涉及的关键是,回答“是”的概率要么是已知的,要么是以前已作出过估计的,设它为?B
这样改进方法中的两个问题成为 问题1:你属于团体A; 问题2:你属于团体B。
仍设样本容量为n,卡中标有1的比例为p,m人回答“是”。
类似于随机问答法,有
m?p??(1?p)?B n从而 ??1m((p?1)?B?).p?0 pn例如,某高级中学要调查学生谈恋爱的比例。设计了一叠题号卡,其中75张标有1,25张标有2。调查100个学生,提以下两个问题
问题1:你谈过恋爱吗?
问题2:你学生证末位号码是偶数吗?
让被调查学生任意抽取1张卡(随即放回并不让调查者看到所标的数字),对卡上的标号所对应的问题用“是”或“否”加以回答,有18人回答“是”,要估计该校学生谈过恋爱的人数比例。
显然n=100,p=0.75,m=18。学生证号码奇、偶各占一半,因此
?B=0.5。所以
??1m1((p?1)?B?)?(?0.25?0.5?0.18)?0.073 pn0.75基谈过恋爱的学生占7%略多一些。 例12假设检验方法在广告效果监测中的应用 一、案例背景
武汉市一家从事民营保健品生产的K公司在过去的几年中获得快速成长,其拳头产品在内地有着很高的知名度。该公司打算将其开发的一种新型药剂口服液推向全国。K公司打算投入50万元广告费用开拓沿海某地市场。沿海地区一家广告公司(简称M公司)得到信息后,主动联系K公司并宣称其在沿海地区有较强的实力并承诺:发布广告半年后,武汉K公司的这种新型口服液在当地的知晓率可以达到25%。K公司负责广告的经理经过实地考察,决定将该广告业务交给M公司。
双方经过协商达成如下协议:
K公司于当年11月11日先期支付30万元给M公司,M公司自12月1日开始广告宣传,半年后即翌年5月31日,由K公司联系并经M公司同意,邀请某中立调查咨询公司(简称N公司)进行广告效果检测,N公司要求监测费用为5万元。若监测结论支持M公司的承诺,即产品知晓率在当地达到25%,由K公司将剩余的20万元一次性支付给M公司,并支付N公司5万元监测费用。若调查结论不支持M公司的承诺,则M公司一次性支付K公司10万元违约金,
并支付N公司5万元的广告监测费用。
半年后,中立公司(N公司)从当地的目标客户群中随机不重复地抽取了一个样本容量为400人的样本进行调查。
接受调查的400人中,有88人对该种口服液知晓,详细资料见表1,表2、表3。
表1 样本的性别结构
性别结构 男 女 总计
表2 样本的年龄结构
年龄结构 老 中 青 总计
表3 样本的收入结构
收入结构 高 抽查人数 88 知晓人数 24 知晓率(%) 27.3 抽查人数 220 120 60 400 知晓人数 46 32 10 88 知晓率(%) 20.9 26.67 16.67 22 抽查人数 240 160 400 知晓人数 56 32 88 知晓率(%) 23.3 20.00 22