央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线,称频数曲线,近似于数学上的正态分布。 4. 第一类错误:拒绝了实际上成立的H0,即样本原本来自μ=μ
0
的总体,由于抽样的偶然性得到了较大的t值,较小的P值,按α=0.05检验水准拒绝了H0,接受了H1,这类“弃真”错误称为第一类错误。
5. 假设检验:hypothesis test, 亦称显著性检验,其基本思想是先对总体的参数或分布做出某种假设,然后根据样本信息选用适当的方法,推断此假设应当拒绝或不拒绝。 05名解
2.ranked data:等级资料又称定量资料,或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料
3.Natural increase rate:自然增长率:一定时间内种群自然增长数(出生数>成长死亡数)与种群总数之比 4.parameter:参数,描述总体变量值特征的指标
5.statistical model:统计模型,以数据统计分析为基础的变量关系μ模型类型
7.chi-square test:卡方检验,是一种用途很广的假设检验方法,它在分类资料统计推断中应用,包括两个率或两个构成比比较的卡方检验;多个率或多个构成比比较μ卡方检验及分析资料μ相关分析等.
11
8.sample size:样本含量,样本中包含的观察单位数
9.Quartile range:四分位数间距,是由第3四分位数和第1四分卫数相减而得,一般和中位数一起描述偏态分布资料的分布特征 09名解
1.standard error样本均数的标准差又叫标准误表示样本抽样误差的大小
3.rank correlation: 等级相关又称秩相关是一种非参数统计方法,适用于资料不是正态双变量或总体分布未知;数据一端或两端有不确定值的资料或等级资料
4.confidence interval: 可信区间,是按一定的概率100(1-)%估计总体均数所在的范围,亦称估计区间。常取的可信度为95%和99%。
5.variance方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。 09简答
1. 假设检验中如何确定采用单侧检验还是双侧检验?
答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的.若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;在尚不能用专业知识判断谁高谁低时,用双侧检验.若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心之中一种可能,则取单侧检验.一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用.
12
2.简述配对设计方差分析的基本思想.
答:方差分析的基本思想就是根据试验设计的类型,将全部
测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释.通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响.
方差分析的应用条件:1.各样本是相互独立的随机样本,均服
从正态分布;2.相互比较的各样本的总体方差相等.即具有方差齐性.
3.神马是两类统计学错误?二者有何联系?正常情况下该怎么进
行控制
答:两类统计学错误即I型错误和Ⅱ型错误.I型错误是指拒绝了实际上成立的H0所犯得”弃真”错误,其概率大小用α表示. Ⅱ型错误则是指”接受”了实际上不成立的H0所犯的”取伪”错误,其概率大小用β表示.当样本含量n确定时,α愈小,β愈大’反之α愈大,β愈小.了解这两类错误的实际意义在于,若应用中要重点减少α(如一般的假设检验),则取α=0.05;若在应用中重点减少β(如方差齐性检验,正态性检验或想用一种方法代替另一种方法的检验等),则取α=0.10或0.20甚至更高. 4.简述绘制统计表的基本要求
13
答:1.标题:概括表的主要内容,包括研究的时间.地点和研究内容,放在表的上方.2标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标明指标单位.3线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分割开来,纵标目下横线将标目的文字区与表格的数字区分开来.部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开.其他横线竖线一概省去.4数字:用阿拉伯数字表示.无数字用”-“表示,缺失数字用”…”表示,数值为0记为”0”,不要留空项.数字按小数位对齐.5表中数字区不要插入文字,也不列备注项.必须说明者标”*”号,在表下方说明.
5.作两样本均数比较的t检验,结论拒绝H0时,是否证明了两总体均数不同?why? 06问答
1. 可信区间和参考值范围有何不同?
意义、计算公式和用途均不同。(1)参考值范围是指同质总体内包括百分之几十个体值的估计范围。而可信区间是指在百分之几十的可信度估计的总体参数的所在范围。(2)同样的百分之几十,参考值范围是样本范围,可信区间是指可信度范围,二者有着本质的不同。(3)从意义来看,95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。(4)从计算公式看,若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信区间的公式是:。前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。(5)从用途上看,可信区间用来估计总体均数,参考值范围用来判断观察对象的某项指标是否正常。
14
05问答
1. 简述标准差.标准误的区别与联系?
答:标准差是描述标准个体值复异程度μ指标,不能通过统计方法来控制,标准误则为样本均数μ标准差,反应的是样本均数的离散程度,也反映了样本均数与总体均数μ的差异.联系.Sx=S/n可看出Sx与S差正比,增加n可减少Sx 2. 简述应用相对数时应注意哪些问题?
答:应用相对数时应注意:1结构相对数不能代替强度相对数2计算相对数应有足够数量3正确计算合计率4注意资料的可比性5对比不同时期资料应注意客观条件是否相同6样本率(构成比)的抽样误差,不要简单比较,进行假设检验. 3. 简述X2检验的基本思想是神马?
答:是以X2值的大小来反映理论频数与实际频数的吻合程度,在假设H0成立的条件下,实际频数与理论频数相差不应太大,即X2值不应太大,若实际计算出μx2值越大,超过了设定的检验水准所对应μ界值,叫有理由怀疑H0的真实性,从而推论HO确定H1 4. 简述统计图制作要求有哪些?
答:1根据资料性质和分析目的正确选用适当μ统计图 2与统计表相似,统计图必须有标题,在图u下方 3统计图一般有横轴和纵轴,比例为5:7或7:5 4统计图用不同颜色和线条表达不同事物和对象的统计量.
5. 简述检验假设与可信区间的联系与区别?
15