n中也可看出,G就是平均增长率。 (1 G)(1 G) i 1in
4.5简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
4.6简述异众比率、四分位差、方差或标准差的适用场合
对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。
4.7标准分数有哪些用途?
标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。
4.8为什么要计算离散系数?
方差和标准差是反映数据分散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响,也就是与变量的平均数大小有关;另一方面,它们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
第六章思考题
6.1 统计量:设X1,X2 ,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2 ,Xn),不依赖于任何未知参数,则称函数T(X1,X2 ,Xn)是一个统计量。
原因:为了使统计推断成为可能。
6.5 自由度:独立变量的个数 X 2Z ~1~NN((00,,1))6.6 2分布:设 ,则 X~N( , )
F分布:设若U为服从自由度为n1的 2分布,即U~ 2(n1),V为服从自由度为n2的 2
2分布,即V~ (n2),且U和V相互独立,则
U11 F~F(n1,n2)F 12V22
称F为服从自由度n1和n2的F分布,记为
6.7 抽样分布:样本统计量的概率分布是一种理论概率分布随机变量是 样本统计量
26.8 中心极限定理:设从均值为 ,方差为 的一个任意总体中抽取容量为n的样本,
2当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ/n的正态分布
第七章思考
7.2评价估计量的标准:
1, 无偏性:估计量抽样分布的数学期望等于被估计的总体参