统计学导论知识点归纳总计期末

xG?nx1?x2?...?xn?n?xi?1ni 加权:xG?(f1?f2?...?fk)x1?x2?...?xkf!f2fk??fii?1n?xi?1nfii

适用于各个变量值之间存在连乘积关系的场合。 主要用于计算现象的平均发展速度,

也适用于对某些具有环比性质的比率求平均.

5. 众数是一组数据中出现频数最多、频率最高的变量值,常用 M0 表示。 a.众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。 可用来测度定性变量的集中趋势; 销售量最大的产品颜色是“白色”,则有M0=“白色” 可以度量定量变量的集中趋势。

从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量值。 b.组距数列中众数的确定:先确定众数组,再通过一定的公式计算众数的近似值。 1) 先找到众数组:

在等距数列中,众数组就是次数最多的组; 在异距数列中,众数组应是频数密度最大的组。 2)根据众数组与其相邻两组的次数差来推算: 下限公式: MO?LMO??2?1?dMO下限公式:MO?UMO??dMO

?1??2?1??2其中LMO、UMO、dMO分别为总数组的下限、上限、组距,?1为总数组的次数与前一组次数之差,?2为总数组次数与后一组次数之差。 6.中位数是将数据由小到大排列后位置居中的数值Me a.

由未分组数据计算中位数:

若数据项数是奇数,则正好位于中间的数值就是中位数 若数据项数是偶数,则取居中两个数值的平均数为中位数

b. 由组距数据计算中位数:

先确定中位数组,即中间位置(用Σf/2来计算)所在的组。

?f?f?SMe?1?SMe?122?dMe ?dMe下限公式Me?UMe? 上限公式Me?LMe?fMefMeLMe UMe dMe fMe分别为下限,上限、组距、次数,SMe?1 变量值小于中位数组下限的

各组次数的累计数,SMe?1变量值大于中位数组下限的各组次数的累计数

7.众数、中位数和算术平均数的比较

1.算术平均数综合反映了全部数据的信息,众数和中位数由数据分布的特定位置所确定。 2.算术平均数和中位数在任何一组数据中都存在而且具有惟一性,但计算和应用众数有两个前提条件:(1)数据项数众多;(2)数据具有明显的集中趋势。

3.算术平均数只能用于定量(数值型)数据,中位数适用于定序数据和定量数据,众数适用

于所有形式(类型、计量层次)的数据

4.算术平均数要受数据中极端值的影响。而众数和中位数都不受极端值的影响。

5. 算术平均数可以推算总体的有关总量指标,而中位数和众数则不宜用作此类推算。

8、测定离散程度的指标称变异指标

a作用1.说明数据的分散程度,反映变量的稳定性、均衡性 2衡量平均数的代表性 3统计推断的重要依据 b两类变异指标:

用绝对数或平均数表示:极差、四分位差、平均差、标准差等。 用相对数表示:离散系数、异众比率等。

9

10

11.方差的主要数学性质

方差或标准差是从平均的意义上反映每个数据与其均值的差异大小,方差和标准差越大,说明变异的程度越大,反之,越小,说明变量的变异程度越小,数据越集中,

方差或标准差都是根据全部数据计算的,因此他们能够充分利用全部数据的差异信息,全面反映数据的离散成度,由于对离差取平方计算,标准差对较大偏差的反映更为灵敏,一边情况下,根据同一组数据计算的标准差要比平均差大些。 12标准化值

12离散系数 (变

异系数)是极差、四分位差、平均差或标准差等变异指标与算术平均数的比 率,以相对数的形式表示变异程度。最常用的离散系数是就标准差来计算的,称之为标准差系数

V??13.

?x

离散系数大,说明数据的离散程度大,其平均数的代表性就差;反之亦然

异众比率

?fii为总次数fmO为众数值的次数

习题填空题

1、数据分布集中趋势的测度值(指标)主要有 众数 、 中位数 和 均值 。其中 众数 和 中位数 用于测度品质数据集中趋势的分布特征, 均值 用于测度数值型数据集中趋势的分布特征。

2、标准差是反映 数据离散程度 的最主要指标(测度值)。

3、几何平均数是计算 平均比率 和 平均速度 的比较适用的一种方法。

4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算 标准系数 。 5、在测定数据分布特征时,如果X?Me?M0,则认为数据呈 对称 分布。

6、当一组工人的月平均工资悬殊较大时,用他们工资的 众数(中位数) 比其算术平均数更能代表全部工人工资的总体水平。 二、单选题:

反映的时间状况不同,总量指标可分为( (2) )

(1)总量指标和时点总量指标 (2)时点总量指标和时期总量指标 (3)时期总量指标和时间指标 (4)实物量指标和价值量指标

2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( (2) )

(1)5.5% (2)5% (3)115.5% (4) 15.5%

3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( (2) )

接近标志值小的一方 (2)接近标志值大的一方 (3)接近次数少的一方 (4)接近哪一方无法判断

4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( (1) ) (1)可变的 (2)总是各组单位数 总是各组标志总量 (4)总是各组标志值

5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( (3) )

(1)提高 (2)不变 (3)降低 (4)不能做结论 6、在变异指标(离散程度测度值)中,其数值越小,则( (2) ) (1)说明变量值越分散,平均数代表性越低 (2)说明变量值越集中,平均数代表性越高 (3)说明变量值越分散,平均数代表性越高 (4)说明变量值越集中,平均数代表性越低 7、有甲、乙两数列,已知甲数列:X甲?70,?甲?7.07;乙数列:

X乙?7,?乙?3.41根据以上资料可直接判断( (4) )

(1)甲数列的平均数代表性大 (2)乙数列的平均数代表性大 (3)两数列的平均数代表性相同 (4)不能直接判别 三、多选题:

某企业计划2000年成本降低率为8%,实际降低了10%。则以下说法正确的是 ( (3)、(5) )

(1)该企业的计划完成程度为10%/8%=125% (2)该企业的计划完成程度为110%/108%=101.85% (3)该企业的计划完成程度为90%/92%=97.83% (4)该企业未完成计划任务 (5)该企业超额完成了计划任务

2、下列那些指标属于结构相对指标( (1)、(2)、(4) ) (1)废品率 (2)平常函件差错率

(3)电话机普及率 (4)生产工人占全部职工的比重 (5)产值利税率

3、 应采用算术平均数计算的有( (1)(3) ) (1)已知工资总额及工人数求平均工资

(2)已知计划完成百分比和实际产值,求平均计划完成百分比 (3)已知计划完成百分比和计划产值,求平均计划完成百分比 (4)已知某厂1990到1995年的产值,求平均发展速度

4、标志变异指标(离散程度测度值)的主要作用( (1)(3) ) (1)衡量平均数代表性的大小

(2)可以反映总体单位的均匀性和稳定性

(3)可以反映社会经济活动过程的节奏性和均衡性 (4)科学地确定必要抽样单位的因素 (5)分析社会经济现象某总体的变动趋势

5、加权平均数的大小受下列那些因素的影响( (1)(2)(3) ) (1)受各组频数或频率的影响 (2)受各组值大小的影响 (3)受各组变量值和频数的共同影响 (4)只受各组变量值的影响 一、 简答题

1、 在考察数据分布特征时,如何正确的选择集中趋势的测度值。

答:首先要根据数类型选择集中趋势的测度值,定类数据选择众数,定序数据选择 中位数数或分位数,数值型数据则一般选用均值;此外,对于数值型数据,还需要进一步根 据数据的分布特征进一步选择不同的集中趋势测度值。当数据成对称分布或接近对称分布时,应选择均值作为集中趋势的测度值;当数据为偏态分布,特别是偏斜的程度较大时,应选择众数或中位数作为集中趋势的代表值。

2、 述平均指标(集中趋势测度值)与变异指标(离散程度测度值)之间的关系。

答:平均指标和变异指标都是说明数据分布特征的测度值,其中平均指标说明数据分布的集中趋势,而变异指标则说明数据分布特征的离中趋势,两者从不同的方面反映数据的分布特征。两者既有区别也有联系,联系主要表现为变异指标可以衡量平均指标的代表性大小,根据一组数据计算的变异指标大,其平均数的代表性就差;变异指标小,其平均数的代表性就大。

3、什么是标准差系数?为什么要计算标准差系数?

答:标准差系数又称为离散系数,它是一组数据的标准差与其相应的均值之比,是测度离散程度的相对指标。计算离散系数主要是为了消除变量值高低和计量单位不同对离散程度测度值的影响。离散系数主要用于变量值高低和计量单位不同的数据之间离散程度的对比。 二、 计算题

1、某地电信局每月固定收取每部电话16元,用户每拨一次电话安使用时间每分钟0.1元

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4