第3章 数据的概括性度量
一、学习指导
数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。
章节 众数 主要内容 学习要点 ? 概念:众数。 ? 众数的特点。 ? 概念:中位数,四分位数。 ? 中位数和四分位数的特点。 ? 中位数和四分位数的计算。 ? 概念:平均数,简单平均数,加权平均数,几何平均数。 ? 简单平均数和加权平均数的计算。 ? 平均数的性质。 ? 几何平均数的计算和应用场合。 ? 众数、中位数和平均数在分布上的关系。 ? 众数、中位数和平均数的特点及应用场合。 ? 概念:异众比率。 ? 异众比率的计算和应用场合。 ? 概念:四分位差。 ? 四分位差的计算和应用场合。 ? ? ? ? ? ? ? ? ? 概念:极差,平均差,方差,标准差。 极差的计算和特点。 平均差的计算和特点。 样本方差和标准差的计算。 总体方差和标准差的计算。 概念:标准分数。 标准分数的计算和应用。 经验法则。 切比雪夫不等式。 中位数和分位数 3.1 集中趋势的度量 平均数 众数、中位数和平均数的比较 异众比率 四分位差 方差和标准差 3.2 离散程度的度量 相对位置的度量 离散系数 ? 概念:离散系数。 ? 离散系数的计算。 ? 离散系数的用途。 ? 概念:偏态,偏态系数。 ? 偏态系数的计算。 ? 偏态系数数值的意义。 3.3 偏态与峰态的度量 偏态及其测度 6
峰态及其测度 ? ? ? ? ? 概念:峰态,峰态系数。 峰态系数的计算。 峰态系数数值的意义。 用Excel计算描述统计量。 Excel统计函数的应用。 二、主要术语和公式
(一)主要术语
1. 众数:一组数据中出现频数最多的变量值,用Mo表示。 2. 中位数:一组数据排序后处于中间位置上的变量值,用Me表示。 3. 四分位数:一组数据排序后处于25%和75%位置上的值。 4. 平均数:一组数据相加后除以数据的个数而得到的结果。 5. 几何平均数:n个变量值乘积的n次方根,用Gm表示。
6. 异众比率:非众数组的频数占总频数的比率。
7. 四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。 8. 极差:也称全距,一组数据的最大值与最小值之差。
9. 平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。 10. 方差:各变量值与其平均数离差平方的平均数。 11. 标准差:方差的平方根。
12. 标准分数:变量值与其平均数的离差除以标准差后的值。
13. 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。 14. 偏态:数据分布的不对称性。
15. 偏态系数:对数据分布不对称性的度量值。 16. 峰态:数据分布的平峰或尖峰程度。 17. 峰态系数:对数据分布峰态的度量值。
(二)主要公式
名称 公式 中位数 ?x?n?1?????2??Me??????1??x?n??x?n??????1???2??2?????2?n为奇数 n为偶数简单样本平均数 x??xi?1nin 7
加权样本平均数 x??Mi?1kifi n几何平均数 Gm?nx1?x2???xn?n?xi?1ni 异众比率 Vr??f?f?fiim?1?fm ?fi四分位差 极差 Qd?QU?QL R?max(xi)?min(xi) 简单平均差 Md?k?xi?1ni?x n加权平均差 Md??Mi?1i?xfi n简单样本方差 s2??(xi?1ni?x)2 n?1简单样本标准方差 s?k?(xi?1ni?x)2 n?1加权样本方差 s2??(Mi?1i?x)2fi n?1加权样本标准差 s??(Mi?1ki?x)2fi n?1zi?xi?x ss x标准分数 离散系数 vs? 8
未分组数据的偏态系数 n?xi?x?SK??? ?(n?1)(n?2)?s?3分组数据的偏态系数 SK???Mi?x?i?1k3fi 2ns3未分组数据的峰态系数 K?n(n?1)?(xi?x)4?3??(xi?x)2?(n?1)(n?1)(n?2)(n?3)s4 分组数据的峰态系数 K??(Mi?1ki?x)4fi4ns?3
9
第4章 抽样与参数估计
一、学习指导
参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。本章首先介绍抽样分布的有关知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。本章各节的主要内容和学习要点如下表所示。 章节 主要内容 学习要点 ? 概念:简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽样,系概率抽样方法 统抽样,整群抽样。 ? 用Excel抽取简单随机样本。 ? 概念:抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的4.1 抽样与抽样分布。 抽样分布 ? 中心极限定理。 抽样分布 ? 样本均值抽样分布的特征。 ? 样本均值的抽样分布与总体分布的关系。 ? 样本比例抽样分布的形式和特征。 ? 样本方差抽样分布的形式。 估计量与估计值 ? 概念:估计量,估计值。 4.2 参数估? 概念:点估计,区间估计,臵信区间,计的一般问臵信水平。 点估计与区间估计 题 ? 臵信区间构建的原理。 ? 臵信区间的解释。
10