如何辨析平均数、众数、中位数哪一个更具代表性
今天教完中位数以后,发现部分学生对平均数、众数、中位数需要进一步明晰三个统计量的关系:
一、概念:
平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。
中位数:将一组数据按大小顺序排列,处在最中间位置的一个数叫做这组数据的中位数 。
众数:在一组数据中出现次数最多的数叫做这组数据的众数。 二、求法
平均数:用所有数据相加的总和除以数据的个数,需要计算才得求出。 中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。它的求出不需或只需简单的计算。
众数:一组数据中出现次数最多的那个数,不必计算就可求出。 三、相同点
平均数、众数和中位数都叫统计量,它们在统计中,有着广泛的应用。平均数、中位数、众数都是描述数据的集中趋势的“特征数”,平均数、中位数和众数从不同侧面给我们提供了同一组数据的面貌,平均数和中位数都有单位(众数如果表示的是数时,也有单位);它们的单位和本组数据的单位相同。三者都可以作为一组数据的代表。
四、不同点
在一组数据中,平均数和中位数都具有惟一性,但众数有时不具有惟一性。在一组数据中,可能不止一个众数,也可能没有众数。
平均数:平均数具有惟一性,是通过计算得到的,它不是数据中的原始数据。 反映了一组数据的平均大小,常用来一代表数据的总体 “平均水平”。
中位数:中位数具有惟一性,当一组数据有奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数
据相等,此时的中位数就是一个虚拟的数。 像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”。
众 数:是一组数据中的原数据 ,它是真实存在的。反映了出现次数最多的数据,用来代表一组数据的“多数水平”。
这三个统计量虽反映有所不同,但都可表示数据的集中趋势,都可作为数据一般水平的代表。
五、各自优缺点 1、平均数的优点。
反映一组数的总体情况比中位数、众数更为可靠、稳定,它也是学生今后学习计算离差、相关和统计推断的基础。
平均数的缺点。
平均数需要整批数据中的每一个数据都加人计算,因此,在数据有个别缺失的情况下,则无法准确计算。一组数据的每一个数据都要参加计算才能求出,特别是当一组数量较大的数据,其计算的工作量也较大。平均数易受极端数据的影响,从而使人对平均数产生怀疑。这也就是为什么在许多竞赛场合下对评委亮分后的成绩分数,要去掉一个最高分和一个最低分,尔后再计算平均数的一种考虑。
2、中位数的优点。
简单明了,很少受一组数据的极端值的影响。 中位数的缺点。
中位数不受其数据分布两端数据的影响,因此中位数缺乏灵敏性,不能充分利用所有数据的信息。当观测数据已经分组或靠近中位数附近有重复数据出现时,则难以用简单的方法确定中位数。
3、 众数的优点。
比较容易了解一组数据的大致情况,不受极端数据的影响,并且求法简便。 众数的缺点。
当一组数据变化很大时,它只能用来大略地估计一组数据的集中趋势。 六、辨析
平均数:看平均数是否具有代表性,主要看它在一组数据中所处的位置,也就是看它能否代表大多数数据的水平。
中位数:看中位数是否具有代表性,主要看处于它两侧的数据大小是否均衡。 众数:同样个数的数据中,众数出现的次数越多,这个众数也就越具有代表性。
平均数、中位数和众数从不同的侧面向我们提供了一组数据的面貌,我们可以把这三种特征数作为一组数据的代表,但它们所表示的意义是不同的。
选用它们表示一组数据的集中趋势时,一般是遵循“多数原则”,即哪种特征数能代表这组数据的绝大多数,正确选用合适的特征数来说明、评价、分析实际问题,避免误用和滥用。
关于平均数、中位数、众数的知识可以总结为:
分析数据平中众,比较接近选平均,相差较大看中位,频数较大用众数; 所有数据定平均,个数去除数据和,即可得到平均数;大小排列知中位; 整理数据顺次排,单个数据取中问,双个数据两平均;频数最大是众数。