统计学实验指导书(Excel)

在数据输出的工作表中,可以看出每个学生的的成绩的各种分析结果。其中第3行至第18行分别为:

平均值、标准误差、中值、标准误差、样本方差、峰值、偏度、最大值、最小值、和、计数、第1大值、第1小值、95%概率保证程度的置信度。根据“标准偏差”值可以看出王华的成绩离散程度最大,即是说其成绩极不稳定,刘明的成绩是最稳定的。若取中值进行分析则是王华的成绩最好。平均值为刘明最佳。总体上而言,王华的成绩应该是最好的,只是最后一次的成绩太差,造成了较大的影响。 (二)描述统计函数的介绍

得到数据的基本描述统计量除了用Excel数据分析中的描述统计外,还可以直接通过函数功能得到各个统计量的值,步骤如下: 1、打开数据文件。

2、在“插入”菜单中选择函数,从类别中选择“统计”,如下图:

3、选择需要计算的函数,单击确定,例如选择AVERAGE确定,出现如下窗口:

16

4、指定数据区域计算描述统计量,单击确定,即在指定的空白单元格返回该函数值。 5、计算其他函数方法完全相同。

EXCEL中常用描述统计量函数对照表 函数名称(英) 函数名称(中) AVEDEV 平均差 公式或符号 1 A. D . ? ? x ? x n x ? ? x n AVERAGE 算术平均数 GEOMEAN 几何平均数 G ? n ? x H ? ? n HARMEAN MAX MEDIAN MIN MODE 调和平均数 最大值 中位数 最小值 众数 1 x M e M o STDEV 样本标准差(标准偏差) ? ( x ? x ) 2 S ? n ? 1 ? ( x ? x ) 2 ? ? n s 2 STDEVP 总体标准差 VAR VARP

样本方差 总体方差 ? 2 试验三 利用Excel进行推断统计

(一)用Excel进行随机抽样

使用Excel进行抽样,首先要对各个总体单位进行编号,编号可以按随机原则,也可以按有关标志或

17

无关标志,具体可参见教材有关抽样的章节,编号后,将编号输入工作表。

[资料]

假定有80个总体单位,每个总体单位给一个编号,共有从1到80个编号,输入工作表后如下图所示:

[步骤]

输入各总体单位的编号后,可按以下步骤操作:

第1步:单击工具菜单,选择“数据分析”选项,打开“数据分析”对话框,从中选择“抽样”,如图所示。

第2步:单击“抽样”选项,弹出“抽样”对话框,如下图:

18

第3步:在输入区域框中输入总体单位编号所在的单元格区域,在本例是$A$1:$H$10,系统将从A列开始抽取样本,然后按顺序抽取B列至H列。如果输入区域的第一行或第一列为标志项(横行标题或纵列标题),可单击标志复选框。

第4步:在抽样方法项下,有周期和随机两种抽样模式:

“周期”模式即所谓的等距抽样,采用这种抽样方法,需将总体单位数除以要抽取的样本单位数,求得取样的周期间隔。如我们要在80个总体单位中抽取10个,则在“间隔”框中输入8。

“随机模式”适用于纯随机抽样、分类抽样、整群抽样和阶段抽样。采用纯随机抽样,只需在“样本数”框中输入要抽取的样本单位数即可;若采用分类抽样,必须先将总体单位按某一标志分类编号,然后在每一类中随机抽取若干单位,这种抽样方法实际是分组法与随机抽样的结合;整群抽样也要先将总体单位分类编号,然后按随机原则抽取若干类作为样本,对抽中的类的所有单位全部进行调查。可以看出,此例的编号输入方法,只适用于等距抽样和纯随机抽样。

第5步:指定输出区域,在这里我们输入$A$12,单击确定后,即可得到抽样结果。 [结果]

8个随机抽取的样本编号就显示在区域“A12:A19”单元格中。

(二)用Excel求置信区间

用Excel的“统计函数”工具进行抽样推断中的区间估计测算。下面结合实例来说明具体的操作步骤。

[资料]

某商店随机抽查10名营业员,统计他们的日营业额(千元)如附图5-1中的“A2:A11”。假定该商店各营业员的日营业额是服从正态分布,试以95%的置信水平估计该商店营业员的日营业额的置信区间。

为构造区间估计的工作表,在工作表中输入下列内容:A列输入样本数据,B列输入变量名称,C列输入计算公式,其实C列中当计算公式输入后显现的是计算结果,为了说明计算过程,在D列中展示C列的计算公式。

[步骤]

第1步:把样本数据输入到A2:A11单元格

第2步:在C2中输入公式“=COUNT(A2:A11)”,得到计算结果“10”。“COUNT”是计数函数,得出样本容量(n=10)。

第3步:在C3中输入“=AVERAGE(A2:A11)”,在C4中输入“=STDEV(A2:A11)”,在C5中输入“=C4/SQRT

19

(C2)”,在C6中输入0.95,在C7中输入“=C2-1”,在C8中输入“=TINV(1-C6,C7)”,在C9中输入“=C8*C5”,在C10中输入“=C3-C9”,在C11中输入“=C3+C9”。在输入每一个公式回车后,便可得到如下表的结果。

样本数据 42 45 43 40 38 36 35 32 34 39 [结果]

从上面的结果我们可以知道,该商店营业员的日营业额的置信下限为35.3989071 (千元),置信上限为41.4010929 (千元)。计算结果可以得出,我们有95%的把握认为该商店营业员的日营业额平均在35.3989071(千元)到41.4010929(千元)之间。

在上表中,对于不同的样本数据,依上表的格式,只要输入新的样本数据,再对C列公式略加修改,置信区间就会自动给出。

(三)用Excel进行假设检验

假设检验包括一个正态总体的参数检验和两个正态总体的参数检验。对于一个正态总体参数的检验,可利用函数工具和自己输入公式的方法计算统计量,并进行检验。本例主要介绍如何使用Excel进行两个正态分布的均值方差的检验。

[资料]

为了评价两个学校的教学质量,分别在两个学校抽取样本。在A学校抽取30名学生,在B学校抽取40名学生,对两个学校的学生同时进行一次英语标准化考试,成绩如下所示。假设学校A考试成绩的方差为64,学校B考试成绩的方差为100。检验两个学校的教学质量是否有显著差异。(? =0.05) 学校A 70 97 85 87 64 73 86 90 82 83 92 74 72 94 76 89 73 88 91 79 84 76 87 88 85 78 83 84 91 74 学校B 76 91 57 62 89 82 93 64 80 78 99 59 79 82 70 85 83 87 78 84 84 70 79 72 91 93 75 85 65 74 79 64 84 66 66 85 78 83 75 74 计算指标 样本数据个数 样本均值 样本标准差 抽样平均误差 置信水平 自由度 t值 误差范围 置信下限 置信上限 计算公式 C2=COUNT(A2:A11) C3=AVERAGE(A2:A11) C4=STDEV(A2:A11) C5=C4/SQRT(C2) C6=0.95 C7=C2-1 C8=TINV(1-C6,C7) C9=C8*C5 C10=C3-C9 C11=C3+C9 10 38.4 4.195235393 1.326649916 0.95 9 2.262158887 3.001092898 35.3989071 41.4010929 计算结果 假定我们将上表中学校A的数据输入到工作表中的A2:A31,学校B的数据输入到工作表的B2:B41。 [步骤]

第1步:选择“工具”下拉菜单。再选择“数据分析”选项。

20

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4