D.分配在各组的次数 4.
E.组距
组限的确定通常有两种方法,它们是( BC )。
B.对连续变量采用重叠分组法 D.对连续变量采用不重叠分组法
A.对离散变量采用重叠分组法 C.对离散变量采用不重叠分组法
E.对连续变量和离散变量均采用重叠分组法 5.
对统计总体进行分组时,采用等距分组还是异距分组,决定于( AD )。
B.变量值的多少 E.组数的多少
C.次数的大小
A.现象的特点
D.数据分布是否均匀 6.
统计数据的审核主要是审核数据的( ABC )。
B.及时性 E.代表性
C.完整性
A.准确性 D.科学性 7.
统计数据整理的内容一般有( ABCE )。
B.对统计数据进行分组 D.对统计数据进行分析
A.对原始数据进行预处理 C.对统计数据进行汇总
E.编制统计表、绘制统计图 8.
国民经济中常用的统计分组有( ABCDE )。
B.登记注册类型分组 D.3次产业分类
A.经济成分分组
C.国民经济行业分类 E.机构部门分类 9.
某单位100名职工按工资额分为3000元以下、3000~4000元、4000~6000元、
6000~8000元、8000元以上等5个组。这一分组( BDE )。 A.是等距分组
B.分组标志是连续变量 D.相邻的组限是重叠的
C.末组组中值为8000元
E.某职工工资6000元,应计在6000~8000元组内 10.
变量数列中频率应满足的条件是( BC )。
B.各组频率大于或等于0 D.各组频率之和小于1
A.各组频率大于1
C.各组频率之和等于1 E.各组频率之和大于0
11
四、判断题
1. 2.
统计数据整理就是对原始资料的整理。( × )
能够对统计总体进行分组,是由统计总体中各个单位所具有的差异性特点决定的。
( √ ) 3. 4.
对一个既定的统计总体而言,合理的分组标志只有一个。( × )
组中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水
平。( × ) 5. 6. 7.
凡是分组表都是次数分布表。( × )
按数量标志分组的目的,就是要区别各组在数量上的差别。( × )
连续型变量可以作单项式分组或组距式分组,而离散型变量只能作组距式分组。
( × ) 8. 9. 10.
在组距相等的条件下,频数分布和频数密度的分布是一致的。( √ )
年代都是以数字表示的,所以按年代排列各种指标属于按数量标志分组。( × ) 饼形图是以圆的面积或圆内各扇形的面积来表示数值大小或总体内部结构的一种
图形。( √ )
五、简答题
1. 2. 3.
什么是统计数据的分组整理?简述统计数据分组整理的原则和步骤。 简要说明单项式分组和组距式分组的适用范围。 简要说明各种统计图的使用方法。
六、计算题
1.
有一个班40名学生的统计学考试成绩如表3-3所示。
表3-3 40名学生的统计学考试成绩表
89 94 98 83
88 82 67 63
76 77 59 89
99 79 72 86
74 97 56 95
60 78 81 92
82 87 77 84
60 84 73 85
93 79 65 79
99 65 66 70
学校规定:60以下为不及格;60~75分为中;76~89分为良;90~100为优。试把该
12
班学生分为不及格、中、良、优4组,编制一张频数分布表。 解:统计学考试成绩频数分布表如下表3-7所示。
表3-7 40名学生的统计学考试成绩频数分布表
成绩分组 60分以下 60 ~ 75 76 ~ 89 90 ~100 合 计 学生人数(人) 2 11 19 8 40 比率(%) 5.0 27.5 47.5 20.0 100.0 2.
宏发电脑公司在全国各地有36家销售分公司,为了分析各公司的销售情况,宏发
公司调查了这36家公司上个月的销售额,所得数据如表3-4所示。
表3-4 分公司销售额数据表
60 72 78 86
60 73 78 87
62 74 79 88
65 75 79 89
65 76 80 89
66 76 82 90
67 76 83 91
(单位:万元)
70 76 84 92
71 77 84 92
根据上面的资料进行适当分组,并编制频数分布表。
解:“销售额”是连续变量,应编制组距式频数分布表。具体过程如下:
第一步:计算全距:R?92?60?32
第二步:按经验公式确定组数:K?1?3.3lg36?7 第三步:确定组距:d?32/7?5
第四步:确定组限:以60为最小组的下限,其他组限利用组距依次确定。 第五步:编制频数分布表。如表3-8所示。
表3-8 分公司销售额频数分布表
按销售额分组(万元) 60 ~ 65 65 ~ 70 70 ~ 75 75 ~ 80 80 ~ 85 85 ~ 90 公司数(个) 3 4 5 10 5 5 13
频率(%) 8.33 11.11 13.89 27.78 13.89 13.89
90 ~ 95 合 计 4 36 11.11 100.00 3.
有27个工人看管机器台数如表3-5所示。
表3-5 工人看管机器台数表
5 2 2
4 4 2
2 3 3
4 4 4
3 3 5
4 2 3
3 6 2
(单位:台)
4 4 4
4 4 3
试编制一张频数分布表。
解:“工人看管机器台数”是离散变量,变量值变动范围很小,应编制单项式频数分布表。
编制结果如表3-9所示。
表3-9 工人看管机器台数频数分布表
看管机器台数(台) 2 3 4 5 6 合 计 工人数(人) 6 7 11 2 1 27 工人数的比重(%) 22 26 41 7 4 100 4.
对下面职工家庭基本情况调查表(如表3-6所示)中的答复进行逻辑检查,找出相
互矛盾的地方,并进行修改。
表3-6 职工家庭基本情况调查表
与被调查者 的关系 被调查者本人
夫妻 长女 长子
参加工作年月 1973.7 1975.4 1999 2000
职务或工种 干部 工人 无 学生
固定工或临时工 临时 固定 临时 无
姓名 刘 盛 陈心华 刘淑影 刘平路
性别 年龄 男 女 女 男
44 40 18 16
工作单位 长城机电公司 市第一针织厂 待业青年 医学院
解:职工家庭基本情况调查表修正如表3-10所示。
表3-6 职工家庭基本情况调查表
姓名
性别 年龄
与被调查者 的关系
工作单位 14 参加工作年月
职务或工种
固定工或临时工
刘 盛 陈心华 刘淑影 刘平路
男 女 女 男
44 40 18 16
被调查者本人
夫妻 父女 父子
长城机电公司 市第一针织厂 待业青年 医学院学习
1973.7 1975.4 — 2000
干部 工人 无 学生
固定 固定 无 无
第四章 数据分布特征的测度
一、填空题
1.
平均指标的数值表现称为__平均数__,其计算方法按是否反映了所有数据水平而可
分为___数值平均数__和__位置平均数__两类。 2. 式为
和__权数__大小的影响。 3.
当变量值较大而次数较多时,平均数接近于变量值较___大__的一方;当变量值较加权算术平均数的公
x??xf
?f,从中可以看到,它受__变量值__大小
小而次数较多时,平均数靠近于变量值较___小__的一方。 4.
某班70%的同学平均成绩为85分,另30%的同学平均成绩为70分,则全班总平均
成绩为___80.5___。 5.
统计中的变量数列是以__平均数__为中心而左右波动,所以平均数反映了总体分布
的____集中趋势____。 6.
中位数是位于一组数据_中间位置_的那个变量值,众数是在总体中出现次数__最多
__的那个变量值。中位数和众数也可以称为___位置__平均数。 7.
在___左偏____分布下,Mo?Me?x,在___右偏____分布下,Mo?Me?x,
在____正态___分布之下,Mo?Me?x。在适度偏态情况下,Mo?x等于__3_ 倍
Me?x。
8.
极差是一组数据的__最大值__与_最小值_之差,在组距分组资料中,其近似值是__
_最高组上限-最低组下限___。 9.
已知某组数据的平均数是200,离散系数是30%,则该组数据的方差是
_____3600______。 10.
测定峰度,往往以 4阶中心矩m4 为基础。依据经验,当??0时,频数分配
15