9、所谓组距是指每个组变量值中的最大值与最小值之差,也就是组的上限与下限之差。 (×) 二、单项选择题
1、抽样调查与重点调查的主要区别是( D ) A、作同不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 2、调查时限是指( B )
A、调查资料所属的时间 B、进行调查工作的期限 C、调查工作登记的时间 D、调查资料的报送时间 3、下列调查中,调查单位与填报单位一致的是( D )
A、企业设备调查 B、人口普查C、农村耕畜调查 D、工业企业现状调查 4、调查项目( A )
A、是依附于调查单位的基本标志 B、与填报单位是一致的
C、与调查单位是一致的 D、是依附于调查对象的基本指标 5、统计整理阶段最关键的问题是( B ) A、对调查资料的审核 B、统计分组 C、统计汇总 D、编制统计表
6、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( B )
A、80—89% 90—99% 100—109% 110%以上 B、80以下 80.1—90% 90.1—100% 100.1—110% C、90以下 90—99% 100—110% 110%以上 D、85%以上 85—95% 95—105% 105—115% 7、划分离散变量的组限时,相邻两组的组限( C ) A、必须是间断的 B、必须是重叠的 C、既可以是不重合的,也可以是重叠的 D、应当是相近的 8、次数分配数列是( C )
A、按数量标志分组形成的数列 B、按品质标志分组形成的数列 C、按数量标志或品质标志分组形成的数列 D、按总体单位数分组形成的数列 9、分组标志一经确定就( B )
A、掩盖了总体单位在此标志下的性质差异 B、突出了总体单位在此标志下的性质差异 C、突出了总体单位在其他标志下的性质差异 D、使得总体内部的差异消失了
10、为了反映商品价格与需求之间的关系,在统计中应采用(C ) A、划分经济类型的分组 B、说明现象结构的分组 C、分析现象间依存关系的分组 D、上述都不正确 11、统计表的形式应该是( B )
A、上下不封顶,左右不开口 C、上下要封顶,左右要开口 B、上下要封顶,左右不开口 D、上下不封顶,左右要开口 三、多项选择题(在备选答案中有二个以上是正确的)
1、人口普查时,每户填写一份调查表,其中包括该户每个人若干项目的答案,判断下述哪种说法是对的( AE)
A、人是总体单位 B、户是总体单位 C、人是填报单位 D、普查登记小组是调查单位 E、户是填报单位 2、普查是一种( ACD ) A、专门组织的调查 B、连续性调查 C、一次性调查 D、全面调查 E、非全面调查
3、我国第四次人口普查的标准时间是1990年7月1日零时,下列情况应统计人口数的有( BDE )
A、90年7月2日出生的婴儿 B、90年6月29日出生的婴儿 C、90年6月29日晚死亡的人 D、90年7月1日1时死亡的人 E、90年6月29日出生,7月1日6时死亡的婴儿 4、统计分组的作用是( ACE ) A、划分社会经济类型 B、说明总体的基本情况 C、研究同类总体的结构 D、说明总体单位的特征 E、分析被研究现象总体诸标志之间的联系和依存关系 5、下列哪些分组是按数量标志分组( BCD ) A、学生按健康状况分组 B、工人按出勤率状况分组 C、企业按固定资产原值分组 D、家庭按收入水平分组 E、人口按地区分组
6、下面哪些是连续型数量标志( ABDE ) A、住房面积 B、商店的商品销售额 C、高校的大学生人数 D、人口的出生率 E、工业增长速度 7、下面哪些是变量分配数列( BCDE ) A、大学生按所学专业分配 B、大学生按年龄的分配
C、商店按商品销售额大小的分配D、工人按生产每一零件时间消耗的分配 E、1991年某工厂每个月工人劳动生产率 8、非全面调查包括( ABD ) A、重点调查 B、抽样调查 C、快速普查 D、典型调查 E、统计年报 四、简答题1、抽样调查、重点调查和典型调查这三种非全面调查的区别是什么? (1)选取调查单位的方式不同。重点调查中重点单位的选取是根据重点单位的标志总量是否占全部单位标志总量的绝大比重这一标准来确定的,这一标准是客观存在的,所以易于确定。抽样调查中的调查单位是按随机原则从全部总体单位中抽选出来的,不受人的主观因素所影响。典型调查中的典型单位是在对总体情况分析的基础上有意识的抽选出来的。
(2)调查目的的不同。重点调查的目的是通过对重点单位的调查,掌握总体的基本情况;抽样调查的目的则是通过对部分单位的调查结果来推算总体的数量特征;作为统计意义的典型调查,其目的类似于抽样调查。
(3)推算总体指法标的准确性和可靠程度不同。抽样调查和典型调查都要以部分单位调查的结果推算总体指法标,由于二者调查单位选择的方法不同,其推算结果的准确性、可靠性也不同。抽样调查按随机原则抽选调查单位,因而在给定概率和误差范围条件下,可保证推断的准确性和可靠性;而典型调查单位的选择完全由人们有意识的选择,因而难以保证推断结果的准确性和可靠性,推断误差既不知道也不能控制。 五、计算题
1、某班40名学生统计学考试成绩分别为:
66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81
学校规定:60分以下为不及格,60—70为及格,70—80分为中,80—90分为良,90—100分为优 要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。 (2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况
.解:(1)“学生考试成绩”为连续变量,需采组距式分组,同时学生考试成绩变动均匀,故可用等距式分组来编制变量分配数列。 考试成绩 60分以下 60—70 70—80 80—90 90—100 合计 学生人数(人) 3 6 15 12 4 40 比率(%) 7.5 15.0 37.5 30.0 10.0 100.0 (2)分组标志为考试成绩,属于数量标志,简单分组;从分配数列中可看出,该班同学不及格人数和优秀生的人数都较少,分别为7.5%和10%。大部分同学成绩集中在70—90分之间,说明该班同学成绩总体良好。
考试成绩一般用正整数表示时,可视为离散变量也可用单项式分组,但本班学生成绩波动幅度大,单项式分组只能反映成绩分布的一般情况,而组距分组分配数列可以明显看出成绩分配比较集中的趋势,便于对学生成绩分配规律性的掌握。 2、某企业某班组工人日产量资料如下: 日产量分组(件) 50-60 60-70 70-80 80-90 90-100 合计 工人数(人) 6 12 18 10 7 53 根据上表指出: 上表变量数列属于哪一种变量数列;
上表中的变量、变量值、上限、下限、次数; 计算组距、组中值、频率。
(1)该数列是等距式变量数列 (2)变量是日产量,变量值是50-100,下限是50、60、70、80、90,上限是60、70、80、90、100,次数是6、12、18、10、7;
(3)组距是10,组中值分别是55、65、75、85、95,频率分别是11.32%、22.64%、33.96%、18.87%、13.21%。
3、某百货公司连续40天的商品销售额如下:单位:万元 41 25 29 47 38 34 30 38 43 40 46 36
45
37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35
要求:根据数据分组,编制频数分布表,并绘制直方图和折线图。 解:关于某百货公司连续40天的商品销售额频数分布表
销售额 频数 频率 累积频数 累积频率 组中值
万元 (天) (%) 以下 以上 以下 以上 万元 25—30 4 10 4 40 10 100 27.5 30—35 6 15 10 36 25 90 32.5 35—40 15 37.5 25 30 62.5 75 37.5 40—45 9 22.5 34 15 85 37.5 42.5 45—50 6 15 40 6 100 15 47.5 合 计 40 100.0 — — — — —
16 14 12 10 8 6 4 2
25 30 35 40 45 50 第三章 数据分布特征的描述
1、测定集中趋势的指标及作用
a.集中趋势:较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附
近,使得全部数据呈现出向中心聚集或靠拢的态势
b.测度集中趋势的指标有两大类:
1)数值平均数——是根据全部数据计算得到的代表值,主要有算术平均数、调和平均数及几何平均数;
2)位置代表值——根据数据所处位置直接观察、或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数 c.测定集中趋势指标的作用::
1)反映变量分布的集中趋势和一般水平。
如用平均工资了解职工工资分布的中心,反映职工工资的一般水平。 2)可用来比较同一现象在不同空间或不同阶段的发展水平。 不受总体规模大小的影响,
在一定程度上使偶然因素的影响相互抵消。如在比较不同地区或不同时期的收入水平高低时,应用平均收入而不是总收入或个别人收入。 3)可用来分析现象之间的依存关系。 如研究劳动者的文化程度与收入的关系
4)平均指标也是统计推断中的一个重要统计量,是进行统计推断的基础。 2.算术平均数(均值)
a 简单算术平均数: 适用于总体资料未经分组整理、尚为原始资料的情况
x?x2?...?xnx?1?n?xi?1nin??x n
b.加权算术平均数:适用于总体资料经过分组整理形成变量数列的情况
Xf?X2f2????XmfmX?11?f1?f2????fm?Xi?1mi?1miif?f
i权数可以是绝对数形式,也可以是比重形式(如频率)来表示。
x??xf 事实上比重权数更能够直接表明权数的权衡轻重作用的实质。 ?f c.由组距数列计算算术平均数:各组变量值用组中值来代表。
d对相对数求算术平均数: 由于各个相对数的对比基础不同,采用简单算术平均通常不合
理,需要加权。
3.调和平均数:调和平均数也称为倒数平均数。
各变量值的倒数(1/xi)的算术平均数的倒数.
m?m2?...?mn?xH?1mnm1m2??...?x1x2xn?mi?1nnimi?i?1xi = xH?1111m1?m2?...?mnx1x2xnm1?m2?...?mn
社会经济统计中所应用的调和平均数通常是加权算术平均数的变形。
已知各组变量值 xi 和(xi fi)而缺乏 fi 时,加权算术平均数通常可变形为调和平均数形式
来计算。x??xfi?1nnii??(xf)iin?fi?1i?i?1i?1n4.
(xifi)xi
几何平均数— n个变量值连乘积的n次方根。