第一章 绪 论
思考题
1.
什么是统计学?请简要说明一下它的发展过程。
统计学是关于数据搜集、整理、归纳、分析的方法论科学。 统计学的发展主要经历了三个阶段:
(1) 17世纪中叶至18世纪,统计学的产生和形成阶段;
(2) 18世纪末至20世纪中叶,统计推断方法和理论体系确立的阶段; (3) 20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的阶段。 2.
统计学、统计数据,以及统计活动之间有什么关系?
统计活动直接影响统计数据的数量和质量;统计学是统计实践活动的理论概括,同
时,它又用理论和方法研究分析统计实践活动,统计学和统计活动是理论与实践的关系。
3.
统计学的研究方法有哪些,它们有怎样的关系?并举例说明。
主要方法有两个:
(1) 描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说
明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2) 推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体
的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。由于现实问题中,要获得总体数据存在很大的难度,能够获得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它已成为统计学的核心内容。当然,描述统计的重要性不可忽略,通过它得到可靠的统计数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得出符合实际情况的结论。 4.
简要说明总体、样本、变量的概念。
总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素; 样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素; 变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。
5. 简述SPSS统计软件的特点和应用领域。
(1) 特点:
第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置、点击功能按钮来完成,不需要用户记忆大量的操作命令。菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。
第二,具有完善的数据转换接口,可以方便地和Windows其他应用程序进行数据共享和交换。可以读取Excel、FoxPro、Lotus等电子表格和数据库软件产生的数据文件,可以读取ASCII数据文件。
第三,提供强大的程序编辑能力和二次开发能力,方便高级用户完成更为复杂的统计分析任务的需要,具有丰富的内部函数和统计功能。
第四,附带丰富的数据资料实例和完善的使用指南,为用户学习掌握软件的使用方法提供更多的方便。软件启动后,用户可直接上网访问SPSS公司主页获得更多的帮助和信息。 (2) 应用领域:社会科学、自然科学、经济管理、商业金融、医疗卫生、体育运动等。
6.
SPSS软件的数据编辑器包括哪些内容?
(1) 标题栏,显示当前工作文件名称。 (2) 主菜单栏,排列SPSS的所有菜单命令。
(3) 工具栏,排列系统默认的标准工具图标按钮,此栏图标按钮可以通过单击View菜单的Toolbars命令选择隐藏、显示或更改。
(4) 状态栏,状态栏位于SPSS窗口底部,它反映了工作状态。当用户将光标置于不同的区域时或者进行不同的操作时将显示不同的内容。
(5) 数据编辑栏,用户通过键盘输入的数据首先显示在这里。
(6) 数据显示区域。它是一个二维的表格,编辑确认的数据都将在这里显示,其中每一个矩形格为单元格(Cell),其中边框加黑的单元格称为选定单元格。数据显示区域的左边缘排列观测量序号,上边缘排列要定义的各变量名。
7. 调查表明,顾客每周花在某超市蛋糕的平均费用是30元,他们选择经常购买蛋糕的主要原因是该蛋糕味道很好。要求:
(1) 总体是什么?
(2) 该项研究所使用的方法是描述统计方法还是推断统计方法? (1) 总体是所有的购买蛋糕的顾客; (2) 推断统计方法。
第二章 数据整理和描述
思考题
1. 获取统计数据有哪两种途径?
一种是直接向调查对象搜集反映调查单位的统计数据,一般称为原始数据或第一手数
据;另一种是搜集已经加工、整理过的、说明总体现象的数据,一般称为次级数据或第二手数据。
2. 统计数据的搜集有哪几种方法? 直接观察法、访问法、报告法、问卷法。
3. 对统计数据进行搜集时,有哪几种组织方式? 普查、抽样调查、重点调查、典型调查。
4. 什么是数据分组?数据分组的方式有哪几种?
(1) 统计数据分组是根据统计研究目的,按某一标志将数据分别列入不同的组,使组
与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。
(2) 统计数据分组可以按品质标志分组和按数量标志分组。
(一)按品质标志分组就是按照事物的性质和属性特征进行分组。一般来言,按品质标志分组的操作比较容易,分组也相对稳定。如人口按性别分组、职工按文化程度分组等;
(二)按数量标志分组,就是按照事物的数量特征进行分组。例如,企业按职工人数、产值、产量等标志分组,人口按年龄分组等。
5. 简述组距、组限、组数与组中值的含义以及它们的计算方法。
(1) 组距是指各组中最大变量值与最小变量值之差,用i表示。计算方法为: i=R/n, 其中,n表示组数,R表示变量最大值与最小值之差(即全距);
(2) 组限是指限定各组组距的数值。各组的较大值称上限,较小值称下限; (3) 组数是指数据被分成的组个数。计算方法为:
n?1?3.322lgN
式中:n表示组数;N表示变量值个数;
(4) 组中值是上限到下限之间的中点数值,其计算公式为:
组中值=(上限+下限)/2
6. 向上积累和向下积累的数据有什么区别?
累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。(1) 向上累计频数(或频率),通常是指由变量值小的组向变量值大的组依次累计; (2) 向下累计频数(或频率),通常是指由变量值大的组向变量值小的组依次累计。
7. 什么是频数分布?试描述频数分布表的编制过程。
(1) 分布数列是指在统计分组的基础上,将总体的所有单位按一定标志分组整理,并按一定顺序排列,形成总体单位在各组的分布; (2) 一、确定变量数列的形式。
根据变量的类型和变量值的多少及现象本身的特点确定是编制单项数列还是编制组距数列。
二、组距式变量数列编制方法:
计算全距、确定组数、确定组距、确定组限、计算组中值、计算累计频数和累计频率。
8. 对统计数据进行描述时,有哪几种统计图表表达方式? 有统计表和统计图,其中统计图包括:直方图、折线图、曲线图。
9. 直方图和折线图有什么区别和关系?
折线图可以在直方图的基础上,将直方图的每个长方形的顶端中点用折线连点而成。如果不绘直方图,也可以用组中值与频数求出坐标点,连接而成。
它们与横轴围成的区域面积相等。
10. 请举出自己实际生活中的一组数据,对它进行分组,然后绘制直方图、折线图以及箱线图,分析该组数据的结构特征。 略
练习题
1. 某地区7月份的气温数据(单位:摄氏度)如下:
28 31 32 29 31 33 30 32 34 29 32 30 38 38 37 39 34 36 36 33 34 30 37 36 32 38 35 30 34 35 35 (1) 对以上数据进行适当的分组;
(2) 绘制直方图,说明该城市气温分布的特点。
解:(1) 频数分布如下:[28,30) 3;[30,32) 6;[32,34) 6;[34,36) 7;[36,38) 5;[38,40) 4;
(2) 直方图略。从直方图可以看出,该地区7月份气温集中在34~36摄氏度的天数最多,其次多的时间集中在30~32摄氏度或32~34摄氏度。
2. 某人的家位于城市的A地,工作单位位于城市的B地,为了确定A、B两地的车程,他记录了60天(来回共乘车120次)内往返于A、B两地所花的时间(单位:分钟),所得数据如下: 98 108 117 109 93 92 97 108 123 99 101 112 111 103 98 91 95 112 105 96 120 99 119 92 90 89 102 109 109 105 112 93 100 99 111 87 108 123 112 111 94 98 105 88 109 95 113 121 96 120 96 100 108 80 103 121 99 110 98 98 89 87 98 83 108 119 114 110 108 92 108 89 96 86 112 123 89 124 112 103 106 125 110 93 123 108 95 108 99 102 111 120 123 98 120 99 106 109 90 90 113 118 117 90 109 103 109 113 93 113 109 103 115 120 118 92 100 96 96 120 (1) 利用SPSS对以上数据进行排序。
(2) 以组距10进行等距分组,编制频数分布表,并绘制直方图。 解:(1) 略
(2) 频数分布表如下:[80,90) 10,[90,100) 37,[100,110) 33,[110,120) 25,[120,130) 15; 直方图略。
3. 某百货公司冬天连续60天的销售额数据如下(单位:万元): 372 369 338 372 403 353 321 380 286 331 357 347 328 302 309 308 329 383 318 326 368 329 349 333