第一步:对资料进行分析:A、计算全距(R);B、变量的性质;C、变量值变动是否均匀。通过全距的计算以及变量是离散型还是连续型来确定编制单项数列还是组距数列,根据变量值的变动是否均匀确定编制等距还是异距数列。 第二步:在编制组距数列时,还需确定组距和组数,其原则是能真正反映总体的分布特征。 第三步:确定各组的组限。离散型变量的组限可不重叠,连续型变量的组限必须重叠。 第四步:将总体各单位分布到各组、计算次数、颁率、变量数列就编制而成。 5、简述组距分组的步骤?
1确定组数2确定各组组距3根据分组整理成频数分布表 6、数据的预处理包括哪些内容? 数据审核、数据筛选和数据排序。 7、直方图与条形图有何区别?
首先,条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;
直方图是用面积表示各组频数的多少,矩形的高度表示每一组频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。 其次,由于分组数据具体有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。 最后,条形图主要用于展开分类数据,而直方图则主要用于展示数值型数据。 第四章 综合指标 一、填空题
1、一组数据向某一中心值靠拢的倾向反映了数据的 集中趋势 。 2、 众数 是一组数据中出现次数最多的变量值。
3、一组数据排序后处于中间位置上的变量值称 中位数 。
4、不受极端值影响的集中趋势度量指标有 众数 、 中位数 和 分位数 。 5、一组数据的最大值与最小值之差称 极差 。
6、 离散系数 是一组数据的标准差与其相应的平均数之比。 7、数据分布的不对称性是 偏度 。 8、数据分布的平峰或尖峰程度称 峰态
9、计算比率的平均数一般用 几何平均法 ,它实际上是各变量值对数的 算术平均数 。 10、Excel中计算中位数时选用的函数为 MEDIAN函数 .
11、某工厂13名工人某日生产零件数分别为(单位:件)10、11、13、11、14、11、12、11、15、16、12、12、13 ,则中位数为 12 ;众数为 11 。
13、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数是 238.5 。 14、一组数据分布的最高峰点所对应的变量值即为_众数________。 15、当平均数大于中位数时,数据呈__右偏_______分布。
16、根据组距数列计算平均数,一般用组中值代表各组标志值的水平,其假定前提是假定各组数据在组内是均匀分布的____ 。 17、若一组数据的X?Me?Mo,则其属于____左偏___________分布。 18、如果一组数据服从标准正态分布,则峰态系数为__0_________。
19、__中位数________是一组数据中间位置上的代表值,不受数据极端值的影响。
20、假定一个总体由5个数据组成:3、7、8、9、13,该总体的方差为 13 。
21、某班共有25名学生,期末统计学课程的考试分数分别为:68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,该班考试分数的下四分位数和上四分位数分别是 64.5 和 78.5 。 22、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别为72、63.1、54.7、54.3、29、26.9、25、23.9、23、20,该组数据的极差为 52 。 二、单项选择题
1、对于对称分布的数据,众数、中位数和平均数的关系是:(B