0272《心理统计学》2016年6-7月期末考试指导要点

0272《心理统计学》2016年6-7月期末考试指导

一、考试说明

本课程闭卷考试,满分100分,考试时间90分钟。可能的考试题型包括: 1、单项选择题 2、判断题 3、简答题 4、计算题 5、综合应用题

二、重点复习内容

(一) 绪论

1、心理学统计学的内容:描述统计、推论统计、实验设计。其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关 2、数据的种类

按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。

(1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。

(2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。 (3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。例如,测量温度的℃。

(4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。

(二)统计图表

1、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。 2、编制次数分布表的步骤

(1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示 (2)定组数

(3)求组距:指每一组的间距,用符号i表示。

(4)定组限:指各组数据在数值上的起点值和终点值。

(5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。 (6)归类划记:将原始观测值按照一定的顺序逐一归组。 (7)记录各组次数(f)。 (8)核对,抄录新表。

3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。

4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。 5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。

(三)集中量数

集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。

1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。

1

平均数是一种受极端数据值影响的统计量。 2、加权平均数

加权算术平均数是指一组数据中每个数据与其权重乘积的总和除以权重总和所得的商。 在心理与教育研究中,经常会遇到由各个平均数计算总平均数这类实际的统计计算问题。在这个问题中,可以把各小组的平均分数,视为该小组每个个体的分数,而把每个小组的人数,视为权数。

3、次数分布表中算术平均数的计算

对于已经列成次数分布表的数据,其算术平均数的计算公式为:X?式中,XC为各组的组中值,f为各组的次数,N为总次数,即N??fXC N?f。

4、中数与众数

中数:又称中点数,中位数,中值。符号为Md或Mdn。中数是按一定顺序排列在一起的一组数据中居于中间位置的数。当数据的个数为偶数时,则取据中间两个数据的平均数为中位数。对于数据较多的资料,其算术平均数与中位数的值不会相差太大。

众数:又称为密集数、范数等,常用符号M0表示,众数是指在次数分布中出现次数最多的那个数的数值。

5、平均数、中数与众数三者之间的关系

在正态分布中三者相等,在正偏态分布中,平均数大于中数,中数大于众数。在负偏态分布中,平均数小于中数,中数小于众数。M

(四)差异量数

差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。

1、全距、百分位差和四分差

全距又称两极差,用符号R表示,用最大值减去最小值就是全距。例如,4,4,5,3,5,5,2。这列数据的全距为3

百分位差是用百分位数之间的差值来表示离中趋势的一种差异量数。

四分差,又称为四分位差,通常用符号Q来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。

例如,已知在甲分布中P90-P10=38,在乙分布中P90-P10=24,两个分布的分散程度,则甲>乙。

2、标准差、方差

2

(1)方差:也称变异数,均方。作为样本统计量,用符号s 表示,作为总体参数,用σ2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。 标准差的计算公式为S?(X?X)?

N标准差是一组同质数据间变异度大小的量度指标,但是如果两组数据平均数相差较大时,不

能采用标准差进行比较。

标准差、方差是描述数据的离散趋势最好的统计值。 (2)方差性质:可加性、可分解性

标准差特性:每一个观察值都加一个相同常数C之后,计算得到的标准差等于原标准差。每一个观察值都乘一个相同常数C,则所得到的标准差等于原标准差乘以常数C。以上两点结合,每一个观察值都乘以一个常数C(C不等于0),再加上一个常数d,所得标准差等于原标准差乘以常数C。

(3)方差、标准差的意义:是表示一组数据离散程度的最好指标。其值越大,表示数据的离散程度越大,该组数据越分散;其值越小,表示次数分布的数据比较集中,数据的离散程度越小。

2

3、分组资料标准差的计算方法

2fXC2?fXC??()对于次数分布表中的数据标准差计算公式为:S?NN

4、差异系数:又称变异系数、相对标准差等,是一种相对差异量,用CV表示,为标准差对

平均数的百分比,计算公式:CV=S/M×100%。 差异系数的心理与教育研究中常用于:

(1)同一团体不同观测值离散程度的比较,如身高和体重离散程度的比较;

(2)对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。 5、标准分数:

(1)又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。

标准分数的计算公式:z?X?Xx? ss___(2)标准分数在实际中的应用:

①用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低; ②计算不同值的观测值的总和或平均值,以表示在团体中的相对位置; ③表示标准测验分数。

(五)相关系数 1、相关系数用于描述双变量数据相互之间的关系,是两列变量间相关程度的数字表示形式,或者说是用来表示相关强度的指标。样本相关系数用r表示,总体一般用?表示。

相关系数的取值介于-1.00至+1.00之间,常用小数形式表示。相关系数的正负号,表示相关方向,取值的大小表示相关的程度。如果两个相关系数取值相同,正负号不同,则相关程度相同。

当XY相关程度很小时,从X推测Y的可靠性就很小。 2、散点图

(1)散点图是用相同大小圆点的多少或疏密表示统计资料数量大小及变化趋势的图。通常以圆点分布的形态表示两种现象间相关程度。 (2)在实际中的用途: 在相关研究中,通常用散点图表示两个变量之间的关系。通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系做出直观而有效的预测和解释。因此,散点图是确定变量之间是否存在相关关系及关系紧密程度的简单又直观的方法。 3、积差相关 适用的条件:(1)两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量。(2)两列变量之间的关系应是直线性的,非直线性的双列变量,不能计算线性相关。(3)两变量测量到的数据必须是成对的数据,对于不成对的数据无法计算相关,即使计算,得到的相关也没有意义。 计算公式:r??xyNSxSy 式中 x?X?X,y?Y?Y,N为成对数据的数目,Sx为

X变量的标准差,Sy为Y变量的标准差。 利用原始数据计算,公式可以转化为:

3

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4