还能提示资料有无可疑异常点。
(3)直线回归方程的实用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。
(4)双变量的小样本经t检验只能推断总体两变量间有无直线关系,而不能推断相关的紧密程度,样本含量必须很大。
(5)相关关系不一定是因果关系,也可能是伴随关系,有相关关系不能证明事物间确有内在联系。
2. 用什么方法考察回归直线图示是否正确? (1)直线必须通过点(X,Y)。
(2)若纵横坐标无折断号时,将直线左端延长与纵轴相交,交点的纵坐标必等于截距
α。
(3) 直线是否在自变量X的实测范围内。
3. r与rs的应用条件有何不同?
积差相关系数r用于描述双变量正态分布资料的相关关系。 等级相关系数rs适用于下列资料:
(1)不服从双变量正态分布而不宜作积差相关分析的资料。 (2)总体分布型未知的资料:
(3)原始数据是用等级表示的资料。
4. 某资料n=100,X与Y的相关系数为r=0.2,可否认为X与Y有较密切的相关关系?
N=100,r=0.2时,对相关系数进行t检验,按检验水准α=0.05,拒绝Ho(ρ=0), 接受H 1 (ρ≠0),认为两变量有相关关系,但决定系数r2=0.22=0.04,表示回归 平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大。 5. 相关系数与回归系数的区别与联系?
(1)区别:
① 资料要求上:回归要求因变量Y服从正态分布,X是可以精确测量和严
密控制的变量,称Ⅰ型回归;相关要求两个变量X、Y服从双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归
② 应用上:说明两变量间依存变化数量关系用回归,说明变量间的相关关
系用相关。
③ 意义上:b表示X每增(减)一个单位,Y平均改变b个单位,r说明具
有直线关系的两个变量间相关关系的密切程度与相关方向。 ④ 计算上:b=lXY/lXX,r=lXY/lXYlYY
⑤ 取值范围:-∞<b<+∞;-1≤r≤1。 ⑥ 单位:b有单位,r没单位。
(2)联系:
① 对一组数据若同时计算b和r,它们的正负号一致 ② b和r的假设检验是等价的,即对同一样本,t b=t r。
③ 用回归解释相关,决定系数r2=lX Y2/lX XlY Y=SS回/SS总,回归平方和越
接近总平方和,则r2越接近1,说明引入相关的效果越好。
计算题
1. 10名20岁男青年身高(cm)与前臂长(cm)如下,问两者有无相关关系?
.
身 高 170 173 160 155 173 188 178 183 180 165 前臂长 45 42 44 41 47 50 47 46 49 43
(1)计算相关系数:由原始数据及散点图的初步分析,估计本资料有直线趋势。
ΣΧ=1725, ΣΧ2=298525, X=172.5
ΣУ=454 ΣУ2=20690, Y=45.4 ΣΧУ=78541 lXX=ΣΧ2-(ΣΧ)2/n=298525-17252/10=962.5 lYY=ΣΧ2-(ΣΧ)2/n=20690-4542/10=78.4 lXY=ΣΧУ-(ΣΧ)(ΣУ)/n=78541-1725×454/10=226
r?lXYlXXlYY?226962.5?78.4?0.8227
(2)与ρ=0进行假设检验。
Ho:ρ=0,即身高与前臂长间无直线相关关系 H 1:ρ=0,即身高与前臂长间有直线相关关系 α=0.05
t?r?o?srr(1?r)/(n?2)2?0.8227?10?21?0.82272?4.09
υ=n-2=10-2=8
查t界值表,得0.002<P<0.005,按α=0.05水准拒绝Ho,
2. 某省卫生防疫站对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘行检 测,结果见表,试检验两者有无相关?
表8-1 8个城市肺癌标化死亡率与大气中苯并(a)芘的相关分析 肺癌标化死亡率(1/10万)
__________________________________________________________________________ 城市编号 X 等级 Y 等级 d d2 (1) (2) (3) (4) (5) (6)=(3)-(5) (7) 1 5.60 1 0.05 1 0 0 2 18.50 8 1.17 7 1 1 3 16.23 6 1.05 6 0 0 4 11.40 3 0.10 2 1 1 5 13.80 5 0.75 5 0 0 6 8.13 2 0.50 3 -1 1 7 18.00 7 0.65 4 3 9 8 12.10 4 1.20 8 4 16
∑d2=28
本题资料不服从双变量正态分布,宜计算等级相关系数。
Ho:ρS=0,即肺癌标化死亡率与大气中苯并(α)芘无相关关系 H 1:ρS≠0,即肺癌标化死亡率与大气中苯并(α)芘有相关关系 α=0.05
由上计算表,rS=1-6Σd2/[n(n2-1)]=1-6×28/[8×(82-1)]=0.6667查附表15, rS界值表,得0.10>P>0.05,按α=0.05水准不拒绝Ho,尚不能认为肺癌标化死 亡率与大气中苯并(α)芘间有相关关系。 3. 就表8-2(1)(2)(4)栏资料分析血小板和出血症的关系。
.