(1) 给予雌激素的假设:
H0:τi=0; H1:τi≠0,至少有一个不等式成立。 α=0.05。
(2) 测量时间的假设:
H0:βj=0; H1:βj≠0,至少有一个不等式成立。 α=0.05。
(3) 交互作用的假设:
H0:(τβ)ij=0; H1:(τβ)ij≠0,至少对一种(ij)组合成立。 α=0.05。
2
SS总=10743.0815-385.53/16=1453.495 ν总=16-1=15
SSA=(196.33+189.20)/(2×4)- 385.53/16=3.177 νA=2-1=1
SSB=(133.332+252.202) /(2×4) - 385.532/16=883.130 νB=2-1=1
SSAB=(53.862+142.472+79.472+109.732)/4-(196.332+189.202)/(2×4)-(133.332+252.202) /(2×4)+385.532/16= 212.7952 νAB=(2-1)×(2-1)=1
SS误差=SS总- SSA - SSB- SSAB =354.393 ν误差=ν总-νA-νB-νAB =12
方差分析表
变异来源 A雌激素 B测量时间 A*B交互 误差 总计
SS 3.177 883.130 212.7952 354.393 1453.495
ν 1 1 1 12 15
MS 3.177 883.130 212.795 29.533
F 0.108(4.75) 29.903(4.75) 7.205(4.75)
P >0.05 <0.05 <0.05
2
2
2
统计学结论:
(1) 接受H0:τi=0的无效假设;拒绝 H1:τi≠0,至少有一个不等式成立。 (2) 拒绝H0:βj=0的无效假设; 接受H1:βj≠0,至少有一个不等式成立。
(3) 拒绝H0:(τβ)ij=0的无效假设; 接受H1:(τβ)ij≠0,至少对一种(ij)组合成立。 尚不能认为使用雌激素对该激素水平具有影响;下午该激素水平高于上午;雌激素的使用与测量时间之间存在交互作用。
2. t检验(给予雌激素是否使该种激素上下午波动幅度减小) 对照组 1 2 3
给予雌激素 d 30.61 5.67 17.33 1 2 3 上午 17.53 21.07 20.80 下午 32.00 23.80 28.87 d 14.47 2.73 8.07 上午 8.53 20.53 14.00 下午 39.14 26.20 31.33
4 10.80 45.80 235.00 4 20.07 25.06 24.99 n1=4, d1=22.1525, Sd1=177.17
方差齐性检验:
F=Sd12/Sd22=6.82, 1=4-1=3, ν2=4-1=3。 F
H0:d1=d2; H1:d1>d2。 α=0.05。
2
Sc=[(4-1)× 177.17+(4-1)×25.98]/(4+4-2)= 101.575 t=(22.1525-7.5650)/[ 101.575×(1/4+1/4)]=2.047 ν=4+4-2=6 t>1.943=t0.05(6)
拒绝H0:d1=d2的无效假设; 接受H1:d1>d2。 给予雌激素可以使该种激素上下午波动幅度减小
0.5
n2=4, d2=7.5650, Sd2=25.98
说明:若分析雌激素是否对该种激素上下午波动幅度有影响,H1:d1≠d2,则应为双侧检验,t<2.447= t0.05(6),接受H0:d1=d2的无效假设; 拒绝H1:d1>d2,尚不能认为雌激素对该种激素上下午波动幅度有影响。
8、标准差和标准误有何区别和联系?
标准差是反映数据变异程度的指标,其大小受每一个观察值的影响,变异程度大,标准差也大.常用于描述对称分布,尤其是正态分布资料的离散程度。可以反映样本均数的代表性.
标准误是样本均数的标准差,反映了样本均数与总体均数之间的离散程度,即样本均数变异程度的指标,常用来表示抽样误差的大小。标准误大反映样本均数抽样误差大,其对总体均数的代表性差。标准误小,样本均数抽样误差就小,其对总体均数的代表性就好。
标准差随着样本量的增多,逐渐趋于稳定,如同地区、同年龄、同性别儿童的身高、体重的标准差,当样本含量达到约200以上时,基本趋于稳定。
标准误随着样本量的增多而减小,如均数的标准误,当标准差不变时,与样本量的平方根呈反比。
9、可信区间和参考值范围有何不同?
可信区间是从总体中作随机抽样,每个样本可以算出一个可信区间,如95%可信区间,意味着100次抽样, 95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。
参考值范围是指同质总体中大多数个体变量值的分布范围。95%参考值范围指同质总体中95%的个体值分布在此范围内。它与标准差有关,各个体值变异越大,该范围越宽,分布也越分散。
10、假设检验和区间估计的异同之处有哪些?
同:两者都是对总体特征进行推断的方法。区间估计用以说明参数量的大小,如推断总体均数所在的范围,而假设经验用于推论质的差别,如推断总体均数是否不同。
异:可信区间不仅可回答假设检验的问题,而且可以比假设检验提供更多的信息,可信区间在解决假设检验问题基础上,还可获得是否有专业意义的信息。
11、假设检验时,一般当P<0.05则拒绝H0,理论依据是什么?
假设检验时,先提出无效假设H0,然后在假设成立的前提下看实际抽到的样本是否属小概率事件(如果当一个事件发生的概率很小时,那么在一次试验时这个事件时“不会发生的”,一旦发生了,称其为小概率事件。统计学中,将P<0.05称为小概率事件。)。若属小概率事件,则拒绝该假设;若不属于小概率事件,则不拒绝该假设。得出的结论是概率性的,不是绝对的肯定或者否定。犯一类错误(拒绝了正确的无效假设)的概率是α=0.05。 12.第一类错误和第二类错误有何区别和联系? ①两类错误的区别: 错误类型 意义 第一类错误 拒绝了正确的无效假设H0 即无效假设原本是正确的,但由于偶然因素的影响,随机抽样时,得到一第二类错误 接受了错误的无效假设H0 即无效假设原本是不正确的,但所算得的统计量t 没有超过t?,?水平从而接个较大的检验统计量t 值,故t值大受了无效假设,错误地得出了无差别的于了 t?,?,只能拒绝无效假设,错结论。 误地得出有差别的结论。 假阳性错误 相应概率 假阴性错误 ?,即检验水准,一般取? = 0.05或β,我们称(1-β)为检验效能,β值0.01。 的大小一般未知,只有在不同总体特征应按所犯第一类错误的危害性,已知的基础上,按预定的?和n才能做紧密结合分析问题的具体情况,事先选定? 的取值。 出估算。 β的取值,实际上也应根据第二类错误的危害性事先确定。通常检验效能应该达到0.8左右。
②两类错误的联系:
在样本量固定的情况下,减小? 会引起β增大;减小β会引起 ? 增大。若要同时减小 ? 和β,只有增大样本含量。所以样本含量应尽可能大一些,同时正确的实验设计与严格规定实验操作方法,能够减少抽样误差,提高检验效果。
13.某地某年人口数58723人,脑卒中发病81人,脑卒中死亡45人,该地当年各种疾病死
亡372人,试问上述数字能计算多少个有意义的相对数?并说明都是些什么相对数?
能算出五个有意义的相对数:
强度相对数: 该地当年的脑卒中发病率:(81/58723)*1000‰ = 1.38‰ 该地当年的脑卒中死亡率:(45/58723)*万分之万 = 万分之7.66 该地当年的脑卒中病死率:(45/81)*100% = 55.6% 该地当年的疾病总死亡率:(372/58723)*1000‰ = 6.33‰ 结构相对数: 该地当年内脑卒中死亡人数占疾病总死亡人数的比例(构成比):
(45/372)*100% = 12.1%
相对数有三类: 率 构成比 相对比
1.率(rate):
某现象实际发生数于可能发生某现象的总数之比,用以反映某现象发生的频率或强度,又称为频率指标,具有概率意义。
计算公式为: 依据习惯选定,或使得所计算得的率保留一到两位整数。
率=发生某现象的观察单位数可能发生某现象的观察单位总数同期内新发生某病的病例数?100%(或1000‰?)观察期内可能发生某病的平均人口数常用的率包括发病率、患病率、死亡率、病死率等。(1)发病率:表示在观察期内,可能发
生某种疾病的一定人群中新发生该病的频率。 某病发病率= ×K
在通常情况下,发病率的分母泛指一般平均人口数。
意义:发病率是反映某病在人群中发生频率大小的指标,常用于衡量疾病的发生,研究疾病发生的因果关系和评价预防措施的效果。
(2)患病率:表示在某时点检查时可能发生某病的一定人群中患有某病的频率。 ?K该时点受检人口数 其中某病病例数包括新病例和旧病例,凡患该病的一律统计在内。同一人不应同时成
某病患病率?检查时发现的某病病例数为同一疾病的两个病例。
意义: 这一指标最适用于病程较长的疾病的统计研究,用于衡量疾病的存在,反映某病在一定人群中的流行规模或水平,估计医疗设施的需求量。 (3)反映疾病防治效果的指标治愈率
治愈率?治愈人数受治人数?K有效率?治疗有效人数受治人数?K有效率
某病病死率=
同期因该病死亡人数观察期间内某病患者数?100%2. 构成比 说明某事物内部各组成部分所占的比重或比例。 常以百分数表示,计算公式为:
比=某组成部分的观察单位同一事物内部的观察单数位总数?100%相对比,
比较两个指标时用以反映两个有关指标间数量上的比值,如A指标是B指标的若干倍,或A指标是B指标的百分之几,通常用倍数或分数表示。 计算公式为:相对比=
甲指标乙指标
(或?100%)
相互比较的两个指标可以是相同性质的指标,也可以是性质不同的指标;两变量可以为数值变量、分类变量,可以是绝对数、相对数、平均数等。 不能以比代率
因为构成比说明的是事物内部各部分所占的比重或分布,不能说明某现象发生的强度和频率大小。只有频率指标:率才能说明事物的严重程度。(如真正答题时,自己最好举一个例子来说明,书34页)
20、下表为变性卵蛋白在38o
C与25o
C时之凝固百分数:
时间(分钟) 3 6 9 12 15 18 38oC 12 30 44 53 66 81.5 25oC 7.2 18.4 30 40 49 58
试求出两个时间推算凝固百分数之回归方程式,并检验两个回归系数间差别的显著性。(by milanlan,老师说不要求第二问)
解:n=6,∑Xi=63,Xi=10.5,∑X2i=819
∑Y=286.5,Y2
i1i1=47.75,∑Yi1=16787.25,∑XiYi1= 3705 ∑Yi2=202.6,Yi2=33.77,∑Y2i2=8655.4,∑XiYi2= 2661
lxy1= ∑XiYi1-(∑Xi)(∑Yi1)/n=3705-63×286.5/6=696.75 lxy2= ∑XiYi2-(∑Xi)(∑Yi2)/n=2661-63×202.6/6=533.7 l22xx=∑Xi-(∑Xi)/n=819-632/6=157.5
lyy1=∑Y2i1-(∑Y2i1)/n=16787.25-286.52/6=3106.875 l2yy2=∑Yi2-(∑Y2i2)/n=8655.4-202.62/6=1814.273
b1= lxy1/lxx=696.75/157.5=4.424, a1= Yi1-b1× Xi=47.75-4.424×10.5=1.298 即38oC时Y=1.298+4.424X
b2= lxy2/lxx=3.389, a2=33.77-3.389×10.5=-1.8145 即25oC时Y=-1.8145+3.389X
21、.测定小鼠肾上腺中抗坏血酸含量时测半个腺和整个腺体所得数据如下: 半个 371 592 464 519 470 528 580 420 563 整个 381 627 485 546 500 546 595 569 595
解释:
这道题老师上课说了,用直线回归,因为如果以半个腺的抗坏血酸含量为自变量x,以整个腺的抗坏血酸含量为应变量Y,若能找到两者之间的线性关系则可以在以后的试验中由半个腺的测量值来预测该测量值对应的整个腺的Y值。 计算:
1. 画散点图,看两者之间是否存在直线关系。 表一
半个(x) 371
592 464 519 470 528 580 420 整个(y)
381
627
485
546
500
546
595
569
对应拟和直线图
563 595