(2)标准误小于标准差。
(3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,但标准差不 随样本含量的改变而有明显方向性改变,随着样本含量的增大,标准差有可能增大,也有可能减小。
2. 什么叫抽样分布的中心极限定理?
答: 样本含量n越大,样本均数所对应的标准差越小,其分布也逐渐逼近正态分布,这种现象统计学上称为中心极限定理(central limit theorem)。
当有足够的样本含量(如n?30)时,从任何总体中抽取随机样本的样本均数近似地服从正态分布。样本含量越大,X抽样分布越接近于正态分布。
正态分布的近似程度与总体自身的概率分布和样本含量有关。如果总体原本就是正态分布,那么对于所有n值,抽样分布均为正态分布。如果总体为非正态分布,X仅在n值较大情况下近似服从正态分布。一般说,n?30时的X抽样分布近似为正态分布;但是,如果总体分布极度非正态(如双峰分布、极度偏峰分布),即使有足够大的n值,抽样分布也将为非正态。
3. 简述置信区间与医学参考值范围的区别。
答: 置信区问与医学参考值范围的区别见练习表4-1。
练习表4-1 置信区间与医学参考值范围的区别
区别 含义 用途 计算公式
估计未知总体均数所在范围
置信区间
总体参数的波动范围,即按事先给定的概率100(1??)%所确定的包含未知总体参数的一个波动范围
参考值范围
个体值的波动范围,即按事先给定的范围100(1??)%所确定的“正常人”的解剖、生理、生化指标的波动范围
供判断观察个体某项指标是否“正常”时参考(辅助诊断) 正态分布:X?Z?/2S 偏峰分布:PX~P100?X
?未知: X?t?/2,?SX
?已知或?未知但n≥30,有X?Z?/2?X或
X?Z?/2SX
4. 何谓置信区间准确度与精确度?如何协调两者间的关系。
答:置信区间有准确度(accuracy)与精密度(precision)两个要素。准确度由置信度 (1-?) 的大小确定,即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看,置信度愈接近于1愈好,如置信度99%比95%好。精密度是置信区间宽度的一半(即
t?2,?SX、Z?2,?Sp),意指置信区间的两端点值离样本统计量(如X、p)的距离。从精
密度的角度看,置信区间宽度愈窄愈好。在抽样误差确定的情况下,两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密度,可适当增加样本含量。
三、计算题
1.随机抽取了100名一年级大学生,测得空腹血糖均数为4.5 mmol/L,标准差为0.61 mmol/L。试估计一年级大学生空腹血糖总体均数及方差的95%置信区间。
答:总体均数95%置信区间为(4.379,4.621),方差的95%置信区间为(0.286 9, 0.502 1)。
2.调查某地蛲虫感染情况,随机抽样调查了260人,感染人数为100。试估计该地蛲虫感染率的95%置信区间。
答:该地蛲虫感染率的95%置信区间为(32.55%,44.38%)。
(宇传华)
第5章 假设检验 思考与练习参考答案
一、最佳选择题
1. 样本均数比较作t检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。 A.??0.01 B. ??0.05 C. ??0.10 D. ??0.20 E. ??0.30 2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t=3.24,t0.05,v =2.086, t0.01,v =2.845。正确的结论是( E )。 A. 此样本均数与该已知总体均数不同 B. 此样本均数与该已知总体均数差异很大
C. 此样本均数所对应的总体均数与该已知总体均数差异很大 D. 此样本均数所对应的总体均数与该已知总体均数相同 E. 此样本均数所对应的总体均数与该已知总体均数不同 3. 假设检验的步骤是( A )。
A. 建立假设,选择和计算统计量,确定P值和判断结果 B. 建立无效假设,建立备择假设,确定检验水准
C. 确定单侧检验或双侧检验,选择t检验或Z检验,估计Ⅰ类错误和Ⅱ类错误 D. 计算统计量,确定P值,作出推断结论 E. 以上都不对
4. 作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是( C )。 A. 统计量t越大,说明两总体均数差别越大 B. 统计量t越大,说明两总体均数差别越小 C. 统计量t越大,越有理由认为两总体均数不相等 D. P值就是?
E. P值不是?,且总是比?小
5. 下列( E )不是检验功效的影响因素的是:
A. 总体标准差? B. 容许误差? C. 样本含量n D. Ⅰ类错误? E. Ⅱ类错误?
二、思考题
1.试述假设检验中α与P的联系与区别。
答:?值是决策者事先确定的一个小的概率值。
P值是在H0成立的条件下,出现当前检验统计量以及更极端状况的概率。 P≤?时,拒绝H0假设。
2. 试述假设检验与置信区间的联系与区别。
答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。
3. 怎样正确运用单侧检验和双侧检验?
答:选用双侧检验还是单侧检验需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异,研究者只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。若甲法是从乙法基础上改进而得,已知如此改进可能有效,也可能无效,但不可能改进后反不如以前,则应选用单侧检验。在没有特殊专业知识说明的情况下,一般采用双侧检验即可。
4. 试述两类错误的意义及其关系。
答:Ⅰ类错误(typeⅠerror):如果检验假设H0实际是正确的,由样本数据计算获得的检验统计量得出拒绝H0的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设H0(弃真)的错误称为Ⅰ类错误。
Ⅱ类错误(type Ⅱ error):假设检验的另一类错误称为Ⅱ类错误(type Ⅱ error),即检验假设H0原本不正确(H1正确),由样本数据计算获得的检验统计量得出不拒绝H0(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用? 表示。
在假设检验时,应兼顾犯Ⅰ类错误的概率(?)和犯Ⅱ类错误的概率(?)。犯Ⅰ类错
误的概率(?)和犯Ⅱ类错误的概率(?)成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小?和?,只有通过增加样本含量,减少抽样误差大小来实现。 5.试述检验功效的概念和主要影响因素。
答:拒绝不正确的H0的概率,在统计学中称为检验功效(power of test),记为1??。检验功效的意义是:当两个总体参数间存在差异时(如备择假设H1:???0成立时),所使用的统计检验能够发现这种差异(拒绝零假设H0:???0)的概率,一般情况下要求检验功效应在0.8以上。
影响检验功效的四要素为总体参数的差异?、总体标准差?、检验水准?及犯Ⅱ类错误的概率?。
6.简述假设检验的基本思想。
答:假设检验是在H0成立的前提下,从样本数据中寻找证据来拒绝H0、接受H1的一种“反证”方法。如果从样本数据中得到的证据不足,则只能不拒绝H0,暂且认为H0成立(因为拒绝的证据不足),即样本与总体间的差异仅仅是由于抽样误差所引起。拒绝H0是根据某个界值,即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比如小于等于0.05(各种科研杂志习惯上采用这一概率值),则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝H0,即有足够证据推断差异具有统计学意义。
三、计算题
1. 一般正常成年男子血红蛋白的平均值为140 g/L,某研究者随机抽取25名高原地区成年男子进行检查,得到血红蛋白均数为155 g/L,标准差25 g/L。问:高原地区成年男子的血红蛋白是否比一般正常成年男子的高? 解:H0:???0 H1:???0
??0.0(单侧)5