异的统计指标应使用
A.全距 B.标准差 C.变异系数 D.方差 E.四分位数间距 答案:A E D B E 二、计算与分析
1. 下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。 表 手术前后患者血催乳素浓度(ng/ml)
血催乳素浓度
例号
术前 术后
1 276 41 2 880 110 3 1600 280 4 324 61 5 398 105 6 266 43 7 500 25 8 1760 300 9 500 215 10 220 92
[参考答案]
血催乳素浓度术前均值=672.4 ng/ml,术后均值=127.2 ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。 术前:X?672.4,S?564.65
CV?564.65?100%?83.98g2.4
术后:X?127.2,S?101.27
101.27?100%?79.617.2
可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。
2. 某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少? [参考答案]
①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。
CV?下限:X?1.96S?4.95?1.96?0.85?3.28(mol/L) 上限:X?1.96S?4.95?1.96?0.85?6.62(mmol/L)
即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28 mmol/L~6.62
6
mmol/L。
②该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布u值:
u?5.72?4.95?0.910.85
问题转化为求u值大于0.91的概率。由于标准正态分布具有对称性,所以u值大于0.91的概率与u值小于-0.91的概率相同。查附表1得,?(?u)?0.1814,所以说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。
3. 某地200例正常成人血铅含量的频数分布如下表。 (1)简述该资料的分布特征。
(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。
表 某地200例正常成人血铅含量(μmol/L)的频数分布 血铅含量 频 数 累积频数 0.00~ 7 7 0.24~ 49 56 0.48~ 45 101 0.72~ 32 133 0.96~ 28 161 1.20~ 13 174 1.44~ 14 188 1.68~ 4 192 1.92~ 4 196 2.16~ 1 197 2.40~ 2 199 2.64~ 1 200
[参考答案]
(1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。
某地200例正常成人血铅含量(μmol/L)的频数分布
血铅含量 组中值 频 数 累积频数 累积频率 0.00~ 0.12 7 7 3.5 0.24~ 0.36 49 56 28.0 0.48~ 0.60 45 101 50.5 0.72~ 0.84 32 133 66.5 0.96~ 1.08 28 161 80.5 1.20~ 1.32 13 174 87.0 1.44~ 1.56 14 188 94.0 1.68~ 1.80 4 192 96.0 1.92~ 2.04 4 196 98.0 2.16~ 2.28 1 197 98.5 2.40~ 2.52 2 199 99.5 2.64~ 2.76 1 200 100
7
(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。
百分位数法:第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故
P95?1.68?(200?0.95?188)?0.24?1.80(μmol/L)4
即该地正常成人血铅值的95%参考值范围为小于1.80μmol/L。
正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。 某地200例正常成人血铅含量(μmol/L)均值和标准差计算表 血铅含量
组中值
lg组中值(x) 频 数(f) -0.92 -0.44 -0.22 -0.08 0.03 0.12 0.19 0.26 0.31 0.36 0.40 0.44
—
7 49 45 32 28 13 14 4 4 1 2
1 200
-6.44 -21.56 -9.9 -2.56 0.84 1.56 2.66 1.04 1.24 0.36 0.80 0.44 -31.52
5.9248 9.4864 2.178 0.2048 0.0252 0.1872 0.5054 0.2704 0.3844 0.1296 0.3200 0.1936 19.8098
0.00~ 0.12 0.24~ 0.36 0.48~ 0.60 0.72~ 0.84 0.96~ 1.08 1.20~ 1.32 1.44~ 1.56 1.68~ 1.80 1.92~ 2.04 2.16~ 2.28 2.40~ 2.52 2.64~ 2.76 合计 —
计算均值和标准差:
?31.52X???0.1576200
19.80?98?(321.52)200S??0.2731200?1
单侧95%参考值范围:
X?1.65S??0.1576?1.65?0.2731?0.2930
lg?1(0.2930)?1.96(?mol/L)
即该地正常成人血铅值的95%参考值范围为小于1.96μmol/L,与百分位数法相比两者相差不大。
(李 康)
第四章 抽样误差与假设检验
练习题
一、单项选择题
8
1. 样本均数的标准误越小说明
A. 观察个体的变异越小 B. 观察个体的变异越大
C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大(标准误反映抽样误差的大小,正) 2. 抽样误差产生的原因是
A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当
3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布 4. 假设检验的目的是
A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同 E. 检验样本的P值是否为小概率
5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是
A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95% E. 该区间包含总体均数的可能性为95% 答案:E D C D E 二、计算与分析
为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。 [参考答案]
样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。
X?101.4,S?1.5,n?450,95%可信区间为 下限:上限:
SX?S1.5??0.07n450
X-u?/2.SX?101.4?1.96?0.07?101.26(g/L)
X?u?/2.SX?101.4?1.96?0.07?101.54(g/L)
即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。
研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是
175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题:
①如何衡量这100名儿童总胆固醇样本平均数的抽样误差? ②估计100名儿童的胆固醇平均水平的95%可信区间;
③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 [参考答案]
均数的标准误可以用来衡量样本均数的抽样误差大小,即
9
S?30mg/dl,n?100
SX?S30??3.0n100
样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。X?207.5,
S?30,n?100,SX?3,则95%可信区间为 下限:上限:
X-u?/2.SX?207.5?1.96?3?201.62(mg/dl)
X?u?/2.SX?207.5?1.96?3?213.38(mg/dl)
故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl~
213.38mg/dl。
③因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。 (李 康)
第五章 t检验
练 习 题
一、单项选择题
1. 两样本均数比较,检验结果P?0.05说明
A. 两总体均数的差别较小 B. 两总体均数的差别较大
C. 支持两总体无差别的结论 D. 不支持两总体有差别的结论 E. 可以确认两总体无差别
2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 A. 两样本均数的差别具有实际意义 B. 两总体均数的差别具有实际意义
C. 两样本和两总体均数的差别都具有实际意义 D. 有理由认为两样本均数有差别 E. 有理由认为两总体均数有差别
3. 两样本均数比较,差别具有统计学意义时,P值越小说明
A. 两样本均数差别越大 B. 两总体均数差别越大
C. 越有理由认为两样本均数不同 D. 越有理由认为两总体均数不同 E. 越有理由认为两样本均数相同
4. 减少假设检验的Ⅱ类误差,应该使用的方法是
A. 减少Ⅰ类错误 B. 减少测量的系统误差 C. 减少测量的随机误差 D. 提高检验界值 E. 增加样本含量
5.两样本均数比较的t检验和u检验的主要差别是
A. t检验只能用于小样本资料 B. u检验要求大样本资料 C. t检验要求数据方差相同 D. t检验的检验效能更高 E. u检验能用于两大样本均数比较 答案:D E D E B 二、计算与分析
1. 已知正常成年男子血红蛋白均值为140g/L,今随机调查某厂成年男子60人,
10