医学统计学课后习题与答案 下载本文

医学统计学

第一章 绪论

答案

名词解释:

(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基

础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本

是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称

为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误

差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称

为计数资料。。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为

等级资料。

是非题:

1. × 2. × 3. × 4. × 5. √ 6. √ 7. ×

单选题:

1. C 2. E 3. D 4. C 5. D 6. B

第二章 计量资料统计描述及正态分布

答案

名词解释:

1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布

称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指

标范围称为指标的正常值范围。

填空题:

1. 计量,计数,等级

2. 设计,收集资料,分析资料,整理资料。

3. u????(变量变换)标准正态分布、0、1 ?4. ?? ?1.96? ?2.58? 68.27% 95% 99%

.

5. 47.5%

6.均数、标准差

7. 全距、方差、标准差、变异系数 8. ??1.96? ??2.58? 9. 全距 R

10. 检验水准、显著性水准、0.05、 0.01 (0.1) 11. 80% 90% 95% 99% 95% 12. 95% 99%

13. 集中趋势、离散趋势 14. 中位数

15. 同质基础,合理分组

16. 均数,均数,μ,σ,规律性 17. 标准差

18. 单位不同,均数相差较大 是非题:

1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √

单选题:

1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B

问答题:

1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。

不同点:表2-5.

表2-5 均数,几何均数和中位数的相异点

平 均 数 意 义 应用场合

均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布 几何均数 平均增减倍数 ①等比资料;②对数正态分布资料

中位数 位次居中的观 ①偏态资料;②分布不明资料;③分布一端或两

察值水平 端出现不确定值

2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。

(2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/fx)(n·x%-ΣfL)

可根据研究目的选择不同的百分位数代入公式进行计算分析。

.

(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考

值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数?

答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。

4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少

(3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响

(5)研究总体中观察值之间变异程度大小

5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?

(1) 概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的 连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示方法不同,正态分布用N(μ,σ2)表示,标准正态分布用N(0,1)表示,对数

2

正态分布N(μlgX,σlgX)表示。

(2) 应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。 ②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。 6.医学中参考值范围的含义是什么?确定的原则和方法是什么?

含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。 (2)原则:

① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结

果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。

② 对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值

范围的前提。

③ 判定是否要分组(如男女、年龄、地区等) 确定正常值范围。 ④ 决定取双侧范围值还是单侧范围值。 ⑤ 选择适当的百分范围 ⑥ 确定可疑范围 ⑦ 估计界值

(3)方法:

① 百分位数法:Px=L+(i/fx)(n·x%-ΣfL) ② 正态分布法(对数正态分布):

双侧 X?u?Slg?1XlgX?u?SlgX??

.

百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近

似正态分布(服从对数正态分布)的资料。

7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗? 答:不一定。均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正

态分布。

计算题:

1. 某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:

4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12

4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4074 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.86 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.04 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05

(1)编制频数分布表,简述其分布特征。 ① 找出最大值、最小值求全距(R):

全距=最大值-最小值=7.22-2.70=4.50(mmol/L)

② 求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L) ③ 分组段,划记(表1-1)

表2-6 某地101例30~49岁健康男子血清总胆固醇值划记表 组段(mmol/L) 划记 频数 2.5~ 1 3.0~ 8 3.5~ 9 4.0~ 23 4.5~ 25 5.0~ 17 5.5~ 9 6.0~ 6 6.5~ 2 7.0~7.5 1

.

合计 101

由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。

表2-7 某地101例30~49岁健康男子血清总胆固醇值(mmol/L)X、s计算表

血清总胆 组中值 频数 fX fX 累计 累计频数

固醇值 X f 频数 (实际)

2.5~ 2.75 1 2.75 7.563 1 0.0099 3.0~ 3.25 8 26.00 84.500 9 0.0891 3.5~ 3.75 9 33.75 126.563 18 0.1782 4.0~ 4.25 23 97.75 415.438 41 0.4059 4.5~ 4.75 25 118.75 564.063 66 0.6535 5.0~ 5.25 17 89.25 468.563 83 0.8218 5.5~ 5.75 9 51.75 297.563 92 0.9109 6.0~ 6.25 6 37.50 234.375 98 0.9703 6.5~ 6.75 2 13.50 91.125 100 0.9901 7.0~7.5 7.25 1 7.25 52.563 101 1.0000 478.25 2242.315 注:Xu为组段上限值

2

(2)计算均数X、标准s、变异系数CV。

由上计算表1-2可见:X??fX/?f?478.25/101=4.735(mmol/L) s??fX2?(?fX)2/?f?f?1

?2342.313?(478.25)2/101101?1=0.882(mmol/L)

CV=s/x?100%=0.882/4.735?100%=18.627%

(3)计算中位数M,并与均数X比较,利用前表计算中位数M M = L+(i/f50)(n?50%-ΣfL) =4.5+(0.5/25)(101?50%-41)=4.69(mmol/L)

.