第一章 医学统计中的基本概念
练 习 题
一、单向选择题
1. 医学统计学研究的对象是
A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件
2. 用样本推论总体,具有代表性的样本指的是
A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是
A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是
A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是
A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差
答案: E E D E A
1
二、简答题
1. 常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案]
常见的三类误差是:
(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
2. 抽样中要求每一个样本应该具有哪三性? [参考答案]
从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。
3. 什么是两个样本之间的可比性?
2
[参考答案]
可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
第二章 集中趋势的统计描述
练习题
一、单项选择题
1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是
A. 中位数 B. 几何均数 C. 均数 D. P95百分位数 E. 频数分布
2. 算术均数与中位数相比,其特点是
A.不易受极端值的影响 B.能充分利用数据的信息 C.抽样误差较大 D.更适用于偏态分布资料 E.更适用于分布不明确资料
3. 一组原始数据呈正偏态分布,其数据的特点是
A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧 E. 数值分布不均匀
4. 将一组计量资料整理成频数表的主要目的是
A.化为计数资料 B. 便于计算
C. 形象描述数据的特点 D. 为了能够更精确地检验 E. 提供数据和描述数据的分布特征
5. 6人接种流感疫苗一个月后测定抗体滴度为 1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是
3
A. 均数 B. 几何均数 C. 中位数 D. 百分位数 E. 倒数的均数
答案: A B D E B 二、计算与分析
1. 现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。 [参考答案]
3.43+2.96+4.43+3.03+4.53+5.25+5.64+3.82+4.28+5.25X??4.26 (mmol/L)10 M?4.28+4.43?4.36 (mmol/L) 22. 某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:
202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156
(1)编制频数分布表并画出直方图;
(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适; (3)计算百分位数P、P、P和P。 5257595[参考答案]
(1)编制频数表:
某地100例30-40岁健康男子血清总胆固醇值的频数表
甘油三脂(mg/dL)
(1) 110~ 125~
频数 (2) 2 4
4
累积频数 (3)
2
6
累积频率 (4) 2 6
140~ 155~ 170~ 185~ 200~ 215~ 230~ 245~ 合计
11 16 27 12 13 7
5 3 100
17 33 60 72 85 92 97 100
—
17 33 60 72 85 92 97 100
—
画直方图:
302520频数151050110125140155170185胆固醇含量200215230245
图 某地100例30-40岁健康男子血清总胆固醇值的频数分布 (2)计算均数和中位数:
X?(110 +7.5)?2 +(125 +7.5)?4 ?+(245 +7.5)?3?182.9(mg/dl)
100M?P50?170?100?0.5?33?15?179.4(mg/dl)27
从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。
5