思考与练习参考答案去选择版

第1章 绪论

三、思考题

1. 生物统计学与其他统计学有什么区别和联系?

答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。

2. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?

答:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。

3. 某地区有10万个7岁发育正常的男孩,为了研究这些7岁发育正常男孩的身高和体重,在该人群中随机抽取200个7岁发育正常的男孩,测量他们的身高和体重,请回答下列问题。

(1) 该研究中的总体是什么?

答:某地区10万个7岁发育正常的男孩。 (2) 该研究中的身高总体均数的意义是什么?

答:身高总体均数的意义是: 10万个7岁发育正常的男孩的平均身高。 (3) 该研究中的体重总体均数的意义是什么?

答:体重总体均数的意义是: 10万个7岁发育正常的男孩的平均体重 (4) 该研究中的总体均数与总体是什么关系? 答:总体均数是反映总体的统计学特征的指标。 (5)该研究中的样本是什么?

答:该研究中的样本是:随机抽取的200个7岁发育正常的男孩。

二、简答题

1. 对定量资料进行统计描述时,如何选择适宜的指标?

答:详见教材表2-18。

教材表2-18 定量资料统计描述常用的统计指标及其适用场合 描述内容 指 标 平均水平

意 义

适 用 场 合

均 数 个体的平均值 几何均数 平均倍数

对称分布

取对数后对称分布

①非对称分布;②半定量资料;③末端开

中 位 数 位次居中的观察值

口资料;④分布不明

众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料

变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析

标 准 差 观察值平均离开均数的

对称分布,特别是正态分布资料

(方 差) 程度 四分位数①非对称分布;②半定量资料;③末端开

居中半数观察值的全距

间距 口资料;④分布不明

①不同量纲的变量间比较;②量纲相同但

变异系数 标准差与均数的相对比

数量级相差悬殊的变量间比较 2. 举例说明频率和频率分布的区别和联系。

答:2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人,分别有30人病情稳定,66人处于进展状态,54人死亡。

当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36%,属于频率指标。当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合。

两者均为“阳性率”,都是基于样本信息对总体特征进行估计的指标。不同的是:频率只是一种结局发生的频率,计算公式的分子是某一具体结局的发生数;频率分布则由诸结局发生的频率组合而成,计算公式的分子分别是各种可能结局的发生数,而分母则与频率的计算公式中分母相同,是样本中被观察的单位数之和。 3. 应用相对数时应注意哪些问题?

答:(1)防止概念混淆 相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。

(2)计算相对数时分母不宜过小 样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。

4. 常用统计图有哪些?分别适用于什么分析目的? 答:详见教材表2-20。

教材表2-20 常用统计图的适用资料及实施方法 图 形 条 图 直 方 图 百分条图 饼 图 线 图 半对数线图 散 点 图 箱 式 图 茎 叶 图

适 用 资 料 组间数量对比 定量资料的分布 构成比 构成比

定量资料数值变动 定量资料发展速度 双变量间的关联 定量资料取值范围 定量资料的分布

实 施 方 法

用直条高度表示数量大小

用直条的面积表示各组段的频数或频率

用直条分段的长度表示全体中各部分的构成比 用圆饼的扇形面积表示全体中各部分的构成比 线条位于横、纵坐标均为算术尺度的坐标系

线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 点的密集程度和形成的趋势,表示两现象间的相关关系 用箱体、线条标志四分位数间距及中位数、全距的位置 用茎表示组段的设置情形,叶片为个体值,叶长为频数

三、计算题

1. 某内科医生调查得到100名40~50岁健康男子总胆固醇(mg/dl),结果如下 227 199 235 235 246 163 207

190 155 220 167 209 273 208

224 208 190 210 202 178 231

259 203 203 171 186 190 234

225 199 197 248 217 207 226

238 253 149 201 206 259 174

180 181 175 266 200 186 199

193 196 236 189 203 194 278

214 224 202 222 197 246 277

195 210 209 199 161 172 181

213 220 174 197 247 234

193 255 184 214 138 232

209 257 174 199 186 189

172 216 185 198 156 172

244 249 167 230 195 235

(1)编制频数表,绘制直方图,讨论其分布特征。

答:频数表见练习表2-1。根据直方图(练习图2-1),可认为资料为基本对称分布,其包络线见练习图2-2。

练习表2-1 某地100名40~50岁健康男子总胆因醇/(mg·dl)

Valid Percent

1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0

Cumulative Percent

1.0 4.0 15.0 27.0 52.0 67.0 80.0 91.0 96.0 100.0

-1

Valid 130~

145~ 160~ 175~ 190~ 205~ 220~ 235~ 250~ 265~280

Total

Frequency

1 3 11 12 25 15 13 11 5 4 100

Percent

1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0

100.0 100.0

2520Frequency151050140160180200220240260280Mean = 207.41Std. Dev. = 29.82N = 100 总胆固醇练习图2-1 直方图

2520Frequency151050140160180200220240260280Mean = 207.41Std. Dev. = 29.82N = 100 总胆固醇练习图2-2 包络线图 (2)根据(1)的讨论结果,计算恰当的统计指标描述资料的平均水平和变异度。 答:利用原始数据,求出算术均数X?207.4 mg/dl 和标准差S?29.8mg/dl。 (3)计算P25,P75和P95。

答:利用原始数据,求出P25=186.8 mg/dl,P75=229.3 mg/dl,P95=259.0 mg/dl。 2. 某地对120名微丝蚴血症患者治疗3个疗程后,用IFA间接荧光抗体试验测得抗体滴度如下,求抗体滴度的平均水平。 抗体滴度 例 数

1:5 5

1:10 16

1:20 27

1:40 34

1:80 22

1:160 13

1:320 3

利用上述频数表,得平均滴度为1:36.3。

3. 某地1975-1980年出血热发病和死亡资料如教材表2-21,设该地人口数在此6年间基本保持不变。

教材表2-21 某地6年间出血热的发病与死亡情况

年 份 1975 1976 1977 发病数

32 56 162 病死数

4 5 12

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4