卫生统计学 - 赵耐青习题答案 下载本文

N(π ,π (1?π ) / n)

答:对。

4、某研究者做了一个儿童血铅浓度的流行病学调查,共调查了 1000 人,检测了每个人血 铅浓度。虽然血铅检浓度一般呈非正态分布,但由于该研究样本量很大,可以认为这些 血铅浓度近似服从正态分布。

答:错。血铅浓度的分布与样本量是否很大无关,如果样本量充分大时,血铅浓度的样本均 数的分布近似正态分布。

5、某研究者做了一个儿童血铅浓度的流行病学调查,共调查了 1000 人,检测了每个人血 铅浓度,计算这1000 人的血铅平均浓度。对于现有的1000 人的血铅浓度资料,可以认 为该资料的样本均数近似服从正态分布。

答: 错。样本均数的概率分布是指随机抽样前将要随机抽取的样本,其样本均数近似服从 某个概率分布,样本量很大时,样本均数逼近正态分布。对于这个资料而言,这是已经完成 随机抽样的资料,这个资料的样本均数只是一个数,不存在服从哪种分布的问题。

6、某研究者做了一个儿童血铅浓度的流行病学调查,已知血铅测量值非正态分布,计划调 查1000 人,并将计算1000 人的血铅浓度的样本均数,由于该研究样本量很大,可以认 为随机抽样所获得血铅浓度的样本均数将近似服从正态分布。

答:对。如果从某个均数为μ,标准差为?的非正态分布的总体中抽样,只要样本量足够大,

则样本均数 X 的分布也将近似于正态分布N(μ,? 2 / n)。

二、选择题

1、以下方法中唯一可行的减小抽样误差的方法是___B____。 A、减少个体变异 B、增加样本量

C、设立对照 D、严格贯彻随机抽样的原则

2、X S 表示____C____。

A、总体均数的离散程度 B、总体标准差的离散程度 C、样本均数的离散程度 D、样本标准差的离散程度

3、设连续性随机变量X的总体均数为μ,从X总体中反复随机抽样,随样本量n 增大,

X

X S ?μ

将趋于____D____。

A、X 的原始分布 B、正态分布

C、均数的抽样分布 D、标准正态分布

4、在均数为 μ,标准差为 σ 的正态总体中随机抽样,理论上| X ?μ |≥ ____B____的可能性 为5%。

A、 1.96? B 1.96 X ? C、 0.05/ 2,v t S D 1.96 X S

5、下面关于标准误的四种说法中,哪一种是不正确____C____。

A、标准误是样本统计量的标准差 B、标准误反映了样本统计量的变异 C、标准误反映了总体参数的变异 D、标准误反映了抽样误差的大小

6、变量 X 偏离正态分布,只要样本量足够大,样本均数___C_____。 A、偏离正态分布 B、服从F 分布 C、近似正态分布 D、服从t 分布 三、简答题

1、样本均数的抽样误差定义是什么? 答:样本均数的抽样误差是指样本均数和总体均数间的差异,但同时可以表现为从同一总体 中多次随机抽样所得的样本均数间的差异,通常用样本均数的标准误度量平均的抽样误差大 小。

2、估计样本均数的平均抽样误差的统计量是什么? 答:是样本均数的标准差,即样本均数的标准误。 3、简述样本均数的抽样误差的规律?。 答:样本均数的标准误的理论值为x n

?

? = ,而其估计值为X S S n = ;

4、简述 t 分布、F 分布,χ2 分布曲线的特征与自由度的关系。

答:t 分布是一簇以0 为中心,左右对称的单峰曲线,随着自由度的增加,t 分布曲线将越 来越接近于标准正态分布曲线,当自由度为无穷大时,t 分布就是标准正态分布。t 分布的 曲线下两侧尾部的面积可以通过查对应自由度下的t 分布界值表得到。

χ2 分布的图形为一簇单峰正偏态分布曲线,且随着自由度的增加,正偏的程度越来越小。 χ2 分布的曲线下右侧尾部的面积可通过查χ2 界值表得到。

F 分布的特征有:(1)F 分布有两个自由度,F 的取值范围为0~∞。(2)F 分布为一 簇单峰正偏态分布曲线,与两个自由度有关。(3)每一对自由度下的F 分布曲线下面积, 见方差分析用F 界值表(附表4),横标目为第一自由度,纵标目为第二自由度,表中分别给 出了概率为0.05 和0.01 时的F 界值,记为 , 1 , 2 Fα ν ν 。

t 分布,χ2 分布和F 分布是三种没有未知参数,只有自由度的概率分布,常用于抽样研 究中,故称为三种常见的抽样分布。

5、简述正态分布、t 分布、F 分布、χ2 分布之间的关系。

答:(1)若随机变量 X 服从于正态分布N μ,? 2 ,那么从总体中随机抽取的样本,其样本

均数 X 将服从于正态分布 Z 将服从于标 准正态分布,即

()

( , )

2

X

N μ ? 。令Z 为对X 进行标准化变换的结果,

/ Z X X n

X

μ μ ? ? = ? = ? 服从标准正态分布。(2)自由度为1 的χ2 分布可以

通过将服从标准正态分布的变量平方得到。(3)若随机变量X1 和X2 分别为服从自由度为v1 和v2 的χ2 分布,并且相互独立,则比值

1 )

2 1 1 1 2 2 2 2

χ / χ F X X

ν ν ν ν ν ν = = 分布( 分布( 2 )/

服从自由度为(v1,v2)的F 分布(F-distribution)。

6、目前一般的统计软件(如 SAS,SPSS 和Stata)均能随机模拟产生服从均匀分布、正态 分布、二项分布的随机数。利用这些程序,可以生成指定参数下的随机数据,这种产生 随机数的方法称为“蒙特卡洛方法”(Monte-Carlo Method)。请参考光盘中随机模拟操作, 借助统计软件随机模拟产生随机数据,重现本章中关于均数和率的抽样分布规律。 答:以Stata 为例

正态分布资料的样本均数的分布模拟。 用记事本写入下来语句 clear

set memory 100m

di \输入 样本量 总体均数 总体标准差\scalar m=`1' scalar mm=`2' scalar oo=`3' set obs 10000 local j=1 gen xx=0 gen ss=0

while `j'<=m{

gen x`j'=invnorm(uniform())*oo+mm replace xx=xx+x`j'

replace ss=ss+x`j'*x`j' local j=`j'+1 }

gen ssd=sqrt((ss-xx*xx/m)/(m-1)) replace xx=xx/m di \di \

用文件名\保存 在Stata 窗口中打入

do [路径]simumean 样本量 总体均数 总体标准差 对于Stata 7.0,输入下列命令显示样本均数的频数图 graph xx,bin(50) xlabel

对于 Stata 8.0,输入下列命令显示样本均数的频数图 graph7 xx,bin(50) xlabel

非正态分布的样本均数的分布模拟。 用记事本写入下来语句 clear

set memory 100m di \输入 样本量 \scalar m=`1' set obs 10000 local j=1 gen xx=0 gen ss=0

while `j'<=m{

gen x`j'=invnorm(uniform())^2 replace xx=xx+x`j' replace ss=ss+x`j'*x`j' local j=`j'+1 }

gen ssd=sqrt((ss-xx*xx/m)/(m-1)) replace xx=xx/m di \di \

用文件名\保存 在Stata 窗口中打入

do [路径]simumean1 样本量 总体均数 总体标准差 对于Stata 7.0,输入下列命令显示样本均数的频数图 graph xx,bin(50) xlabel

显示原始资料的频数分布图 graph x1,bin(50) xlabel

对于 Stata 8.0,输入下列命令显示样本均数的频数图 graph7 xx,bin(50) xlabel

显示原始资料的频数分布图