卫生统计学考试大纲 串讲文字材料 注:以下内容为当初老师串讲的文字 下载本文

卫生统计学考试大纲

串讲文字材料

注:以下内容为当初老师串讲的文字材料,仅供同学进行复习时,参考使用。

第一部分 绪论

一、总体与样本的概念

例1:某地2002年正常成人血压的研究中,其研究总体是该地2002年所有正常成人血压值的全体。

对这样的总体作研究时,观察单位的数量N多数情况下是巨大或不清楚的,统计上称之为无限总体。此时的两个重要参数:总体均数μ与总体标准差σ往往未知,为了获得对它的估计,需要作抽样研究。

例1的样本是指从该地2002年正常成人的血压值的总体中随机抽出的一部分血压值的集合。

二、误差、随机抽样、概率与小概率事件的概念

抽取样本时应遵循随机化原则,使得样本具有足够的代表性,能较准确地代表总体。

对样本作描述性统计时经常采用的统计量是样本均数X与样本标准差s。用样本均数来估计未知总体均数μ时不可避免地会存在差异,各个随机样本所算得的样本均数之间也会存在差异,统计上称之为抽样误差。

抽样误差属于随机误差的一种,随机误差的特点是由偶然因素所致,所得结果或大或小,如果增加观测次数,偏大或偏小的结果会互相中和甚至消除。与随机误差相对立的另一种误差是系统误差,其典型例子是用未校准的天平测量物品时所产生的误差。

概率是反映事件发生的可能性大小的量,用P表示。P<0.05的事件称为小概率事件,可以认为在一次试验中该事件不可能发生。

未知参数

μ σ π 均数 标准差 率 X s p 三、不同类型的统计资料(计量/计数/等级)及相应的统计方法

例1:为调查某地2002年正常成人的血压情况,随机抽取该地100名正常成人血压值作为样本。

例2:为研究某市1995年住院分娩产妇中妊高症发生情况及可能影响因素,故将总体定义为该市1995年所有住院分娩产妇,该总体中妊高症发生率用π表示(未知)。现随机抽取该市1000名住院分娩产妇,并清点其中发生妊高症的产妇人数所获得的资料。

例3:对新药与传统药作疗效对比,观察的主要指征是患者的贫血程度有无改善。两组患者均被分为轻度、中度、重度或恶性贫血四种类型,并分别清点人数。治疗前后分别统计所获得的资料。

第二部分 计量资料的统计描述

四、掌握各种集中、离散趋势指标的计算、适用条件及意义

1.为了解计量资料的分布规律,可将观察值编制频数表、绘制直方图,以描述资料的分布特征(集中趋势和离散趋势),以及分布类型(对称分布、偏态分布)。

2.描述计量资料集中趋势(集中位置)常用的指标有均数,几何均数,中位数

常用描述集中趋势的指标 指标 均数X 几何均数G 中位数M

计算公式 X??X nin(??fL) fM2适用条件

适用于对称分布,尤其正态分布 ①等比资料,②对数正态分布 ①偏态分布,②末端无确定值

M?L?G?lg?1(?flgX

)?f 3.描述频数分布离散趋势的指标有:①极差和四分位数间距,后者较稳定,但均不能综合反映全部观察值的变异程度。②方差和标准差,能综合反映全部观察值的变异程度。③变异系数,可用于单位不同或均数相差悬殊时资料的变异度的比较。以上指标均为数值越小,说明观察值的变异度越小。

常用描述离散趋势的指标 指标 极差R

四分位数间距Q 方差?2、s2

计算公式 最大值-最小值 Q=P75-P25

2?(X??)2 2?(X?X)

s???n?1N2适用条件

任何分布

①偏态分布,②末端无确定值

对称分布,尤其正态分布

标准差?、s

变异系数CV

?(X??)2 ?(X?X)2 ??s?Nn?1对称分布,尤其正态分布

CV?s?100% X①量纲不同的资料②均数相差悬殊的资料

五、对称分布与偏态分布资料的频数分布特征

120名20岁男大学生身高资料

身高组段 (1) 162~ 164~ 166~ 168~ 170~ 172~ 174~ 176~ 178~ 180~ 182~184 合计

频数,f (2) 2 3 10 13 19 28 20 10 10 4 1 (?f)120

某校急性食物中毒潜伏期资料 潜伏期(天)

(1) 0~ 1~ 2~ 3~ 4~ 5~ 6~ 7~ 8~ 合计

人数(f) (2)

1 7 32 11 11 4 2 1 1 70

六、正态分布与标准正态分布的特征:见《预防医学》P112或《实用卫生统计学》P21。

七、正态分布与标准正态分布曲线下特殊的面积规律 正态分布曲线下面积规律是,理论上μ±1.96б、μ±2.58б区间的面积(观察单位数)各占总面积(总观察单位数)的95%和99%。标准正态分布曲线下面积规律是,理论上(-1.96,1.96)和(-2.58,2.58)区间内的面积占总面积的95%和99%。

八、正态分布法计算95%、99%正常值范围的公式

实际应用中却很少已知μ和б,当样本含量n较大时,可用X和s作为μ和б的估计值,则有:X?1.96s(X?1.96s,X?1.96s )包括所有观察值的95%;X?2.58s包括所有观察值的99%。