研究生医学统计学考试总结 下载本文

医学统计学复习重点

第一章 绪 论

1. 基本概念:

总体population——根据研究目的确定,所有同质观察单位某种观察值的全体。

样本sample——是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。样本代表性的前提:同质总体,足够的观察单位数,随机抽样。 参数paramater——刻画总体特征的统计指标。一般用希腊字母表示?、? 、π

统计量statistic——刻画样本特征的统计指标。抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p

随机抽样random sampling——按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

变异variation——同质基础上各观察单位某变量值的差异。

抽样误差sampling error——个体变异所致,抽样研究中样本信息与总体特征间的差异。抽样误差是不可避免的。属于随机误差,无方向性,重复抽样可以呈现一定的规律性。

系统误差(systematic error)随机误差(random error)

计量资料measurement data——通过度量的方法,测量每个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量单位或多为连续性资料。 计数资料count data——指将全体观察单位按某种属性分组,然后再分别清点各组观察单位的个数而得到的数据资料,其特点是没有度量单位或多为非连续性资料。 等级资料ordinal data——将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。

概率:描述随机事件发生的可能性大小的一个度量。若P(A)=1,则称A为必然事件;若P(A)=0,则称A为不可能事件;随机事件A的概率为0<P<1. 小概率事件:若随机事件A的概率P≤α,则称随机事件A为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。 小概率事件 P≤0.05

2. *统计工作的四个步骤:设计、收集资料、整理资料、分析资料。(用工作实例解释)

第二章 定量/计数资料的统计描述

一、定量资料 1. 基本概念:

频数表frequency table——用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数 算术均数arithmetic mean——描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示

X??X X??f X

nn几何均数geometric mean——用以描述对数正态分布或数据呈倍数变化资料的平均水平。记为G。

lg X??1?f lg XM G?lg G?lg?1nn中位数medianMd——将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。

0.5n?f LM?LM?()?ifM (M:中位数;LM:M所在组的上限;f L:M所在组之前积累的频数;fM:M所在组的频数;i:组距)

极差range——亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

百分位数percentile——是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

n?x%?f LPX?Lx?()?ifx

四分位数间距inter-quartile range——是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。Q=P75 - P25 方差variance——方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。(总体

、样本S2)

标准差standard deviation——是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。( 标准误及X s ——通常将样本统计量的标准差称为标准误。许多样本均数的标准差X s称为均数的标准误(standard error of mean,SEM )

S、S)?S?2SS?

变异系数coefficient of variation——用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。计算:标准差/均数*100%

医学参考值范围——是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%。

统计推断statistical inference——通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。

标准正态分布——对正态分布的(X-μ)/σ进行u的变换,u=(X-μ)/σ,则正态分布变换为μ=0,σ=1的标准正态分布,亦称u分布。u被称为标准正态变量或标准正态离差。

两个参数:μ是位置参数,σ是形状参数。用N(0,1)表示标准正态分布。

CV?S?100%X