统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集; 分析;解释;表达 的科学。
总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研
究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推 断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表
现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准 误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,
也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准
误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增 加样本例数
区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个
具有较大臵信度的包含总体参数的范围,该范围称为臵信区间(confidence
interval,CI),又称可信区间。
参考值范围 描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、
百分位数法,参考值范围用于判断某项指标是否正常 t
臵信区间 揭示的是按一定臵信度估计总体参数所在的范围。分布法、正态分
布法(标准误)、二项分布法。臵信区间估计总体参数所在范围
参数统计(parametric statistics)
非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体
分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异
同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位 β
为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
线性相关系数(linear correlation coefficient):又称Pearson积差相关系
数(Pearson product moment coefficient),是定量描述两个变量间线性关系
的密切程度与相关方向的统计指标。
参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。
实验设计的基本原则
对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实
验组时,要同时设立对照组
重复 (replication) 相同实验条件下进行多次实验或多次观察。整个实验的重
复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大 小和降低变异
随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽
取或分配到试验组和对照组。 HH
I类错误(假阳性错误) 真实情况为0是成立的,但检验结果为0不成立,
这样的错误称为I类错误。其发生的概率用 表示。在假设检验中作为检验水 准。一般取0.05或0.01。 HH
II类错误(假阴性错误) 真实情况为1是成立的,但检验结果为1不成立,