分析化学
第二章 误差和分析数据处理 - 章节小结
1.基本概念及术语
准确度:分析结果与真实值接近的程度,其大小可用误差表示。
精密度:平行测量的各测量值之间互相接近的程度,其大小可用偏差表示。
系统误差:是由某种确定的原因所引起的误差,一般有固定的方向(正负)和大小,重复测定时重复出现。包括方法误差、仪器或试剂误差及操作误差三种。
偶然误差:是由某些偶然因素所引起的误差,其大小和正负均不固定。
有效数字:是指在分析工作中实际上能测量到的数字。通常包括全部准确值和最末一位欠准值(有±1个单位的误差)。
t分布:指少量测量数据平均值的概率误差分布。可采用t分布对有限测量数据进行统计处理。 置信水平与显著性水平: 指在某一t值时,测定值x落在μ±tS范围内的概率,称为置信水平(也称置信度或置信概率),用P表示;测定值x落在μ±tS范围之外的概率(1-P),称为显著性水平,用α表示。 置信区间与置信限:系指在一定的置信水平时,以测定结果x为中心,包括总体平均值μ在内的可信范围,即 μ=x±uζ,式中uζ为置信限。分为双侧置信区间与单侧置信区间。
显著性检验:用于判断某一分析方法或操作过程中是否存在较大的系统误差和偶然误差的检验。包括t检验和F检验。 2.重点和难点
(1)准确度与精密度的概念及相互关系 准确度与精密度具有不同的概念,当有真值(或标准值)作比较时,它们从不同侧面反映了分析结果的可靠性。准确度表示测量结果的正确性,精密度表示测量结果的重复性或重现性。虽然精密度是保证准确度的先决条件,但高的精密度不一定能保证高的准确度,因为可能存在系统误差。只有在消除或校正了系统误差的前提下,精密度高的分析结果才是可取的,因为它最接近于真值(或标准值),在这种情况下,用于衡量精密度的偏差也反映了测量结果的准确程度。
(2)系统误差与偶然误差的性质、来源、减免方法及相互关系 系统误差分为方法误差、仪器或试剂误差及操作误差。系统误差是由某些确定原因造成的,有固定的方向和大小,重复测定时重复出现,可通过与经典方法进行比较、校准仪器、作对照试验、空白试验及回收试验等方法,检查及减免系统误差。偶然误差是由某些偶然因素引起的,其方向和大小都不固定,因此,不能用加校正值的方法减免。但偶然误差的出现服从统计规律,因此,适当地增加平行测定次数,取平均值表示测定结果,可以减小偶然误差。二者的关系是,在消除系统误差的前提下,平行测定次数越多,偶然误差就越小,其平均值越接近于真值(或标准值)。 (3)有效数字保留、修约及运算规则 保留有效数字位数的原则是,只允许在末位保留一位可疑数。有效数字位数反映了测量的准确程度,绝不能随意增加或减少。在计算一组准确度不等(有效数字位数不等)的数据前,应采用“四舍六入五留双”的规则将多余数字进行修约,再根据误差传递规律进行有效数字的运算。几个数据相加减时,和或差有效数字保留的位数,应以小数点后位数最少(绝对误差最大)的数据为依据;几个数据相乘除时,积或商有效数字保留的位数,应以相对误差最大(有效数字位数最少)的数据为准,即在运算过程中不应改变测量的准确度。
(4)有限测量数据的统计处理与t分布 通常分析无法得到总体平均值μ和总体标准差ζ,仅能由有限测量数据的样本平均值和样本标准差S来估计测量数据的分散程度,即需要对有限测量数据进行统计处理,再用统计量去推断总体。由于和S均为随机变量,因此这种估计必然会引进误差。特别是当测量次数较少
时,引入的误差更大,为了补偿这种误差,可采用t分布(即少量数据平均值的概率误差分布)对有限测量数据进行统计处理。
(5)置信水平与置信区间的关系 置信水平越低,置信区间就越窄,置信水平越高,置信区间就越宽,即提高置信水平需要扩大置信区间。置信水平定得过高,判断失误的可能性虽然很小,却往往因置信区间过宽而降低了估计精度,实用价值不大。在相同的置信水平下,适当增加测定次数n,可使置信区间显著缩小,从而提高分析测定的准确度。
(6)显著性检验及注意问题 t检验用于判断某一分析方法或操作过程中是否存在较大的系统误差,为准确度检验,包括样本均值与真值(或标准值)间的t检验和两个样本均值间的t检验;F检验是通过比较两组数据的方差S2,用于判断两组数据间是否存在较大的偶然误差,为精密度检验。两组数据的显著性检验顺序是,先由F检验确认两组数据的精密度无显著性差别后,再进行两组数据的均值是否存在系统误差的t检验,因为只有当两组数据的精密度或偶然误差接近时,进行准确度或系统误差的检验才有意义,否则会得出错误判断。
需要注意的是:①检验两个分析结果间是否存在着显著性差异时,用双侧检验;若检验某分析结果是否明显高于(或低于)某值,则用单侧检验;②由于 t与F等的临界值随α的不同而不同,因此置信水平P或显著性水平α的选择必须适当,否则可能将存在显著性差异的两个分析结果判为无显著性差异,或者相反。 (7)可疑数据取舍 在一组平行测量值中常常出现某一、两个测量值比其余值明显地偏高或偏低,即为可疑数据。首先应判断此可疑数据是由过失误差引起的,还是偶然误差波动性的极度表现?若为前者则应当舍弃,而后者需用Q检验或G检验等统计检验方法,确定该可疑值与其它数据是否来源于同一总体,以决定取舍。
(8)数据统计处理的基本步骤 进行数据统计处理的基本步骤是,首先进行可疑数据的取舍(Q检验或G检验),而后进行精密度检验(F检验),最后进行准确度检验(t检验)。
(9)相关与回归分析 相关分析就是考察x与y两个变量间的相关性,相关系数r越接近于±1,二者的相关性越好,实验误差越小,测量的准确度越高。回归分析就是要找出x与y两个变量间的函数关系,若x与y之间呈线性函数关系,即可简化为线性回归。 3.基本计算
(1)绝对误差:δ=x-μ
(2)相对误差:相对误差=(δ/μ)×100% 或 相对误差=(δ/x)×100% (3)绝对偏差:d = xi-
(4)平均偏差:
(5)相对平均偏差:
(6)标准偏差:或
(7)相对标准偏差:
(8)样本均值与标准值比较的t 检验:
(9)两组数据均值比较的t检验:
(10)两组数据方差比较的F检验:(S1>S2)
(11)可疑数据取舍的Q检验:
(12)可疑数据取舍的G检验:习题
1.标定浓度约为0.1mol·L-1的NaOH,欲消耗NaOH溶液20mL左右,应称取基准物质H2C2O4·2H2O多少克?其称量的相对误差能否达到0.1%?若不能,可用什么方法予以改善?
解:根据方程2NaOH+H2C2O4·H2O==Na2C2O4+3H2O可知, 需称取H2C2O4·H2O的质量m1为:
则称量的相对误差大于0.1% ,不能用H2C2O4·H2O标定0.1mol·L-1的NaOH ,可以选用相对分子质量大的基准物进行标定。若改用KHC8H4O4为基准物,则有: KHC8H4O4+ NaOH== KNaC8H4O4+H2O,需称取KHC8H4O4的质量为m2 ,则 m2=0.1×0.020×204.22=0.41g
由此可见,选用相对分子质量大的邻苯二甲酸氢钾标定NaOH,由于其称样量较大,称量的相对误差较小(<0.1%),故测定的准确度较高。
2.用基准K2Cr2O7对Na2S2O3溶液浓度进行标定,平行测定六次,测得其浓度为0.1033、0.1060、0.1035、0.1031、0.1022和0.1037 mol/L,问上述六次测定值中,0.1060是否应舍弃?它们的平均值、标准偏差、置信度为95%和99%时的置信限及置信区间各为多少? 解:(1)
(2)
(3)
查G临界值表,当n=6和置信度为95%时,G6,0.05=1.89,即G﹤G6,0.05,故0.1060不应舍弃。
(4)求平均值的置信限及置信区间。根据题意,此题应求双侧置信区间,即查t检验临界值表中双侧检验的