1、第二章 误差的基本性质及处理第一节 随机误差v随机误差是测得值与在重复性条件下对同一被测量进行无限多次测量结果的平均值之差。这些误差的出现没有确定的规律,但是总体而言有统计规律。在本节数据处理中总是假定系统误差已经消除,没有特别说明,随机误差服从正态分布,没有特别说明均为等精度测量。v一、产生原因v实验条件的偶然性微小变化,如温度波动、噪声干扰、电磁场微变、电源电压的随机起伏、地面振动等。 二、正态分布 误差因素多而小,无一个占优,彼此相互独立(中心极限定理)。一般认为,当影响测量的因素在15个以上,且相互独立,其影响程度相当,可以认为测量值服从正态分布;若要求不高,影响因素则应在5个(至少3
2、个)以上,也可视为正态分布。 221exp22xfx正态分布的密度函数 为测量总体的数学期望,如不计系统误差,则 即为随机误差 x 为测量总体的标准差,是评价随机误差的指标分布的误差特性分布的误差特性(1)单峰性:小误差出现的概率比大误差出现的概率大。(2)对称性:正误差出现的概率与负误差出现的概率相等。(3)有界性:在一定条件下绝对值不会成功一定界限。(4)抵偿性:随测量次数增加,算术平均值趋于零。正态分布的这四个特点与误差大样本下的统计特性相符。但在理论上,正态分布无界,这也是正态分布与实际误差有界性不相符之处。 置信概率正态分布的置信概率 221exp( )22kkpdk 2202( )
3、2zkkedz式中368.26% 95.45% 99.73% 322( )f x 正态积分函数,已制成正态积分表( )k 置信因子k正态分布的某些k值的置信概率3.33.02.582.01.96 1.6451.00.67450.9990.9973 0.990.9540.950.900.6830.5k0.001 0.0027 0.010.046 0.050.100.3170.5p正态分布在误差理论和实践中的地位正态分布在误差理论和实践中的地位(1) 经典误差理论都是建立在正态分布的基础上。凡是有3、5个以上的、差不多微小的、独立影响的合成分布都趋近正态分布。这是被前人早已证明了的中心极限定理告诉
4、我们的一个事实。(2) 许多非正态分布可以用正态分布来表示。(3) 正态分布的概率密度函数具有简单的数学形式和优良的性质。(4) 也有不少的误差分布并不能简单地用正态分布来描述。因而,现代误差理论及其实践需要进一步研究非正态分布的问题。随机误差的表述随机误差的表述0iixx表述方法表述方法 被测量的真值 0 x 一系列测量值ix随机误差的随机性影响 对于任何的测量,其中的随机误差源客观存在,它造成对每次测量数据的不可预测的随机性影响 影响表现在该测量总体服从某种分布 误差可以通过标准差来评价 误差界限则可用置信区间表示 平均误差和或然误差v1、平均误差v2、或然误差547979. 0)(df3
5、26745.05.0)(dfv如图所示值为曲线上拐点A的横坐标,值曲线右半面积重心B的横坐标,值的纵坐标则平分曲线右半部面积。 A B 0( )f x三、算术平均值11niixxn在等权测量条件下,对某被测量进行多次重复测量,得到一系列测量值,常取算术平均值作为被测量真值的最佳估计。12,.,nx xx数学期望数学期望()( )E Xxfx dx定义一阶原点矩,它表示随机变量分布的位置特征。它与真值之差即为系统误差,如果系统误差可以忽略,则 就是被测量的真值 123无限多次测量算术平均值作为真值的理论依据 若测量次数无限增多,且无系统误差下,由概率论的大数定律知,算术平均值以概率为1趋近于真值
6、因为011nniiiixnx根据随机误差的抵偿性,当n充分大时,有 011niixxxn最佳估计的意义最佳估计的意义 若测量次数有限,由参数估计知,算术平均值是该测量总体期望的一个最佳的估计量 ,即满足无偏性、有效性、一致性满足最小二乘原理在正态分布条件下,满足最大似然原理该所有测量值对其算术平均值之差的平方和达到最小该测量事件发生的概率最大 残差v一般情况下,被测量的真值是未知的,不可能用误差公式计算,这时可用算术平均值代替被测量的真值进行计算。v残差就是测量结果减去被测量的真值的估计值。由于算术平均值是被测量的真值的在佳估计值。)的残余误差(简称残差为个测量值,为第iiiiixvixxxv
7、残差性质v对被测量只有一个未知量。v1、所有残差之和等于零。v2、残差平方和最小。 0iv222)min()(axvxxiiiv例:测量某物理量10次,测量得结果如下:序号测量值xi xi vi123456789101879.641879.691879.601879.691879.571879.621879.641879.651879.641879.65-0.010.04-0.050.04-0.08-0.03-0.010-0.0100.0010.051-0.0390.051-0.069-0.0190.0110.0010.0110.001 =1879.65-0.011 =1879.639x011
8、. 00nxxi 0iv四、测量标准(偏)差v(一)测量列中单次测量的标准差v由于随机误差具有随机性,每个测量值不可能完全相同,它们围绕着该测量列的算术平均值有一定的分散性,此分散性说明了测量列中单次测量值的不可靠性。而方差表示随机变量的分散性,但方差的单位是随机变量的单位的平方,所以用方差的正平方根即标准差评价随机误差的不可靠性。由图可知,值越小,则的指数的绝对值越大,因而f()减小得越快,即曲线变陡,而值越小,对应于误差为零的纵坐标也大,曲线变高。反之 , 值越大, f()减小得越慢,曲线平坦,同时对应于误差为零的纵坐标也小,曲线变低。 123123f()标准差计算公式22()()( )D
9、 Xxf x dx()D X要注意的是标准差不是测量列中任何一个具体测得值的随机误差, 值越大只说明在一定条件下等精度测量列随机误差的概论分布情况。在该条件下,任一次测得值的随机误差一般不等于,但认为这一系列测量中所有测得值都属同样一个标准差的概率分布。在不同条件下,对同一被测量进行两个系列的等精度测量,其标准差也不相同。v在等精度测量列中,单次测量的标准差按下面公式计算:v在应用该计算公式时,n应充分大。nnniin1222221实验标准差实验标准差 对于一组测量数据,用其标准差来表述这组数据的分散性 如果这组数据是来自于某测量总体的一个样本,则该组数据的标准差是对该测量总体标准差的一个估计
10、,称其为样本标准差样本标准差,又称为实验标准差实验标准差 贝塞尔公式2111niisxxn公式意义公式意义 总体标准差的估计计算公式计算公式iivxx2 是方差的无偏估计,但s并不是标准差的无偏估计2s 为差。贝塞尔公式的修正因子贝塞尔公式的修正因子n1nM34567891015201.25 1.13 1.09 1.06 1.05 1.04 1.04 1.03 1.03 1.021.011nMn6n 值随 减少明显偏离系数1 在样本数较小的情形(如),为了提高对s估计的相对误差,最好用无偏修正的贝塞尔公式21111niinnssxxMMn 标准差的相对误差标准差的相对误差2( )1nnsMs2
11、( )1nsMs适用的估计贝塞尔公式的相对误差的公式 估计标准差的相对误差,用百分数表示,该百分数愈小,表示估计的信赖程度愈高。在n次测量服从正态分布且独立的条件下,有 ( )12(1)ssn(二)测量列算术平均值的标准差适当增加测量次数取其算术平均值表示测量结果,是减小测量随机误差的一种常用方法。计算公式计算公式221( )11xiiD xDxnnn单次测量标准差测量总体标准差 ( )D x 051 01 52 0n0 .20 .40 .60 .81 .010n x 测量次数愈大时,也愈难保证测量条件的不变,从而带来新的误差。另外,增加测量次数,必10 15n 当 一定时, 以后, 已减小得
12、较缓慢。然会增加测量的工作量及其成本。因此一般情况下,取 以内较为适宜。总之,要提高测量准确度,应选用适当准确度的测量仪器,选取适当的测量次数。1175.0175.0875.04510ixxn210.03030.030(mm)1isxxn 分别计算用游标卡尺对某一试样尺寸测量10次,假定测量服从正态分布,并已消除系统误差和粗大误差,得到数据如下(单位mm):75.01,75.04,75.07,75.00,75.03,75.09,75.06,75.02,75.05,75.08。 求算术平均值及其标准差,并估计标准差的信赖程度;【解【解】序号 xi/mmvi/mm vi2/mm2123456789
13、1075.0175.0475.077575.0375.0975.0675.0275.0575.08-0.035-0.0050.025-0.0450.0150.0450.015-0.0250.0050.0350.00122250.0000250.0006250.0020250.0002250.0020250.0002250.0006250.0000250.001225 =75.045 0.00825mm2x 0iv2ivmmnssmmnvsxi0096. 0100303. 00303. 011000825. 0120.0303( )0.0096(mm)10ss xn( )10.232(1)ssn
14、1 0.2377%(三)标准差的其他计算公式除了贝塞尔公式外计算标准差还有别捷尔斯公式、极差法、最大误差法等。1、别捷尔斯公式1253.1)1(253.111nnvsnnvsniixniiv仍然用上例,用别捷尔斯公式计算单次测量列的标准差v别捷尔斯公式是贝塞尔公式的近似计算公式,由于当时在计算天文数据的标准差,数据较多,开平方根较麻烦,所以用残差绝对值的和代替开平方根。mmnssmmnnvsxi0104. 010033. 0033. 0910250. 0253. 1) 1(253. 12 2、极差法、极差法12,nx xxnnsd( )nsCs当测量误差服从正态分布时,标准差的计算公式 估算时
15、的相对误差 minx极差:n=xmax-xmin s 是测量总体标准差的无偏估计 对多次独立测得的数据 , 最大值, 最小值maxx极差法系数极差法系数nnnndndndnCnCnC1.130.7692.970.27163.5331.690.52103.08 0.26173.590.2142.060.43113.170.25183.640.2052.330.37123.260.24193.690.2062.530.34133.31 0.23203.7472.700.31143.41 0.2282.850.29153.470.22v仍用前面的例子用极差法计算单次测量标准差。v极差法计算简单,并且
16、具有一定的精度,在JJF1059-1999测量不确定度评定与表示中推荐,当测量次数较小时,应采用该方法。mmdsdmmxxnn0292. 008. 309. 008. 309. 07509.751010minmax3 3、最大误差法、最大误差法max1insk( )nnrssk测量误差服从正态分布时,估计标准差的计算公式 估算时的相对误差 在已知被测量的真值的情形,多次独立测得的数据 的真误差,其中的绝对值最大12,nx xx12,n maxi在只进行一次性实验中,是唯一可用的方法最大残差法max1insk 在一般情况下,被测量的真值难以知道,无法应用最大误差法估计标准差 最大残余误差 估计标
17、准差 maxi最大残差法不适用于n=1的情形 最大误差法系数最大误差法系数n0.880.511.771230.750.451.020.680.400.830.640.360.740.610.330.680.580.310.640.560.290.61100.530.270.57200.460.230.251nknnrk1nk 1.250.75【解【解】m1n max35mi查表,得 111.25k 110.75r k 故射击的标准差为 max111.25 3544 misk11( )0.75rssk标准差的相对标准差本例测量一次的情形, 唯有最大误差法可以估计其实验的标准差, 由于样本数为1,
18、故其估计的信赖程度只有25%。 进行一次导弹发射实验,导弹着落点距靶心35,试求射击的标准差。 【解【解】(1) 用贝塞尔公式估算17.72ixxn2210.1361isxxn0.1360.37s ( )10.232(1)ssn对某量测得数据7.7,7.7,7.5,7.7,7.7,7.7,7.9,7.6,7.7,7.8,7.9,试分别用贝塞尔公式、极差法、最大误差法估计其测量标准差及其标准差的相对标准差。(2) 用极差法估算maxmin117.9,7.5,11,7.97.50.4xxn113.17d110.25c 11110.40.133.17sd11( )0.25scs查表,得故(3)用最大
19、误差法估算真值未知,计算最大残差 |vi|max=0.220 x查表,插值计算得 11110.57(0.570.51)0.565k 故max1110.56 0.220.13isk27. 0)(ss【解【解】m1n max35mi查表,得 111.25k 110.75r k 故射击的标准差为 max111.25 3544 misk11( )0.75rssk标准差的相对标准差本例测量一次的情形, 唯有最大误差法可以估计其实验的标准差, 由于样本数为1,故其估计的信赖程度只有25%。 进行一次导弹发射实验,导弹着落点距靶心35,试求射击的标准差。 测量结果的表示v在给顶置信概率P(或显著度)的情况下
20、,测量结果可表示为v其中k为置信系数,它可由误差分布决定。当误差服从正态分布时,如果测量次数较多,可由置信概率P查正态分布表得;当测量次数较少时,则根据置信概率P和自由度v(v=n-1)查t分布表得到。其他分布的置信系数查书P29页表2-8。xksx 正态分布的某些k值的置信概率3.33.02.582.01.96 1.6451.00.67450.9990.9973 0.990.9540.950.900.6830.5k0.001 0.0027 0.010.046 0.050.100.3170.5p五、不等精度测量v不等精度测量是测量条件改变的测量,在实际测量中很难实现等精度测量。常见的不等精度测
21、量有:v1、用不同测量仪器的测量。v2、在相同的测量条件下,每组的测量次数不同。v(一)权v权是各种测量结果的可信赖程度。v权是一个相对数。v在等精度测量中各个测量值的信赖程度一样,所以权相同。因此,它是不等精度测量的一个特例。v(二)权的确定v1、按测量次数确定权,即重复测量次数越多,可靠性越大,权越大,可以干脆用测量次数来确定权的大小。即:pi=ni 。v2、权与相应的标准差成反比inix22ixin2m22212i2n.nnn21imxxxx22m2221P.PP21mxxx222222222m211.1:1.:P.:P:P2121mmxxxxxxv例如:对一级钢卷尺的长度进行三组不等精
22、度测量。v求各组的结果的权。 v解:mmmmxmmmmxmmmmxxxx10. 0,60.2000;20. 0,15.2000;05. 0,45.20003213214:1:16100:25:40001. 01:04. 01:0025. 011:1:1P:P:P222321321xxxv(三)加权算术平均值v对同一被测量进行m组测量,得到m个测量结果v 设相应的测量次数为n1,n2 , nmv即:v由等精度测量算术平均值原理:mnimmminiiniixnLxnLxnL121221111/,./,/21,21nxxxiiiimm2211m1iin1in1in1imi2i1iPPnn.nnnL.
23、LL12mxxxxxv当v就是等精度测量的算术平均值。v为简化运算可利用如下简化公式: v mjjmxmxPPPP1211,.iiiiiiixPxPxPxxx00,iiiiiiiiPxxPPPxPxP)(00i0ii0P)(Pxxxxpi0 xx 为接近其中 的任选参数值。 v例 , , ,v求最后测量结果。v解:取p1=3,p2=2,p3=5,x0=999.94mmv则9425.999x9416.9992x9419.999x5n, 2n, 3n3219420.999100.001950.001620025. 039400.999pxv(四)单位权的概念v权数为1的权称为单位权 。v由 可知同
24、一方差的等精度测量值的权数为1。单位权化实质:使任一量值乘以自身权数的平方根,得到新一量值权数为1。 222m22211P.PPm21Pxxxv 令v 则v 故 v 或 iiiPZx 2i2iiiiP.PDPZDx1P22ii2i2iiP:1P:1P:Pv(五)加权算术平均值的标准差v1、当已知每个测量值及标准差 x1,1;x2,2v;xm,m,时,加权算术平均值的标准差公式为:v例用对一级钢卷尺的长度进行三组不等精度测量的数据。 1=0.05mm, 2= 0.20mm,1=0.10mm, v P1:P2:P3=16:1:4,ippxiiiPPmmPPixp044. 0411612 . 022
25、v2、当已知测量值和重复测量次数x1,n1;x2,n2v;xm,nm,时,加权算术平均值的标准差公式为:v应注意的是这里的残差vi的计算,ipiiiiixpmxxpPmvpsp) 1()() 1(22piixxvpivi=0v例:对某物理量进行6次不等精度测量,测量数据如下:求最佳估计值及其标准差。v解 P1=2,P2=4,P3=1,P4=2,P5=4,P6=5v取x0=10.0mVv =10.0+0.28=10.28mVXi/mV10.110.210.010.510.410.3ni2412455421420.354 . 045 . 02010.241 . 020 .10pxXi/mV10.1
26、10.210.010.510.410.3vi-0.18-0.08-0.280.220.180.02mVPmvpsiiixp06. 018) 16 (02. 0512. 0422. 0228. 0108. 0418. 02) 1(2222222七、随机误差的其他分布(一)均匀分布若误差在某一范围中出现的概率相等,称其服从均匀分布,也称为等概率分布。 概率密度函数概率密度函数 12( )0aafa数学期望数学期望0方差方差223a标准方差标准方差3a置信因子置信因子 o -a a ()f xx服从均匀分布的可能情形服从均匀分布的可能情形 v(1) 数据切尾引起的舍入误差;v(2) 数字显示末位的截
27、断误差v(3) 瞄准误差;v(4) 数字仪器的量化误差;v(5) 齿轮回程所产生的误差以及基线尺滑轮摩擦引起的误差;v(6) 多中心值不同的正态误差总和服从均匀分布。 (二)三角分布概率密度函数概率密度函数 数学期望数学期望0标准方差标准方差6a220( )0axaxaf xaxxaa 当两个分布范围相等的均匀分布,其合成误差就是三角分布。 f (x)_aax_0(三)反正弦分布概率密度函数概率密度函数 数学期望数学期望0E 标准方差标准方差2a()f xx221( )0axaf xax其他a -a o 服从反正弦分布的可能情形服从反正弦分布的可能情形 度盘偏心引起的测角误差;正弦(或余弦)振
28、动引起的位移误差;(四)瑞利分布概率密度函数概率密度函数 数学期望数学期望标准方差标准方差服从瑞利分布的可能情形服从瑞利分布的可能情形 偏心值在非负值的单向误差中,由于偏心因素所引起的轴的径向跳动 2222( ),0 xaxf xexa 2a42a()f xx齿轮和分度盘的最大齿距累积误差 常见分布的数字特征量名称正态分布区间半宽度标准差期望均匀分布三角分布反正弦分布瑞利分布3(0.9973)p 9aaa3a6a2a0004222/2A五、常见的统计量分布v介绍常用的统计量分布,包括 分布, t分布 和F分布。2(一) 分布2定义定义若为独立服从同分布 的随机误差,则(0,1)N称服从为自由度
29、为的分布。 概率密度函数概率密度函数 数学期望数学期望标准方差标准方差12, 22221222( ) 12221( )022xf xxex1( )f xx2010142(1)(二) t分布定义定义若随机误差,随机误差,且和相互独立,则(0,1)N2( ) t 服从的分布称为自由度为的t分布。 概率密度函数概率密度函数 数学期望数学期望标准方差标准方差12212( )12xf x0(2)2o 521( )f xx常用的t分布统计量0(1)/xxtt nsn三、 F分布2212221222(2)4(2) (4) 定义定义若 ,则称服从为自由度为的F分布。 12, 概率密度函数概率密度函数 数学期望数学期望标准方差标准方差12F12( ,)F 11121221212122122( )221xf xx22222( )f x1210, 1210,101210,4)()(222121vv