随机误差分布符合正态分布因此课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《随机误差分布符合正态分布因此课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机误差 分布 符合 正态分布 因此 课件
- 资源描述:
-
1、2.1 2.1 理论误差理论误差2.1.1 随机误差及其正态分布随机误差及其正态分布 在重复测量条件下,对同一被测物理量进行多次测量,若每一次的测量在重复测量条件下,对同一被测物理量进行多次测量,若每一次的测量中无粗大误差和系统误差,则在测量结果中只有随机误差,这些随机误差是中无粗大误差和系统误差,则在测量结果中只有随机误差,这些随机误差是由很多暂时未能掌握或无法掌握的微小因素所引起的,其主要有下列几个方由很多暂时未能掌握或无法掌握的微小因素所引起的,其主要有下列几个方面:面:(1)测量设备方面的因素,如零部件配合的不稳定性、零部件的变形、零)测量设备方面的因素,如零部件配合的不稳定性、零部件
2、的变形、零部件表面油膜不均匀、有摩擦等。部件表面油膜不均匀、有摩擦等。(2)环境方面的因素,如温度的微小波动、温度与气压的微量变化、光照)环境方面的因素,如温度的微小波动、温度与气压的微量变化、光照强度的变化、灰尘以及电磁场的变化等。强度的变化、灰尘以及电磁场的变化等。(3)人员方面的因素,如瞄准、读数的不稳定、情绪的波动等。)人员方面的因素,如瞄准、读数的不稳定、情绪的波动等。这些误差表面上看来是毫无规律的,但从整体上观察是服从统计规律的,这些误差表面上看来是毫无规律的,但从整体上观察是服从统计规律的,这种统计规律往往可以通过试验的方法得到。这种统计规律往往可以通过试验的方法得到。第第2章误
3、差理论及数理统计章误差理论及数理统计2.6 方差方差 在第在第1章中给出了一个实际测量结果的例子,以误差作为横坐标,以频率章中给出了一个实际测量结果的例子,以误差作为横坐标,以频率数数 f 作为纵坐标,将所得数据画成频率分布的直方图,如图作为纵坐标,将所得数据画成频率分布的直方图,如图2.1所示。所示。图2.1误差频率直方图0 0%2 2%4 4%6 6%8 8%1 10 0%1 12 2%1 14 4%1 16 6%1 18 8%-0 0.0 06 6-0 0.0 05 5-0 0.0 04 4-0 0.0 03 3-0 0.0 02 2-0 0.0 01 10 00 0.0 01 10 0
4、.0 02 20 0.0 03 30 0.0 04 40 0.0 05 50 0.0 06 6xfi图2.2 误差频率分布图0 0%2 2%4 4%6 6%8 8%1 10 0%1 12 2%1 14 4%-0 0.0 06 6-0 0.0 05 5-0 0.0 04 4-0 0.0 03 3-0 0.0 02 2-0 0.0 01 10 00 0.0 01 10 0.0 02 20 0.0 03 30 0.0 04 40 0.0 05 50 0.0 06 6xfi 由图由图2.1可以看出,误差集中在零值附近,若进一步增加试验的次数,可以看出,误差集中在零值附近,若进一步增加试验的次数,区间宽
5、度进一步缩小,则图区间宽度进一步缩小,则图2.1可以变成一条光滑曲线,如图可以变成一条光滑曲线,如图2.2所示。所示。(1)高斯误差定律)高斯误差定律正态分布的分布密度函数为:正态分布的分布密度函数为:(2-1)(2-2)F(x)的图形关于中心轴对称,由此可以得出:)的图形关于中心轴对称,由此可以得出:(2-3)图2.3表示 中不同的正态密度曲线,图形是关于的x=轴对称,的大小影响图形的形状,大图形胖而矮,小图形瘦而高。0f(x)x图 2.3 不同的正态密度曲线 一般的正态分布可以通过适当变换化为标准正态分布。一般的正态分布可以通过适当变换化为标准正态分布。若 xN(2,),令 Z=x,则 Z
6、N(0,1)符合标准正态分布,如下式:ZZdZeZxxF2221)()()((2-4)(2-4)其值见附表其值见附表1。分布图见图分布图见图2.3-1 19世纪德国的科学家高斯研究大量的测量数据时发现,随机误差分布世纪德国的科学家高斯研究大量的测量数据时发现,随机误差分布符合正态分布。因此,在误差理论中将正态分布又称为高斯分布,图符合正态分布。因此,在误差理论中将正态分布又称为高斯分布,图2.3中中的曲线称为高斯曲线,其分布密度函数及概率分布函数分别表示为:的曲线称为高斯曲线,其分布密度函数及概率分布函数分别表示为:(2-5)(2-6)图图2.3-1 2.3-1 标准正态分布曲线标准正态分布曲
7、线f(x)拐点ox1(2)高斯分布的概率计算)高斯分布的概率计算I.查表法查表法(a)将一般的正态分布),(2N化为标准正态分布)1,0(N,令xZ,则)1,0(NZ。以Z查正态分布表的概率值)(xF:)()(ZxF。例 2.1 已知)4,2(2Nx,求 F(4)。解:令 21424xZ 查表得:0.69146)21(所以 0.69146)21()4(F。(b)关于)(21kaxkaF的计算:可以证明:若图例说明图例说明利用利用Excel计算计算oZ落在此区间中的概率为68.26%f(Z)-11标准正态分布示意图标准正态分布示意图(b)关于)(21kaxkaF的计算:可以证明:若),(2aNx
8、,k1、k20,则:)(21kaxkaF1)()(21kk 还可以证明:若 xN(a,2),k1、k20,则)()()(1221kkkaxkaF 例 2.2(1)%27.681)1(2)(axaF 或者,%27.68)1()1()(axaF(2)%45.951)2(2)22(axaF 或者,%45.95)2()2()22(axaF (3)%73.991)3(2)33(axaF 或者,%73.99)3()3()33(axaF 图例说明图例说明利用利用Excle进行计算进行计算ox占68.2%f(x)-xxx(c)(21kaxkaF可以改写为)(21kaxkF,若21kkk,已知)(kaxkF的值
9、,查表可求出k。例 2.3 (1)已知%95)(kaxkF,查表得96.1k(2)已知%99)(kaxkF,查表得58.2k 利用利用Excel进行计算进行计算F(xnxxn)68.27%F(x2nxx2n)95.45%F(x3nxx3n)99.73%(d)在数据处理中,如果 x 为被测物理量的算术平均值 x,其正态分布可以表示为 xN(a,2)(n),其中n为算术平均值 x的标准误差。II.电子表格计算法电子表格计算法计算步骤如下:计算步骤如下:图例说明图例说明ox 落在此区间中的概率为68.26%f(x)axna na nx a或或xnx nx 或或2.1.2 随机误差的数理统计随机误差的
10、数理统计(1)母体和子样)母体和子样 数理统计中将研究对象的全体称为母体,组成母体的每一个单元称数理统计中将研究对象的全体称为母体,组成母体的每一个单元称为子样。工程试验的重要任务就是从子样的试验中得到关于母体的结论。为子样。工程试验的重要任务就是从子样的试验中得到关于母体的结论。(2)统计量与无偏估计)统计量与无偏估计 通过有限的子样观测值来计算母体最可信赖的平均值及方差,这种由通过有限的子样观测值来计算母体最可信赖的平均值及方差,这种由子样计算出来的特征量又称作统计量,而统计量是随机变量,当子样容量子样计算出来的特征量又称作统计量,而统计量是随机变量,当子样容量足够大时(一般足够大时(一般
11、n30),完全可以用子样的参数估计出母体参数(称为),完全可以用子样的参数估计出母体参数(称为点估计),子样平均值可以代表母体平均值点估计),子样平均值可以代表母体平均值A,子样方差,子样方差s可以代表母体方可以代表母体方差差,这统称为母体参数的无偏估值。,这统称为母体参数的无偏估值。在数据处理中,只提出母体参数的无偏估值还是不够的,因为任何在数据处理中,只提出母体参数的无偏估值还是不够的,因为任何一种估计,如果不附以某种偏差范围及在此区间内包含参数一种估计,如果不附以某种偏差范围及在此区间内包含参数X真值的可靠真值的可靠程度(或置信概率),是没有多大意义的。程度(或置信概率),是没有多大意义
12、的。F(xn a xn)6 8.2 7%可 改 写 为:F(a nx a n)6 8.2 7%可改写为:可改写为:图示说图示说明明置信度的意义置信度的意义置信度的意义置信度的意义显著性水平ot显著性水平置信度(1)(t)测量结果子样平均值测量结果子样平均值 置信置信区间半长区间半长xn例2.4 某回转机械,在同一稳定工况下,反复测量其转速36次,实测数据(转速单位为:转/min)如下表所示。?表2-1 转速实测数据表 4753.1 4749.2 4750.3 4748.4 4752.3 4751.6 4757.5 4750.6 4753.3 4752.5 4751.8 4747.9 4752.
13、7 4751.0 4752.1 4754.7 4750.6 4748.3 4752.8 4753.9 4751.2 4750.0 4752.5 4753.4 4752.1 4751.2 4752.3 4751.0 4752.4 4753.5 4752.7 4755.6 4751.1 4754.0 4749.1 4750.2 试求出测量结果以及转速在子样平均值0.5范围内的概率。?解:用解:用Excel电子表格进行求解电子表格进行求解 在实际监测数据及分析测定数据中,尽管不是所有在实际监测数据及分析测定数据中,尽管不是所有的测量值都严格遵守正态分布,但是,根据概率论的中的测量值都严格遵守正态分布
14、,但是,根据概率论的中心极限定理,心极限定理,n个相互独立且又服从同一分布的随机变量个相互独立且又服从同一分布的随机变量X,当,当n足够大时(如足够大时(如n30时,可称为大子样样本),时,可称为大子样样本),测定值的平均值渐近地服从正态分布。然而,实际测量测定值的平均值渐近地服从正态分布。然而,实际测量中的子样容量一般都较小(小子样样本),特别是热工中的子样容量一般都较小(小子样样本),特别是热工方面的试验往往如此,这时的方面的试验往往如此,这时的n一般只有一般只有35。在这种情。在这种情况下,不能用子样均方差况下,不能用子样均方差s来代表标准误差。因为来代表标准误差。因为s是一是一个随机变
15、量,不同的子样有不同的值,子样愈小,值愈个随机变量,不同的子样有不同的值,子样愈小,值愈不可靠,其统计量不再服从正态分布,而服从类似于正不可靠,其统计量不再服从正态分布,而服从类似于正态分布的态分布的 t 分布。分布。结论结论2.1.3 测量中的坏值及剔除测量中的坏值及剔除 在实际测量中,由于偶然误差的客观存在,所得的数据总存在着在实际测量中,由于偶然误差的客观存在,所得的数据总存在着一定的离散性。但也可能由于过失误差出现个别离散较远的数据,这一定的离散性。但也可能由于过失误差出现个别离散较远的数据,这通常称为坏值或可疑值。如果保留了这些数据,必然影响测量结果的通常称为坏值或可疑值。如果保留了
16、这些数据,必然影响测量结果的精确性。反过来,如果把属于偶然误差的个别数据当作坏值处理,也精确性。反过来,如果把属于偶然误差的个别数据当作坏值处理,也许暂时可以报告出一个精确度较高的结果,但这是虚伪的,不科学的。许暂时可以报告出一个精确度较高的结果,但这是虚伪的,不科学的。正确区分坏值并去除它,是试验中经常遇到的实际问题,必须以科学正确区分坏值并去除它,是试验中经常遇到的实际问题,必须以科学的态度按统计学的原理来处理。的态度按统计学的原理来处理。通常判别坏值常用的方法有两种:一是物理判别法,即在观测过程通常判别坏值常用的方法有两种:一是物理判别法,即在观测过程中及时发现并纠正由于仪表、人员及试验
17、条件等情况变化而造成的错误;中及时发现并纠正由于仪表、人员及试验条件等情况变化而造成的错误;二是统计判别法,即规定一个误差范围(二是统计判别法,即规定一个误差范围(k)及相应的置信概率)及相应的置信概率1,凡超出该误差范围的测量值都是小概率事件,都可以认为是坏值而予以凡超出该误差范围的测量值都是小概率事件,都可以认为是坏值而予以剔除。关于剔除。关于k值的求得,有下面几种方法。值的求得,有下面几种方法。(1)拉伊特方法)拉伊特方法 该方法按正态分布理论,以最大误差范围该方法按正态分布理论,以最大误差范围3为依据进行判别。设为依据进行判别。设有一组测值有一组测值xi(i1,2n),其子样平均值为)
18、,其子样平均值为 ,偏差,偏差 ,按贝塞尔公式按贝塞尔公式 ,如果某测量值,如果某测量值xl(1ln)的偏差)的偏差 xl3s时,则认为时,则认为xl是含有粗差的坏值。是含有粗差的坏值。xxxxii1)(1)(1212nxnxxsniinii 该方法的最大优点是简单、方便、不需查表。但对小子样不准,往该方法的最大优点是简单、方便、不需查表。但对小子样不准,往往会把一些坏值隐藏下来而犯往会把一些坏值隐藏下来而犯“存伪存伪”的错误。例如,当的错误。例如,当n10时:时:110)(12niixs(2-8)3six(2-9)此时,任意一个测量值引起的偏此时,任意一个测量值引起的偏差差 xi都能满足都能
19、满足xi3s,不可能,不可能出现大于出现大于3s的情况,这当然就有可能的情况,这当然就有可能把坏值隐藏下来。在一些要求较严的把坏值隐藏下来。在一些要求较严的场合,也用场合,也用2s判别,但判别,但n5的测量同的测量同样无法剔除坏值。样无法剔除坏值。例例2.5 对某物理量进行对某物理量进行15次等精度测量,测量值为:次等精度测量,测量值为:28.39,28.39,28.40,28.41,28.42,28.43,28.40,28.30,28.39,28.42,28.43,28.40,28.43,28.42,28.43试用拉伊特方法判断该测量数据的坏值,试用拉伊特方法判断该测量数据的坏值,并剔除。并
20、剔除。解:解:3s30.0330.099这组测量数据中的最大值 xmax28.43,最小值 xmin28.30。最大值的偏差为:x8=28.3028.4040.104 最小值的偏差为:x 6=28.4328.4040.026 由拉伊特方法可知:由拉伊特方法可知:x80.104不在区间不在区间(0.099,0.099)范围内,)范围内,x828.30是坏值,应剔除。是坏值,应剔除。利用利用Excel进行计算进行计算(2)肖维勒方法)肖维勒方法 该方法的基本原理是:认为在该方法的基本原理是:认为在n次测量中,坏值出现的次测量中,坏值出现的次数为次数为1/2次,即坏值出现的概率为次,即坏值出现的概率
21、为1/2n。按概率积分:。按概率积分:kkxxFdxen)(12212122 (2-10)nnnxF212211)((2-11)由不同的 n 可计算出nn212 之值,查概率积分表后便可求出 k(见表 2-2)。(3)格拉布斯方法)格拉布斯方法 本方法的原理是用显著性水平本方法的原理是用显著性水平来计算来计算k值。这里把误差值。这里把误差超过超过k的概率称为显著性水平的概率称为显著性水平1F(xik),这,这样式(样式(2-11)变为:)变为:1F(x)(2-12)或或 F(x)1 (2-13)在绝大多数场合采用的显著性水平为在绝大多数场合采用的显著性水平为0.01或或0.05(即有(即有1%
22、或或5%的概率是超出范围的概率是超出范围k的),对精度高的测量一般的),对精度高的测量一般都用都用0.01。k由观测次数由观测次数n和和所决定,列于表所决定,列于表2-3中。中。表 2-3 格拉布斯方法中的 k(n,)值 n 0.01 0.05 n 0.01 0.05 n 0.01 0.05 3 1.15 1.15 11 2.48 2.24 20 2.88 2.56 4 1.49 1.46 12 2.55 2.29 22 2.94 2.60 5 1.75 1.67 13 2.61 2.33 24 2.99 2.64 6 1.94 1.82 14 2.66 2.37 25 3.01 2.66 7
23、 2.10 1.94 15 2.70 2.41 30 3.10 2.74 8 2.22 2.03 16 2.74 2.44 35 3.18 2.81 9 2.32 2.11 17 2.78 2.48 40 3.24 2.87 10 2.41 2.18 18 2.82 2.50 50 3.34 2.96 一组观测值中的离差值一组观测值中的离差值xik(n,)者为坏值,者为坏值,应予剔除。应予剔除。肖氏法是经典的方法,但概率上的意义不很科学,特别当肖氏法是经典的方法,但概率上的意义不很科学,特别当n时,理论上时,理论上k(n,),此时所有的粗差坏值都不能剔,此时所有的粗差坏值都不能剔除。而格氏方法
24、被实践证明是效果最好的方法。除。而格氏方法被实践证明是效果最好的方法。注意:注意:不论上述哪一种方法,在计算离差不论上述哪一种方法,在计算离差xixi 时,平均值时,平均值 。中包括所有的数据(即包中包括所有的数据(即包括要剔除但未判断清楚的可疑值),标准误差括要剔除但未判断清楚的可疑值),标准误差s按贝塞尔公按贝塞尔公式计算。式计算。经检查确认为坏值者应予剔除,然后用剩下的值经检查确认为坏值者应予剔除,然后用剩下的值计算平均值及误差。计算平均值及误差。xxnxnii1 niix1例例2.6 例例2.5中的数据,用格拉布斯方法判断是否存在中的数据,用格拉布斯方法判断是否存在坏值(坏值(=0.0
25、5)。)。解:解:利用利用Excel进行计算进行计算当 n15 时,查表得 k2.41,sk2.410.0330.080 这组测量数据中的最大值 xmax28.43,最小值 xmin28.30。最大值的偏差为:x828.3028.4040.104 最小值的偏差为:x628.4328.4040.026 由格拉布斯方法可知:x 80.104 不在区间(0.080,0.080)范围内,x828.30 是坏值,应剔除。(4)狄克逊方法)狄克逊方法 该法应用极差(两测值之差)比的方法得以简化复杂的该法应用极差(两测值之差)比的方法得以简化复杂的计算公式。为提高判别坏值的效率,对不同的测量次数应用计算公式
展开阅读全文