定量分析中的数据取舍课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《定量分析中的数据取舍课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定量分析 中的 数据 取舍 课件
- 资源描述:
-
1、2-2 定量分析中的数据处理定量分析中的数据处理及评价及评价1、数据处理中的几个术语及其意义、数据处理中的几个术语及其意义 在在实际实际的分析测试工作中,测试所得的的分析测试工作中,测试所得的数据总是数据总是参差不齐,参差不齐,误差是客观存在的。误差是客观存在的。如何对所得的数据进行处理和评价,找如何对所得的数据进行处理和评价,找出其规律,判断分析结果的可靠性,并出其规律,判断分析结果的可靠性,并用于指导实践。用于指导实践。数理统计法数理统计法是处理与评是处理与评价数据的科学方法。先介绍有关的的几价数据的科学方法。先介绍有关的的几个术语:个术语:(1)总体、样本和个体)总体、样本和个体(2)平
2、均值和中位数)平均值和中位数(3)精密度的表示方法)精密度的表示方法 (1)总体、样本、个体和样本容量)总体、样本、个体和样本容量 总体:总体:研究对象的研究对象的全体全体称为总体(或母称为总体(或母体);体); 样本:样本:(或子样):自总体中(或子样):自总体中随机抽出随机抽出的的 一部分一部分样品称为样本(或子样);样品称为样本(或子样); 个体:个体:组成总体的每一个单元称之为个组成总体的每一个单元称之为个体;体; 样本容量:样本容量:样本中所含样本中所含个体的数目个体的数目称为称为样本大小(样本大小(或样本容量或样本容量)举例说明举例说明 对某一批软锰矿中二氧化锰含量的测定对某一批软
3、锰矿中二氧化锰含量的测定。分析。分析人员按分析标准规定,对物料人员按分析标准规定,对物料进行进行处理(取样、处理(取样、粉碎、过筛和缩分等粉碎、过筛和缩分等前处理前处理的过程),最后的过程),最后得得到约到约500g供分析用的试样,这就是供分析用的试样,这就是总体总体。从。从500g的试样(总体)中的试样(总体)中取取12份份软锰矿软锰矿样品样品来进来进行分析,得到行分析,得到12个测定值个测定值,这一组测定值(,这一组测定值(12个数据个数据)称为本软锰矿试样总体的)称为本软锰矿试样总体的随机样本随机样本,样本容量为样本容量为12。由于不可能对总体中的每一个个体都进行研究,由于不可能对总体中
4、的每一个个体都进行研究,应用统计学的方法对样本(有限的个体)的研究应用统计学的方法对样本(有限的个体)的研究来研究总体。如上例中,通过来研究总体。如上例中,通过12次的测定的数值,次的测定的数值,来确定该批软锰矿中二氧化锰的含量。来确定该批软锰矿中二氧化锰的含量。(2 )平均值和中位数)平均值和中位数 平均值平均值inxn1lim 总体平均值总体平均值:当测量次数和测量数据:当测量次数和测量数据无无限多时限多时,其,其平均值称为总体平均值或均平均值称为总体平均值或均值,即为真值值,即为真值。真值。真值:xininX11 样本算术平均值(样本算术平均值(也称平均值、均值也称平均值、均值,测定有限
5、测定有限次次,在分析测试工作中一般在分析测试工作中一般 n20),将所得将所得数据的总和除于测定次数而得:数据的总和除于测定次数而得:中位数中位数 中位数中位数:位于一系列按递增或递减排列数据:位于一系列按递增或递减排列数据中中间的数据称为中位数。间的数据称为中位数。 (1)数据的数目数据的数目n为奇数为奇数时,居于中间的数值时,居于中间的数值仅仅一个一个; (2)数据的数目数据的数目n为偶数为偶数时,居于中间的数值时,居于中间的数值有有两个两个,此时,此时中位数为它们的平均值中位数为它们的平均值; (3)采用中位数的采用中位数的优点优点是:计算简便,它与是:计算简便,它与两端极值的变化无关,
6、当测量次数较少、而且两端极值的变化无关,当测量次数较少、而且又有大误差出现,数据处理有困难时,采用中又有大误差出现,数据处理有困难时,采用中位数较好。位数较好。小结:平均值和中位数表示数据的集中趋势小结:平均值和中位数表示数据的集中趋势,即即数据集中在平均值或中位数附近。数据集中在平均值或中位数附近。(3)精密度的表示法)精密度的表示法 在误差概念的讨论中己知在误差概念的讨论中己知,可用误差和偏差来表可用误差和偏差来表示测定数据的准确度和精密度。而示测定数据的准确度和精密度。而精密度是对精密度是对有限次测定数据的离散程度。有限次测定数据的离散程度。d、 、 、(极差)和公差来表示。(极差)和公
7、差来表示。 根据对数据处理的要求不同,数据的根据对数据处理的要求不同,数据的精密度还精密度还常用以下常用以下几种方法表示。几种方法表示。dXd方差方差 总体方差总体方差:测定值与真值的差的平方和测定值与真值的差的平方和除以测定次数除以测定次数n。)()(22nnxi 样本方差样本方差:)20(1)(22nnXxSi标准差标准差 标准差标准差:方差的平方根为标准偏差方差的平方根为标准偏差。 总体的标准差也称总体的标准差也称标准误差,对真值言。标准误差,对真值言。)()(2nnxi由于真值不知道,所以标准误差少用。由于真值不知道,所以标准误差少用。样本标准差(标准偏差)与变异系数样本标准差(标准偏
8、差)与变异系数样本标准差也称为样本标准差也称为标准偏差标准偏差:对:对平均值而言平均值而言。 相对标准偏差也相对标准偏差也称变异系数。称变异系数。)20(1)(2nnXxSi_XS在要求较严格的测定数据时,一般用变异系数在要求较严格的测定数据时,一般用变异系数来表示误差。来表示误差。标准误差与标准偏差的特点标准误差与标准偏差的特点1. 标准误差相对标准误差相对真值真值而言,测定次而言,测定次 数为数为n2. 标准偏差相对标准偏差相对平均值平均值而言,计算公式中而言,计算公式中的的n-1称为自由度(通俗的理解可为:做称为自由度(通俗的理解可为:做了了n次实验,有次实验,有n-1次可以做对比)。次
9、可以做对比)。精密度表示法小结精密度表示法小结 测定结果数据精密度的表示法有:测定结果数据精密度的表示法有: 偏差偏差(d) 平均偏差平均偏差( ) 相对平均偏差相对平均偏差( 即精密度)即精密度) 标准偏差标准偏差(s) 相对标准偏差相对标准偏差( 即即 :变异系数):变异系数)d_xd_xS工业生产中还常用工业生产中还常用极差极差和和公差公差来表示来表示,具体采用哪具体采用哪一种表示法、由一种表示法、由分析结果分析结果的的要求决定要求决定。 另外:表示误差的数值时,用另外:表示误差的数值时,用1-2位有效数字位有效数字即可。即可。例例用用标准偏差标准偏差比用比用平均偏差平均偏差更能显示数据
10、的更能显示数据的离散性离散性,因而更科学更准确。因而更科学更准确。 例:有例:有两位两位分析人员对同一样品进行分析,都平分析人员对同一样品进行分析,都平行做了行做了8 8次,得到以下两组数据,计算两组数据次,得到以下两组数据,计算两组数据的平均偏差(的平均偏差( )与标准偏差()与标准偏差(s s):): 1 : 0.11, -0.73, 0.24, 0.51, -0.14, 0.00, 0.30, -0.21, n= 8 =0.28 s1=0.38 2 :0.18, 0.26,-0.25,-0.37, 0.32 , -0.28,0.31, -0.27 n=8 =0.28 s2=0.29= ,
11、 s1s2dXX XX 1d2d1d2d2. 随机误差的分布随机误差的分布 随机误差(偶然误差)随机误差(偶然误差)是由一些偶然因是由一些偶然因素造成的误差,它的大小和方向难以估素造成的误差,它的大小和方向难以估计,似乎没有什么规律,但如果用计,似乎没有什么规律,但如果用统计统计学学方法处理,就会发现它服从一定的统方法处理,就会发现它服从一定的统计规律。为了计规律。为了弄清随机误差的统计规律,弄清随机误差的统计规律,下面我们来讨论以下两个问题。下面我们来讨论以下两个问题。 (1)频数分布)频数分布 (2)正态分布)正态分布测定数据表测定数据表 有一矿石试样,在相同条件下用吸光光度法测定其中铜的
12、百有一矿石试样,在相同条件下用吸光光度法测定其中铜的百分含量,共有分含量,共有100个测量值。这些测量值属随机变量个测量值。这些测量值属随机变量1.36 1.49 1.43 1.41 1.37 1.40 1.32 1.42 1.47 1.391.41 1.36 1.40 1.34 1.42 1.42 1.45 1.35 1.42 1.391.44 1.42 1.39 1.42 1.42 1.30 1.34 1.42 1.37 1.361.37 1.34 1.37 1.46 1.44 1.45 1.32 1.48 1.40 1.451.39 1.46 1.39 1.53 1.36 1.48 1.
13、40 1.39 1.38 1.401.46 1.45 1.50 1.43 1.45 1.43 1.41 1.48 1.39 1.451.37 1.46 1.39 1.45 1.31 1.41 1.44 1.44 1.42 1.471.35 1.36 1.39 1.40 1.38 1.35 1.42 1.43 1.42 1.421.42 1.40 1.41 1.37 1.46 1.36 1.37 1.27 1.47 1.381.42 1.34 1.43 1.42 1.41 1.41 1.44 1.48 1.55 1.37频数分布对上表对上表100个数据的分析:个数据的分析:1. 有有两个极值,最
14、小两个极值,最小为为1.27,最大最大为为1.55。2. R(极值)(极值)=1.55-1.27=0.280.30(方便(方便处理)处理)3. 把数据分为把数据分为10组组则组距为则组距为0.03,将各测,将各测量值对号编入。量值对号编入。4. 制频数分布表。制频数分布表。 分组频数相对频数1.2651.29510.011.2951.32540.041.3251.35570.071.3551.385170.171.3851.415240.241.4151.445240.241.4451.475150.151.4751.50560.061.5051.53510.011.5351.56510.01
15、1001频数分布表(图表)数据频数分布规律数据频数分布规律 由以上数据,我们可以发现位于中由以上数据,我们可以发现位于中间数值间数值1.361.44之间的数据多一些之间的数据多一些,其他范围的数据少一些其他范围的数据少一些,小于小于1.27或或大于大于1.55的数据更少一些。这就是说的数据更少一些。这就是说测量数据中有明显的集中趋势。测测量数据中有明显的集中趋势。测量数据的这种既分散又集中的特性,量数据的这种既分散又集中的特性,就是其规律性。就是其规律性。频数分布频数分布图图在在位于中间数位于中间数值值1.361.44之之间的数据多一间的数据多一些些,其他范围其他范围的数据少一些的数据少一些,
16、小于小于1.27或大或大于于1.55的数据的数据更少一些。更少一些。测测量数据有明显量数据有明显的集中趋势。的集中趋势。2.随机误差的正态分布随机误差的正态分布 定量分析的随机测量值或偶然误差的分布定量分析的随机测量值或偶然误差的分布都符合都符合正态分布规律正态分布规律,正态分布就是数学,正态分布就是数学上的上的高斯分布,可用高斯方程描述:高斯分布,可用高斯方程描述: X 是随机测量值,是随机测量值,y 称为概率密度。称为概率密度。 exXfY222)(21)(高斯方程曲线高斯方程曲线(1)分析测定中的随机误分析测定中的随机误差都遵从差都遵从正态分布正态分布,从曲线中可以看到:从曲线中可以看到
17、:1. 偏差大小相等,符号偏差大小相等,符号相反的测定值出现的相反的测定值出现的概率大致相等概率大致相等;2. 偏差小的测定值比偏偏差小的测定值比偏差大的测定值出现的差大的测定值出现的概率多、偏差很大的概率多、偏差很大的测定值出现的概率极测定值出现的概率极小小;3. 曲线呈两头小,中间曲线呈两头小,中间大的势态。大的势态。高斯方程曲线(高斯方程曲线(2)曲线中的曲线中的两个参数两个参数:(真值)(真值) 和和 (标(标准差)准差),当,当确确定后定后,则则:1. 越小,落在越小,落在附近的附近的概率越大,测定值的概率越大,测定值的精密度越好,曲线半精密度越好,曲线半宽度越小宽度越小;2. 相反
展开阅读全文