数理统计与随机过程ch9课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数理统计与随机过程ch9课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 随机 过程 ch9 课件
- 资源描述:
-
1、数理统计与随机过程数理统计与随机过程第第九九章章主讲教师:程维虎教授主讲教师:程维虎教授北京工业大学应用数理学院北京工业大学应用数理学院第九章第九章 方差分析及回归分析方差分析及回归分析9.1 单因素试验的方差分析单因素试验的方差分析 在科学试验和生产实践中,影响事物的因素往在科学试验和生产实践中,影响事物的因素往往很多。往很多。例如:例如:在化工生产中,原料成分、原料剂在化工生产中,原料成分、原料剂量、催化剂、反应温度、压力、溶液浓度、反应时量、催化剂、反应温度、压力、溶液浓度、反应时间、机器设备及操作员水平等因素,每个因素的改间、机器设备及操作员水平等因素,每个因素的改变都有可能影响产品的
2、数量和质量。有些因素影响变都有可能影响产品的数量和质量。有些因素影响大些,有些较小。为使生产过程得以稳定,确保优大些,有些较小。为使生产过程得以稳定,确保优质、高产,就必要找出对产品质量有显著影响的那质、高产,就必要找出对产品质量有显著影响的那些因素。为此,需要进行试验及设计。些因素。为此,需要进行试验及设计。方差分析就方差分析就是根据试验的结果进行分析,鉴别各试验因素对试是根据试验的结果进行分析,鉴别各试验因素对试验结果影响大小的统计方法。验结果影响大小的统计方法。9.1.1 单因素试验的方差分析单因素试验的方差分析I.基本概念基本概念 1.试验指标试验指标 在试验中,需要考察的指标。在试验
3、中,需要考察的指标。2.因素因素 影响试验指标的条件。因素又分成影响试验指标的条件。因素又分成可控因素可控因素和和不不可控因素可控因素两类。例如,反应温度、原料剂量、溶液浓两类。例如,反应温度、原料剂量、溶液浓度、反应时间等都是可控因素;而测量误差、气候条度、反应时间等都是可控因素;而测量误差、气候条件等都是不可控因素。件等都是不可控因素。3.水平水平 因素所处的状态。因素所处的状态。如试验中仅有一个因素发生改变,而其他因素如试验中仅有一个因素发生改变,而其他因素(有的话有的话)不发生改变不发生改变,称这样的试验为称这样的试验为单因素试验单因素试验;如试验中有多个因素发生改变,就称试验为如试验
4、中有多个因素发生改变,就称试验为多因素多因素试验试验。特别地,称只有两个因素发生改变,而其他因特别地,称只有两个因素发生改变,而其他因素素(有的话有的话)不发生改变的试验为不发生改变的试验为两因素试验两因素试验或或双因双因素试验素试验。II.举例举例例例1 1:用三台机器生产规格相同的铝合金薄板。测量薄用三台机器生产规格相同的铝合金薄板。测量薄板的厚度板的厚度 (精确到千分之一厘米精确到千分之一厘米)如下表所示。在这里如下表所示。在这里,试验指标是薄板厚度试验指标是薄板厚度;机器为因素机器为因素;三台机器就是因三台机器就是因素的三个水平素的三个水平。如果假定除机器因素外,其他因素都。如果假定除
5、机器因素外,其他因素都相同,则试验为单因素试验。相同,则试验为单因素试验。试验目的是为了考察各台机器生产的铝合金薄板试验目的是为了考察各台机器生产的铝合金薄板的厚度是否有显著差异,即因素的不同水平是否对试的厚度是否有显著差异,即因素的不同水平是否对试验目标有显著不同的影响。验目标有显著不同的影响。例例2 2:随机选取的、用于计算器的四种类型的电路的随机选取的、用于计算器的四种类型的电路的响应时间如下表所示响应时间如下表所示 (单位是毫秒单位是毫秒)。试验指标是电试验指标是电路的响应时间路的响应时间;考虑的因素是电路类型考虑的因素是电路类型;四种电路四种电路就是四个水平就是四个水平。试验目的:考
6、察电路类型对响应时。试验目的:考察电路类型对响应时间有无显著影响。间有无显著影响。例例3 3:一火箭使用四种燃料,三种推进器做射程试验。一火箭使用四种燃料,三种推进器做射程试验。每种燃料与每种推进器的组合下发射火箭两次,射程每种燃料与每种推进器的组合下发射火箭两次,射程试验数据由下表给出。试验数据由下表给出。试验指标:射程试验指标:射程;因素:推进因素:推进器器 (三个水平三个水平)、燃料燃料 (四个水平四个水平);目的:考察推进目的:考察推进器和燃料这两个因素对射程是否有显著影响器和燃料这两个因素对射程是否有显著影响。III.问题讨论问题讨论 本节仅讨论单因素试验问题。例本节仅讨论单因素试验
7、问题。例1中,在因素的中,在因素的每个水平下进行独立试验,其结果是一个随机变量。每个水平下进行独立试验,其结果是一个随机变量。表中的数据看成是来自三个不同总体表中的数据看成是来自三个不同总体(每个水平对应每个水平对应于一个总体于一个总体)的样本值。的样本值。将各个总体的均值依次记为将各个总体的均值依次记为1,2与与3。按题意需检验假设。按题意需检验假设 H0:1=2=3,H1:1,2与与3不全相等。不全相等。若假设每个总体均为正态变量,且方差相等,但参数若假设每个总体均为正态变量,且方差相等,但参数未知。那么,这是一个检验具有相同方差的多个正态未知。那么,这是一个检验具有相同方差的多个正态总体
8、均值是否相等的问题。总体均值是否相等的问题。方差分析法就是解决这类方差分析法就是解决这类问题的一种统计方法。问题的一种统计方法。单因素试验的方差分析 设因素设因素A 有有s 个水平:个水平:A1,A2,As,在水平,在水平Aj(j=1,2,s)下,下,进行进行 nj(nj 2)次独立试验,得次独立试验,得到如下标的结果。到如下标的结果。假定水平假定水平Aj(j=1,2,s)下的样本下的样本 来自具有方差来自具有方差2,均值为,均值为j 的正态总体的正态总体,j和和2未未知,且不同水平知,且不同水平Aj下的样本相互独立。下的样本相互独立。jnjjjX,X,X21方差分析的任务 检验检验 s 个总
9、体个总体 的均值的均值 是否相等,即检验假设是否相等,即检验假设 作出未知参数作出未知参数 的估计。的估计。若记若记 的加权平均为的加权平均为(1.2)不全相等。:ss,HH211210,)(,),()(22221,N,N,Ns,221,s(1.3),nnsjjj11s,21 为总平均。其中,,nnsjj1引入引入 表示总体平均值与表示总体平均值与总平均的差异,称为水平总平均的差异,称为水平Aj j 的效应。此时,的效应。此时,,s,j,jj 21模型模型(1.1)可改写成可改写成.nsjij01)(1.1 )(独立同分布,且各 ijsjjjjijijjij.n,n,i,s,j,N,X1202
10、1210)(1.2 :零。不全为0211210ss,H,H假设假设(1.2)等价于假设等价于假设9.1.2 平方和的分解平方和的分解(1.5)(,sjniijTjXXS112(1.7).s,j,XnXjniijjj.2111(1.6)sjniijjXnX111引入总偏差平方和引入总偏差平方和是数据的总平均。是数据的总平均。ST 反应了全部数据之间的差异。反应了全部数据之间的差异。因此,又称其为总变差。因此,又称其为总变差。其中其中记水平记水平 Aj下的样本均值为下的样本均值为上式的第三项为上式的第三项为.)()()()()(sjnij.j.ijsjnij.sjnij.ijsjnij.j.ijT
11、jjjjXXXXXXXXXXXXS111121121122.)()()(0221111sjnij.jijj.sjnij.ijj.jjXnXXXXXXX则有则有SE 称为误差平方和,称为误差平方和,SA称为效应平方和。称为效应平方和。(1.8)式称式称作总变差平方和分解式,简称平方和分解式。作总变差平方和分解式,简称平方和分解式。(1.10).)()(1.9)(sjjjsjjjsjnijAsjnijijEXnXnXXnXXSXXSjj12212112112.,于是,有于是,有 ST=SE+SA,(1.8)其中其中9.1.3 SE与与SA的统计特性的统计特性(1.11)()(jjnis.isni.
12、iEXXXXS121211.XXjjnnij.ij )(1 知 1,根据基本定理6.4.22112 为导出检验问题为导出检验问题(1.2)的检验统计量,首先来的检验统计量,首先来讨论讨论SE与与SA的特性。先将的特性。先将SE写成写成由于不同总体的样本相互独立,又知由于不同总体的样本相互独立,又知(1.11)式中各加式中各加项也相互独立,根据项也相互独立,根据2分布的可加性,得分布的可加性,得(1.12).即 ,)(222121snEnE/S/Ssjj.其中(1.13)()(sjjEnnsnSE12,进一步,可以证明:进一步,可以证明:(1.14)()(.nsSEsjjjA1221特别地,特别
13、地,H0为真时,有为真时,有(1.15),212sA/S(1.16).)/()/(于是,相互独立。与 且n-sS-sS FSSEAEA19.1.4 假设检验问题的拒绝域假设检验问题的拒绝域 由由(1.14)式,知:当式,知:当H0为真时,为真时,SA/(s-1)是是2的的无偏估计,而当无偏估计,而当H1为真时,为真时,此时此时,012 sjjjn(1.17).2122111nssSEsjjjA所以,当所以,当H0不真时,不真时,(1.16)式的分子式的分子SA/(s-1)的取值的取值较较2有偏大的趋势。故,检验问题的拒绝域应有有偏大的趋势。故,检验问题的拒绝域应有(1.18)/()/(kn-s
14、S-sS FEA1的形式。的形式。(1.19),)()()(sn,sEAFsn/Ss/SF11根据根据(1.16)式,可得到检验问题式,可得到检验问题(1,2)的拒绝域为的拒绝域为其中其中为为给定的显著性水平,给定的显著性水平,Fs-1,n-s()是参数为是参数为(s-1,n-s)的的F分布的上分布的上分位点。分位点。单因素方差分析表如下单因素方差分析表如下:,1,2,sjjniijjTTsjXTj11,记记 在实际中,可按以下简便公式计算在实际中,可按以下简便公式计算ST,SA和和SE。则有则有(1.20).ATEsjsjjjjjAsjnisjniijijTSSSnTnTXnXnSnTXXn
15、XSjj11222211112222,不全相等。:32113210,HH,例例4:在例在例1中就是检验假设中就是检验假设(=0.05)解:解:在这里,在这里,s=3,n1=n2=n3=5,n=15,按按(1.20)式式计算,得到计算,得到 ST=0.00124533,SA=0.00105333,SE=0.000192 及如下方差分析表:及如下方差分析表:判断:因判断:因 F2,12()=3.8932.92,故在水平故在水平0.05下拒绝下拒绝H0,即认为各台机器生产的薄板厚度有显著差异。即认为各台机器生产的薄板厚度有显著差异。9.1.5 未知参数的估计未知参数的估计 由由(1.13)式,知:式
16、,知:是是2的无偏估计;的无偏估计;再由再由(1.1),(1.6)及及(1.7)式,知:式,知:故故 分别为分别为和和j 的无偏估计。的无偏估计。若拒绝若拒绝H0,就意味着,效应,就意味着,效应1,2,s不全不全为零。由于为零。由于j=j-,j=1,2,s,知:知:是是j 的无偏估计。的无偏估计。)/(n-sSE2.,.sjXEnXEXEjniijjjj2111 )()()(jjXX,XXjj相互独立。于是,相互独立。于是,与与且且)/()(,)(2snSXXnnXXDXXEEkjkjkjkjkj,211.)()()()()()(snEkjkjkjkjEkjkjtsnSnnXXnnSXX/21
17、111:的的区区间间估估计计。做做法法如如下下的的均均值值差差和和给给出出两两个个正正态态总总体体当当拒拒绝绝原原假假设设时时,常常需需 ,)()(kjkjkjNN22,由于由于(1.21)/()(.kjEsnkjnnStXX112:的置信区间为的置信区间为的置信系数为的置信系数为于是,于是,1 kj例例5:求例求例4中未知参数中未知参数2,j 与与j 的点估计及均值差的点估计及均值差的置信水平为的置信水平为0.95的置信区间。的置信区间。解:解:经计算经计算.0090030110253026202560242000001603322113322112xxxx xxxxxxsnSE ,)/(由
18、由tn-s(/2)=t12(0.025)=2.1788及及(1.21)式,得式,得 1 2,1 3 与与2 3 的置信水平为的置信水平为0.95的置信区间分别为:的置信区间分别为:.,001200060262025600140026000602620242000800200006025602420,.,.,.例例6:6:在例在例2 2中,四类电路的响应时间的总体均为正中,四类电路的响应时间的总体均为正态分布,且各总体的方差相同,但参数未知。设各态分布,且各总体的方差相同,但参数未知。设各样本相互独立。取检验水平样本相互独立。取检验水平=0.05,=0.05,检验各类电路检验各类电路的响应时间是
19、否有显著差异。的响应时间是否有显著差异。解解:分别以分别以1,2,3,4 记类型记类型i,四种电四种电路的响应时间总体均值。我们需要检验:路的响应时间总体均值。我们需要检验:H0:1=2=3=4,H1:1,2,3,4不全相等不全相等.现在,现在,n=18,s=4,n1=n2=n3=5,n4=3,.,.46395983184471418386899212211222 ATEsjjjAsjniijTSSSnTnTSnTXSj,因为因为F 3,14(0.05)=3.343.76,故在水平,故在水平0.05下拒下拒绝绝H0,即认为各类型电路的响应时间有显著差异。,即认为各类型电路的响应时间有显著差异。
20、将上述数据填入下表:将上述数据填入下表:9.2.1 双因素等重复试验的方差分析双因素等重复试验的方差分析 设两个因素设两个因素A 和和 B 作用于试验指标。作用于试验指标。A有有r 个个水平水平A1,A2,Ar,B有有s个水平个水平B1,B2,Bs。现对现对A,B的各水平组合的各水平组合(Ai,Bj),i=1,2,r,j=1,2,s 都作都作t(t2)次试验次试验(称等重复试验称等重复试验),得如下试验结果:得如下试验结果:9.2 双因素试验的方差分析双因素试验的方差分析并假设并假设:ijk(ij,2),i=1,2,=1,2,r,j=1,2,=1,2,s,k=1,2,1,2,t,各各ijk独立
21、。独立。这里,这里,ij 与与 2 为参数,为参数,未知。未知。于是,模型可写成:于是,模型可写成:引入记号:引入记号:.,2,1,2,1,2,1,1,2,1,1,11111sjrisjrrisrsjjiiriijjsjijirisjij 易见,易见,.0,011sjjrii 称称 为总平均,为总平均,i 为水平为水平Ai 的效应,的效应,j为水平为水平Bj 的效的效应。这样可将应。这样可将ij 表示成表示成)2.2(.,2,1,2,1),(sjrijiijjiij记记此时此时 称称 ij 为水平为水平Ai 和水平和水平Bj 的的交互效应交互效应,这是由,这是由Ai 和和Bj 搭配起来联合起作
22、用而引起的。易见搭配起来联合起作用而引起的。易见.,2,1,0,2,1,011risjsjijriij 这样,这样,(2.1)式可写成式可写成与单因素情况类似,对这些问题的检验方法也是与单因素情况类似,对这些问题的检验方法也是建立在平方和的分解上。先引入以下记号:建立在平方和的分解上。先引入以下记号:ritkijkjsjtkijkitkijkijrisjtkijksjXrtXriXstXsjriXtXXrstX11111111.,2,1,1,2,1,1,2,1,2,1,1,1 再引入总偏差平方和再引入总偏差平方和(称为总变差称为总变差)risjtkijkTXXS1112.)(risjjiijs
展开阅读全文