拟合优度检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《拟合优度检验课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 拟合 检验 课件
- 资源描述:
-
1、 我们前面已经比较系统地讨论了双样本的参数和非参数我们前面已经比较系统地讨论了双样本的参数和非参数检验的问题。现在,我们希望利用一般的方法来检验三个以检验的问题。现在,我们希望利用一般的方法来检验三个以上样本的差异,上样本的差异,检验法和方差分析法就是解决这方面问题的。检验法和方差分析法就是解决这方面问题的。检验法可以对拟合优度和独立性等进行检验,方差分析法则检验法可以对拟合优度和独立性等进行检验,方差分析法则可以对多个总体均值是否相等进行检验。后者由于通过各组可以对多个总体均值是否相等进行检验。后者由于通过各组样本资料之间的方差和组内方差的比较来建立服从样本资料之间的方差和组内方差的比较来建
2、立服从F分布的检分布的检验统计量,所以又称验统计量,所以又称F检验。检验。第一节:拟合优度检验第一节:拟合优度检验第二节:无关联性检验第二节:无关联性检验第三节:方差分析第三节:方差分析第四节:回归方程与相关系数的检验第四节:回归方程与相关系数的检验222第一节第一节 拟合优度检验拟合优度检验 运用运用Z检验、检验、t检验等讨论假设检验的问题,一般要求总体服从检验等讨论假设检验的问题,一般要求总体服从正态分布,或者在大样本条件下可以利用渐近正态分布理论来描述正态分布,或者在大样本条件下可以利用渐近正态分布理论来描述抽样分布。也就是说,我们都要直接或间接地假定对象总体具有已抽样分布。也就是说,我
3、们都要直接或间接地假定对象总体具有已知的分布形式,然后对总体的未知参数进行假设检验。如果不知道知的分布形式,然后对总体的未知参数进行假设检验。如果不知道总体的分布形式,就无法运用总体的分布形式,就无法运用t检验法等对总体参数进行假设检验检验法等对总体参数进行假设检验。于是,这里有一个前面留下来的尚未讨论的问题很重要,就是怎。于是,这里有一个前面留下来的尚未讨论的问题很重要,就是怎样检定总体是否具有正态或其他分布形式?拟合优度检验正是就这样检定总体是否具有正态或其他分布形式?拟合优度检验正是就这一问题而言的检验方法。一问题而言的检验方法。2 2n 首先把问题表述成一般模式。设一总体包含c种可区别
4、的个体。根据某种理论或纯粹的假设,第i 种个体出现的概率应为某个已知的数Pi(i1,2,c),有Pi 0,1。这一组概率(P1,P2,Pc)就构成了我们的理论分布。现在在该总体中随机地抽取一个容量为n的样本,发现其中第 i 种个体的数目为fi(i 1,2,c),并有 n。我们要据此检验理论分布。n 用概率论的语言可以这样说,设对象总体中随机变量X有c种取值。当X的取值是xi 时,按零假设,其总体分布等于理论分布,即P()Pi (i1,2,c)例如,就孟德尔的31理论来说,c 2,P(x1)3/4,P(x2)1/4。现在从该总体中随机地抽取一个容量为n的样本,发现其中xi(i1,2,c)出现的次
5、数为fi(i 1,2,c),并有 n。知道了频数也就知道了频率,即:出现的频率为 ,并有 1。现在我们就是要据此经验分布来检验总体分布等于理论分布的零假设。ciiP1ciiP1ciif1ciif1ixixnficiinf1 拟合优度检验如何进行拟合优度检验如何进行?关键是确定合适的检验统计量以及该统计量所服从的概率分布。这里不可避免地要引进某种人为因素,即人们设计出下面这样的综合性可比指标:其中k1,k2,kc 是适当选取的常数。仔细观察不难 发现,L值大,意味着经验分布与理论分布偏离大;L值小,意味着经验分布与理论分布偏离小。当在某个选定的水平上,经验分布显著偏离理论分布,那么对象总体具有某
6、种分布形式的零假设便被否定。2o2o222o2o应用举例应用举例 3 3正态拟合检验正态拟合检验第二节第二节 无关联性检验无关联性检验22应用此式,不必计算理论频数应用此式,不必计算理论频数计算与计算与 这个检验统计量相这个检验统计量相联系的自由度联系的自由度2o算出算出 统计量之值并定出其自由度后,就可以依前述的方法,在给定了显统计量之值并定出其自由度后,就可以依前述的方法,在给定了显著性水平之后,来对著性水平之后,来对X,Y属性无关联的零假设进行检验了。属性无关联的零假设进行检验了。2o2o2o2o2o2第三节第三节 方差分析方差分析 方差分析,是一种很重要的分析方法,它可以检验两个方差分
7、析,是一种很重要的分析方法,它可以检验两个以上样本均值之差。方差分析是均值差检验的推广,一般用以上样本均值之差。方差分析是均值差检验的推广,一般用于处理自变量是一个(或多个)定类变量和因变量是一个定于处理自变量是一个(或多个)定类变量和因变量是一个定距变量之间的关系。方差分析所包含的假定与均值差检验所距变量之间的关系。方差分析所包含的假定与均值差检验所包含的假定差不多,例如正态分布、独立随机样本、等方差包含的假定差不多,例如正态分布、独立随机样本、等方差性等,但检验本身却很不相同。方差分析直接涉及的是方差性等,但检验本身却很不相同。方差分析直接涉及的是方差而不是均值和标准差。同时,比较也不取两
8、种估计量之差,而不是均值和标准差。同时,比较也不取两种估计量之差,而是取两种估计量的比率。在两种估计量彼此独立的前提下,而是取两种估计量的比率。在两种估计量彼此独立的前提下,两种估计量之比率两种估计量之比率F具有已知的抽样分布,因而可进行很简单具有已知的抽样分布,因而可进行很简单的检验。的检验。ijYY211)(cinjijiYYciin1ijYijYiYijYiYYijYijY不能解释的方差可以解释的方差oF 在零假设(H:)之下,检验统计量F的计算公式。解解 据题意,n1n1+n2+n32+4+3 9 组内自由度nc936 组间自由度c1312 分别计算SST和SSB,计算过程参见前表13
9、.16。于是得MSB 和 MSW MSBSSB(c1)6.89/23.45 MSW SSW(nc)30/65.00 再根据(1319)式求检验统计量Fo Fo 0.69 1 故在010显著性水平上不否定零假设,即不能判断不同品脾对 该种商品的销量有显著影响。WBMSMS545.3 当方差分析的检验呈显著性后,进一步讨论两变量间的相关程度是很自然的。方差分析中相关程度的测定仍采用PRE法。当不知因变量Y 的取值与自变量X 的取值A1,A2,A c有关时,最好的预测是以总均值 作为Y 的估计值。此时,估计所犯的错误将等于SST E1 1SST 当已知因变量Y 的取值与自变量X 的取值A1,A2,A
10、 c有关后,自然用各样本的均值 作为各类别的预测值,此时预测所产生的误差将等于SSW E2SSW 所以消减误差比例可写成 PRE 正是因为上式,我们把SSB称为已解释的变差。显然,已解释的变差越大,预测Y 所减少的误差就越多,X与Y 之间的关系就越密切。据此,方差分析中把已解释的变差对总变差的比值称为相关比率,用符号 表示 1 可用于一个定类变量与一个定距变量的相关程度的测定,当然也可以用于定序定距变量或定距定距变量的相关程度的测定。Y211)(cinjijiYYiY cinjiijiYY112)(010EEE TWTSSSSSS TBSSSS222TWSSSSTBSSSS 例例 试以表试以表
11、13131212的资料,分析孩子图书消费与家庭的资料,分析孩子图书消费与家庭类型的关系。类型的关系。解解 据前面例题中已计算的结果,已知据前面例题中已计算的结果,已知SSB2828,SST276276,因而有,因而有 1 1 10.1%10.1%可见,就表给资料而言,利用家庭类型预测孩子图书消可见,就表给资料而言,利用家庭类型预测孩子图书消费量,只能削减费量,只能削减10.1%10.1%的预测误差。的预测误差。2TWSSSSTBSSSS27628n 相关比率相关比率 研究的是定类研究的是定类定距变量之间的相关程度。由于定距变量之间的相关程度。由于定类变量不具有数量大小的问题,不存在关系是否线性
12、的问题。定类变量不具有数量大小的问题,不存在关系是否线性的问题。因此,当因此,当 被用于研究定距被用于研究定距定距变量之间的关系时,不仅可以作定距变量之间的关系时,不仅可以作为线性相关的量度,也可以作为非线性相关的量度。这意味着,为线性相关的量度,也可以作为非线性相关的量度。这意味着,对线性相关,相关比率对线性相关,相关比率 与与r2 2(积差系数之平方积差系数之平方)有相同的有相同的PREPRE性质;性质;但如果对非线性相关,用积差系数但如果对非线性相关,用积差系数r 来讨论就不行了。来讨论就不行了。n 对于定距对于定距定距变量,曲线相关既然要用定距变量,曲线相关既然要用R来测量,那么反来测
13、量,那么反过来,同一资料通过相关指数过来,同一资料通过相关指数R与积差系数与积差系数r计算的比较,可以判计算的比较,可以判断确定两定距变量的关系是不是直线。如果同时求出断确定两定距变量的关系是不是直线。如果同时求出r与与R,r 等等于或略大于于或略大于R,可说明两变量关系是直线的,用,可说明两变量关系是直线的,用r去测量是合适的;去测量是合适的;如果如果rR,则说明两变量关系可能是曲线的。,则说明两变量关系可能是曲线的。222n 首先,MSB和MSW可以分别称为组间方差和组内方差,其中(在等方差的假设下)组内方差总是2的无偏估计;而组间方差,只有当诸总体(即各样本所代表的子总体)均值实际上相等
14、时,它才是2的无偏估计。这就是说,如果零假设为真,MSB和MSW之间将没有太大的差别。反之。如果零假设实际不正确,可以期望MSB和MSW的比值大于1。如果这个比值小于1,则不从F分布表中查找临界值F就可以判断零假设不能被否定。n 其次,以上两个例题也可以用均值差检验来处理。均值差检验涉及t分布,可以做三组合的比较即A1与A2,A2与A3,A1与A3。与均值差检验不同,方差分析仅进行一次检验来判定三种类别的家庭(或品牌)在消费(或销售)上彼此是否有显著性差异。方差分析的优点在于,一个检验可以代替多个检验。如果有四个类别,均值差检验需做(43)26次;如果有六个类别,需做(65)215次;如果有十
15、个类别,需做(109)245次。况且,如果做15次均值差检验。其中4次结果具有显著性,这时应当下什么结论?可能很难回答。n 第三,方差分析中的自变量X如果是二分变量,也可以采用均值差t检验。在这种情况下,F 的分子自由度是211,分母自由度是n2,这与均值差检验中的t相同。经过计算可知,具有自由度n2的t 2值等于具有分子自由度为1和分母自由度为n2的F 值。比较F 表和t 表也可以核实这一点。换言之,t是分子自由度为l的F 的平方根。这当然意味着,对于样本而言,此时不论采用方差分析或均值差检验,其结果完全相同。n 第四,本节集中讨论了自变量为一个定类变量而因变量为一个定距变量的情况。如果对因
展开阅读全文