第四章相关分析和回归分析修改课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第四章相关分析和回归分析修改课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 相关 分析 回归 修改 课件
- 资源描述:
-
1、2023-1-221第四章第四章 相关分析和回归分析相关分析和回归分析.2023-1-222相关分析和回归分析相关分析和回归分析第一节第一节 地理要素间的地理要素间的相关分析相关分析第二节第二节 地理要素间的地理要素间的回归分析回归分析.32023-1-22一一 相关分析的概念相关分析的概念二二 地理要素的相关类型地理要素的相关类型三三 相关程度的程度方法及显相关程度的程度方法及显著性检验著性检验 第一节第一节 地理要素间的地理要素间的相关分析相关分析.42023-1-22一一 相关分析的概念相关分析的概念就是测度各个变量之间的关系就是测度各个变量之间的关系密切程度的数学方法。密切程度的数学方
2、法。相关分析仅限于测定两个或两个以相关分析仅限于测定两个或两个以上变量具有相关关系者,其主要目的在上变量具有相关关系者,其主要目的在于计算出表示两个或两个以上变量间相于计算出表示两个或两个以上变量间相关程度和性质。关程度和性质。.2023-1-225 所谓地理相关所谓地理相关,就是运用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标。.2023-1-226n为了研究父亲与成年儿子为了研究父亲与成年儿子身高之间的关系,卡尔身高之间的关系,卡尔.皮皮尔逊测量了尔逊测量了1078对父子对父子的身高。把的身高。把1078对数字对数字表示在坐标上,如图。表示在坐标上,如图。n它的形状象一块
3、橄榄状的它的形状象一块橄榄状的云,中间的点密集,边沿云,中间的点密集,边沿的点稀少,其主要部分是的点稀少,其主要部分是一个椭圆。一个椭圆。.2023-1-227正相关 负相关 完全正相关 完全负相关 零相关.2023-1-228二二 地理要素间的相关类型地理要素间的相关类型曲线相关(非线性相关)曲线相关(非线性相关)按变量按变量 多少多少两个变量两个变量两个以上两个以上 变量变量直线相关(线性相关)直线相关(线性相关)复相关复相关偏相关偏相关按质量按质量等级相关(顺序相关)等级相关(顺序相关)品质相关品质相关.2023-1-229 三三 相关程度的测度方法相关程度的测度方法及显著性检验及显著性
4、检验由于地理相关类型各不相同,因此测度的方法也不同。由于地理相关类型各不相同,因此测度的方法也不同。(一)线性相关程度的测度(一)线性相关程度的测度所谓所谓相关程度相关程度,就是研究它们之间的相互关系是否密切。,就是研究它们之间的相互关系是否密切。所谓所谓相关方向相关方向,又可以分两种,即正相关和负相关。,又可以分两种,即正相关和负相关。用来测度直线相关程度和方向的指标就是相关系数。用来测度直线相关程度和方向的指标就是相关系数。.2023-1-22101、常用的相关系数的计算公式及检验、常用的相关系数的计算公式及检验niniiiniiiyyxxyyxxr11221)(*)()((1)相关系数的
5、性质)相关系数的性质相关系数的分布范围,介于相关系数的分布范围,介于-1-1和和+1+1之间之间当相关系数为正值时,表示两个要素(或变数)之间呈正相当相关系数为正值时,表示两个要素(或变数)之间呈正相关,相关系数为负值时,表示两个要素(或变数)之间为负相关;关,相关系数为负值时,表示两个要素(或变数)之间为负相关;相关系数的绝对值越大。表示两个要素间相关程度越密切。相关系数的绝对值越大。表示两个要素间相关程度越密切。当r=+1时,为完全正相关。R=-1时,为完全负相关;r=0则完全无关。.2023-1-2211 相关系数是根据要素之间的样本值计算出来相关系数是根据要素之间的样本值计算出来的,它
6、随着样本数的多少或取样方式的不同而不的,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。通过检验,才能知道它的可信度。(2)相关系数的显著性检验)相关系数的显著性检验 一般情况下,相关系数的检验,是在给定的一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界值表来置信水平下,通过查相关系数检验的临界值表来完成的。完成的。.2023-1-2212检验相关系数检验相关系数=0的临界值(的临界值(ra)表表prra=f f值称为自由度,值称为自由度,其数值为其数值为f=n-2
7、f=n-2,这里这里n n为样本数为样本数a a代表不同的代表不同的显著性水平显著性水平表内的数值表内的数值代表不同的代表不同的置信水平下置信水平下相关系数相关系数=0=0的临界的临界值,值,即即ra公式公式p=p=r rrara=a=a的意的意思是当所计算的相关系数思是当所计算的相关系数r r的的绝对值大于在绝对值大于在a a水平下的临界水平下的临界值值rara时,两要素不相关(即时,两要素不相关(即=0)=0)的可能性只有的可能性只有a a。.2023-1-2213相关系数相关系数r的具体检验方法步骤如下:的具体检验方法步骤如下:(1)计算相关系数)计算相关系数r(2)给定显著水平)给定显
8、著水平,按按n-2查相关系数临界值,查相关系数临界值,查出相应的临界值查出相应的临界值(3)比较)比较r的绝对值与临界值的大小。当的绝对值与临界值的大小。当r的绝的绝对值大于或等于临界值时,说明两变量在对值大于或等于临界值时,说明两变量在水平水平上达到显著性;若小于临界值,则说明两变量没上达到显著性;若小于临界值,则说明两变量没有达到所要求的精度。有达到所要求的精度。如果仍需研究二者的关系如果仍需研究二者的关系,可考虑降低精度,即修改显著性水平,可考虑降低精度,即修改显著性水平、相关系数的显著性检验步骤相关系数的显著性检验步骤.2023-1-22142、等级相关系数的计算公式及检验、等级相关系
9、数的计算公式及检验表示两个变量顺序间直线相关程度和方向表示两个变量顺序间直线相关程度和方向的系数,称为等级(或顺序)相关系数。等级的系数,称为等级(或顺序)相关系数。等级相关系数不仅适用于数量指标的相关分析,同相关系数不仅适用于数量指标的相关分析,同时亦适用于质量指标的相关分析。时亦适用于质量指标的相关分析。等级相关系数,又称顺序相关系数是将两等级相关系数,又称顺序相关系数是将两要素的样本值按数值的大小顺序排列位次,以要素的样本值按数值的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一各要素样本值的位次代替实际数据而求得的一种统计量。实际上,它是位次分析方法的数量种统计量。实际上,
10、它是位次分析方法的数量化。化。.2023-1-2215(1)等级相关系数的计算公式)等级相关系数的计算公式)1(*6121512nndRiid.2023-1-2216(2)等级相关系数的计算及检验)等级相关系数的计算及检验1985年全国各省(市,区年全国各省(市,区)总人口与社会总产值总人口与社会总产值.2023-1-2217.2023-1-2218即:总人口(即:总人口(x)x)与社会总产值(与社会总产值(y)y)的等级相关系的等级相关系数为数为0.7260.726.2023-1-2219等级相关系数检验的临界值等级相关系数检验的临界值.2023-1-2220在上例中,在上例中,n=29n=
11、29,表中没有给出相应的样本数,表中没有给出相应的样本数下的临界值下的临界值rara,但我们发现,在同一显著水平,但我们发现,在同一显著水平下,随着样本数的增大,临界值下,随着样本数的增大,临界值rara减少。在减少。在n=2 8n=2 8 时,查 表 可 知:时,查 表 可 知:r 0.0 5=0.3 1 7r 0.0 5=0.3 1 7,r0.01=0.448r0.01=0.448,由于,由于rxy=0.726rxy=0.726r0.01=0.448r0.01=0.448,故故rxyrxy在在a=0.01a=0.01的置信水平上是显著的。的置信水平上是显著的。等级相关系数检验结果等级相关系
12、数检验结果.2023-1-2221(二)简单非线性相关程度的测度(见课本)(二)简单非线性相关程度的测度(见课本)(三)(三)多要素间相关程度的测定多要素间相关程度的测定1.偏相关系数的计算与检验偏相关系数的计算与检验 在多要素所构成的地理系统中,当我们研究在多要素所构成的地理系统中,当我们研究某一个要素对另一个要素的影响或相关程度时,某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数(保持不变把其它要素的影响视为常数(保持不变),即,即暂不考虑其它要素的影响,而单独研究那两个暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为偏要素之间的相互关系的密
13、切程度时,则称为偏相关。用以度量偏相关程度的统计量,称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。相关系数。.2023-1-2222624C当研究当研究2 2个相关变量个相关变量x1x1、x2x2的关系时的关系时,用直线相关,用直线相关系数系数r12r12表示表示x1x1与与x2x2线性相关的性质与程度。此时固定的线性相关的性质与程度。此时固定的变量个数为变量个数为0 0,所以直线相关系数,所以直线相关系数r12r12又叫做零级偏相关系又叫做零级偏相关系数。数。当研究当研究3 3个相关变量个相关变量x1x1、x2x2、x3x3的相关时的相关时,我们把我们把x3x3保持固定不变,保持固
14、定不变,x1x1与与x2x2的相关系数称为的相关系数称为x1x1与与x2x2的偏相关的偏相关系数,记为系数,记为r12.3r12.3,类似地,还有偏相关系数,类似地,还有偏相关系数r13.2r13.2、r23.1r23.1。这。这3 3个偏相关系数固定的变量个数为个偏相关系数固定的变量个数为1 1,所以都叫,所以都叫做一级偏相关系数。做一级偏相关系数。当研究当研究4 4个相关变量个相关变量x1x1、x2x2、x3x3、x4x4的相关时的相关时,须将其中的须将其中的2 2个变量固定不变,研究另外两个变量间的相个变量固定不变,研究另外两个变量间的相关。即此时只有二级偏相关系数才真实地反映两个相关变
15、关。即此时只有二级偏相关系数才真实地反映两个相关变量间线性相关的性质与程度。二级偏相关系数共有量间线性相关的性质与程度。二级偏相关系数共有6 6个:个:r12.34r12.34,r13.24r13.24,r14.23r14.23,r23.14r23.14,r24.13r24.13,r34.12r34.12。.2023-1-2223624C2/)1(2mmCm一般,当研究一般,当研究m个相关变量个相关变量x1、x2、xm的的相关时,只有将其中的相关时,只有将其中的m-2个变量保持固定不变,个变量保持固定不变,研究另外两个变量的相关才能真实地反映这两个研究另外两个变量的相关才能真实地反映这两个相关
16、变量间的相关,即此时只有相关变量间的相关,即此时只有m-2级偏相关系数级偏相关系数才真实地反映了这两个相关变量间线性相关的性才真实地反映了这两个相关变量间线性相关的性质与程度。质与程度。m-2级偏相关系数共有级偏相关系数共有个。个。xi与与xj的的m-2级偏相关系数记为级偏相关系数记为rij.(i,j=1,2,m,ij)。.2023-1-2224.2023-1-2225式(式(5)(7)表示三个偏表示三个偏相关系数,相关系数,称为一级偏称为一级偏相关系数。相关系数。.2023-1-2226在式(在式(8)8)中,中,r1234r1234表示在表示在x3x3和和x4x4保持不变保持不变的条件,的
17、条件,x1x1和和x2x2的偏相的偏相关系数。关系数。.2023-1-2227.2023-1-2228.2023-1-2229.2023-1-2230偏相关系数具有下述性质:偏相关系数具有下述性质:(1)偏相关系数分布的范围在偏相关系数分布的范围在-1到到1之间,譬如,固定之间,譬如,固定X3,则则X1与与X2间的偏相关系数满足间的偏相关系数满足-1r1231。当。当r123为正为正值时,表示在值时,表示在X3固定时,固定时,X1与与X2之间为正相关;当之间为正相关;当r123为负值时,表示在为负值时,表示在X3固定时,固定时,X1与与X2之间为负相关。之间为负相关。(2)偏相关系数的绝对值越
18、大,表示其偏相关程度越大。偏相关系数的绝对值越大,表示其偏相关程度越大。例如,例如,r123=1,则表示当,则表示当X3固定时,固定时,X1与与X2之间之间完全相关;当完全相关;当r123=0时,表示当时,表示当X3固定时,固定时,X1与与X2之间完全无关。之间完全无关。(3)偏相关系数的绝对值必小于或最多等于由同一系列资偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数,即料所求得的复相关系数,即R123r123。.2023-1-2231偏相关系数的显著性检验偏相关系数的显著性检验偏相关系数的显著性检验,一般采用偏相关系数的显著性检验,一般采用t-检验法。检验法。其统计量计算
19、公式为其统计量计算公式为在(在(15)15)式中,式中,r1234mr1234m为偏相关系数,为偏相关系数,n n为为样本数,样本数,m m为自变量个数。为自变量个数。.2023-1-2232对于前述计算得到的偏相关系数对于前述计算得到的偏相关系数r2413=0.821,由于由于n=23,m=3,故,故查查t分布表,可得出不同显著水平上的临界值分布表,可得出不同显著水平上的临界值ta,若若tt。则表示偏相关显著;反之,。则表示偏相关显著;反之,tta,则偏,则偏相关不显著。在自由度为相关不显著。在自由度为23-3-1=19时,查表得时,查表得t0.001=3.883,所以,所以tta,这表明在
20、置信度水平,这表明在置信度水平a=0.001上,偏相关系数上,偏相关系数r2413是显著的。是显著的。2.复相关系数的计算与检验(看课本)复相关系数的计算与检验(看课本).2023-1-22332.2.复相关系数的计算与检验复相关系数的计算与检验 复相关系数:反映几个要素与某一复相关系数:反映几个要素与某一个要素之间的复相关程度个要素之间的复相关程度 。复相关系数的计算复相关系数的计算 当有两个自变量时当有两个自变量时 当有三个自变量时当有三个自变量时)1)(1(11.221212.yyyrrR)1)(1)(1(112.321.2212123.yyyyrrrR.2023-1-2234当有当有k
21、个自变量时个自变量时)1)1)(1(1)1.(12.21.2212.12.kykyykyrrrR复相关系数的性质复相关系数的性质 复相关系数介于复相关系数介于0到到1之间,即之间,即1012.kyR.2023-1-2235 复相关系数越大,则表明要素(变量)之间复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为的相关程度越密切。复相关系数为1,表示完,表示完全相关;复相关系数为全相关;复相关系数为0,表示完全无关。,表示完全无关。复相关系数必大于或至少等于单相关系数的复相关系数必大于或至少等于单相关系数的绝对值。绝对值。复相关系数的显著性检验复相关系数的显著性检验 F检验法。
22、其统计量计算公式为检验法。其统计量计算公式为kknRRFkyky11212.212.2023-1-2236例题:在上例中,若以例题:在上例中,若以x4 4为因变量,为因变量,x1 1,x2 2,x3 3为自变量,试计算为自变量,试计算x4 4与与x1 1,x2 2,x3 3之间的复相之间的复相关系数。关系数。解:按照公式(解:按照公式(3.1.16)计算)计算 检验:检验:,故复相关达到,故复相关达到了极显著水平。了极显著水平。974.0337.01)(956.01)(579.01(1)1)(1)(1(1222212.4321.42241123.4)rrrR3010.57190.12001.0
23、FF.2023-1-2237一一 回归分析的意义及其作用回归分析的意义及其作用二二 一元回归模型的建立一元回归模型的建立三三 多元回归模型多元回归模型四四 非线性回归模型非线性回归模型第二节第二节 地理要素间的地理要素间的相关分析相关分析.2023-1-2238一一 回归分析的意义及其作用回归分析的意义及其作用(一)回归分析的概念(一)回归分析的概念 就是对具有相互联系的要素,根据其就是对具有相互联系的要素,根据其联系的形态,选择一个合适的数学模式,联系的形态,选择一个合适的数学模式,用来近似地表达要素间平均变化关系。用来近似地表达要素间平均变化关系。这个数学模式称为回归模型(回归方程)这个数
24、学模式称为回归模型(回归方程).2023-1-2239 相关关系的变量之间尽管没有确定性的关系,但在大量数据相关关系的变量之间尽管没有确定性的关系,但在大量数据条件下,条件下,从一定的统计意义上来看,它们之间可能存在某种类型从一定的统计意义上来看,它们之间可能存在某种类型的函数关系,因此可以借助函数关系的数学表达式来表达。的函数关系,因此可以借助函数关系的数学表达式来表达。变量之间的函数关系,从理论上说是完全精确的函数关系。变量之间的函数关系,从理论上说是完全精确的函数关系。回归分析和相关分析都是研究和处理变量之间具有相关关系的回归分析和相关分析都是研究和处理变量之间具有相关关系的一种数理统计
25、方法。它们之间既有联系,又有区别。一种数理统计方法。它们之间既有联系,又有区别。(1)研究对象和内容是相同的,相关分析主要研究变量之间的密)研究对象和内容是相同的,相关分析主要研究变量之间的密切程度,并没有严格的自变量和因变量之分。切程度,并没有严格的自变量和因变量之分。(2)而回归分析则主要研究变量之间联系的数学表达式,因而有)而回归分析则主要研究变量之间联系的数学表达式,因而有自变量和因变量之分,从而就可以由自变量的取值来预测,因而回自变量和因变量之分,从而就可以由自变量的取值来预测,因而回归分析具有预测的功能。归分析具有预测的功能。应当注意:应当注意:.2023-1-2240(二)回归分
展开阅读全文