第十一章相关分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十一章相关分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十一 相关 分析 课件
- 资源描述:
-
1、 两个变量之间不精确、不稳定的变化两个变量之间不精确、不稳定的变化关系,称为相关关系。关系,称为相关关系。两个变量之间的变化关系,既表现在两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上。变化方向上,又表现在密切程度上。两个变量之间的变化方向有:正相关:两个变量的变化方向相同。正相关:两个变量的变化方向相同。负相关:两个变量的变化方向相反。负相关:两个变量的变化方向相反。零相关:两个变量的变化方向无一定规律。零相关:两个变量的变化方向无一定规律。从关系密切程度来看,两个变量的变化程度可大致分为完全相关:两个变量的变化程度完全一致。完全相关:两个变量的变化程度完全一致。强相关:两个
2、变量变化的一致性比较强。强相关:两个变量变化的一致性比较强。中等相关:两个变量变化的一致程度中等。中等相关:两个变量变化的一致程度中等。弱相关:两个变量变化的一致性比较差。弱相关:两个变量变化的一致性比较差。完全不相关:两个变量变化程度没有一致性。完全不相关:两个变量变化程度没有一致性。用来描述两个变量相互之间变化方向及密用来描述两个变量相互之间变化方向及密切程度的统计指标称为相关系数,一般样本的切程度的统计指标称为相关系数,一般样本的相关系数用相关系数用r r表示,总体的相关系数用表示,总体的相关系数用表示。表示。相关系数的取值:相关系数的取值: -1 r +1-1 r +10r10r1相关
3、系数的符号:相关系数的符号:“”表示正相关,表示正相关,“”表示负相关。表示负相关。相关系数不是由相相关系数不是由相等单位度量而来的,因等单位度量而来的,因此只能比较大小,不能此只能比较大小,不能做任何加、减、乘、除做任何加、减、乘、除运算。运算。1、积差相关及其适用条件积差相关是英国统计学家皮尔逊(积差相关是英国统计学家皮尔逊(pearson)于于2020世纪初提出的一种计算相关的方法,因而世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关被称为皮尔逊积差相关, ,也称为积矩相关也称为积矩相关(product moment correlation)。)。积差相关适用于:两个变量都是积差
4、相关适用于:两个变量都是;两变量总体都为;两变量总体都为;两;两变量之间为变量之间为。成对数据,样本容量要大。成对数据,样本容量要大。根据得到数据的方式判断,测量数据。根据得到数据的方式判断,测量数据。一般情况下,正常人群的身高、体重、智力水平、心理一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比与教育测验的结果,都可按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。较高,则需要对数据进行正态性检验。根据相关散布图可判断两个变量之间是否线性关系。根据相关散布图可判断两个变量之间是否线性关系。图图18-1 18-1 正相关正相关图
5、图18-2 18-2 负相关负相关散点的分布形状为椭圆形,可认为两变散点的分布形状为椭圆形,可认为两变量之间具有线性关系量之间具有线性关系。图图18-4 18-4 完全负相关完全负相关图图18-3 18-3 完全正相关完全正相关当所有的点都分布在一条直线上时,两变量之间的关系为完全相关。两个变量之间是否相关,要有充分的理论依据,并排除共变因素的影响。图图18-5 18-5 零相关零相关散点的分布没有明显集中在某一方向的趋势,形成圆形区域时,两变量之间的关系为零相关。协方差协方差nYYXXCOV积差相关系数为积差相关系数为( 181 )nSYYSXXrYX公式中:公式中: 为变量为变量X的平均数
6、,的平均数, 为变量为变量Y的平均数,的平均数, 为变量为变量X的标准差,的标准差, 为变量为变量Y的标准差,的标准差, n 为数据的对数为数据的对数XYXSYSYXSSnYYXXr或计算得到了相关系数,计算得到了相关系数,还不能确定这两个变量一还不能确定这两个变量一定具有相关关系,需要对定具有相关关系,需要对相关系数进行显著性检验相关系数进行显著性检验之后,才能做出判断。之后,才能做出判断。表18-1 10个学生初一与初二数学成绩积差相关系数计算表序号序号X XY Y1 174747676 3 3 3.7 3.711.111.1 9 9 13.69 13.692 271717575 0 0
7、2.7 2.70 0 0 0 7.29 7.293 372727171 1 1 -1.3 -1.3-1.3-1.3 1 1 1.69 1.694 468687070-3-3 -2.3 -2.3 6.9 6.9 9 9 5.29 5.295 576767676 5 5 3.7 3.718.518.52525 13.69 13.696 673737979 2 2 6.7 6.713.413.4 4 4 44.89 44.897 767676565-4-4 -7.3 -7.329.229.21616 53.29 53.298 870707777-1-1 4.7 4.7-4.7-4.7 1 1 22.
8、09 22.099 954546262-6-6-10.3-10.361.861.83636106.09106.09101074747272 3 3 -0.3 -0.3-0.9-0.9 9 9 0.09 0.09合计合计710710723723134134110110268.10268.10YYXX2YY 2XX XX YY 先计算变量先计算变量 X X 和和 Y Y 的标准差的标准差: :317. 31011022nXXSX178. 51026822nYYSY780. 0178. 5317. 310134YXSSnYYXXr再将数据代入公式计算积差相关系数再将数据代入公式计算积差相关系数: :
9、( 182a )nYYnXXnYXXYr2222/2222YYnXXnYXXYnr( 182b )表18-2 10个学生初一与初二数学成绩积差相关系数计算表序号序号X XY YXYXY1 1747476765476547657765776562456242 2717175758041804156265626532553253 3727271715184518450415041511251124 4686870704624462449004900476047605 5767676765776577657765776577657766 6737379795329532962416241576757
10、677 7676765654489448942254225435543558 8707077774900490059295929539053909 954546262422542253844384440304030101074747272547654765184518453285328合计合计7107107237235052050520525415254151467514672X2Y代入公式计算代入公式计算: :两种公式计算结果相同,两种公式计算结果相同,但以原始数据的计算公式更但以原始数据的计算公式更为简捷和准确。为简捷和准确。1072352541107105052010/723710514
11、6722780. 0nYYnXXnYXXYr2222/等级相关(等级相关(rank correlation)是指以等级)是指以等级次序排列或以等级次序表示的变量之间的相关。次序排列或以等级次序表示的变量之间的相关。主要包括斯皮尔曼(主要包括斯皮尔曼(spearman)二列等级)二列等级相关和肯德尔和谐系数(相关和肯德尔和谐系数(the kandall coefficient of concordance)多列等级相关。)多列等级相关。 、斯皮尔曼等级相关的概念及适用条件斯皮尔曼等级相关是等级相关的一种。它斯皮尔曼等级相关是等级相关的一种。它适用于两个以等级次序表示的变量,并不要求适用于两个以等
12、级次序表示的变量,并不要求两个变量总体呈正态分布,也不要求样本的容两个变量总体呈正态分布,也不要求样本的容量必须大于量必须大于3030。当连续数据不能满足计算积差相关的条件当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等时,可以转换成等级数据从而计算斯皮尔曼等级相关系数。级相关系数。2、斯皮尔曼等级相关系数的计算斯皮尔曼等级相关系数表示为斯皮尔曼等级相关系数表示为r rR R,其计算公式为:,其计算公式为:) 1(61161222nnDnnRRrYiXiR( 183 )公式中:公式中:R RX X为变量为变量X X的等级数,的等级数, R RY Y为变量为变量Y Y
13、的等级数,的等级数, D D为两变量的等级数之差,即为两变量的等级数之差,即D=RD=RX X-R-RY Y n n为样本的容量为样本的容量表表18-18- 1010个高三学生学习潜在能力测验个高三学生学习潜在能力测验(X)(X)与自学能力测验与自学能力测验(Y)(Y)成绩成绩斯皮尔曼等级相关系数计算表斯皮尔曼等级相关系数计算表序号序号X XY YX XY Y=R=RX X-R-RY Y1 190902 21 12 2-1-11 12 284841 12 21 11 11 13 376764 43 34 4-1-11 14 475755 54 45 5-1-11 15 573736 65 56
14、 6-1-11 16 671717 76 67 7-1-11 17 769698 87 78 8-1-11 18 868683 38 86 62 24 49 9666610109 91010-1-11 1101064649 910109 91 11 1合计合计13132D9212.01100101361)1(6122nnDrR如果有相同等级时如果有相同等级时, ,可用它们所占可用它们所占等级位置的平均数作为它们的等级。等级位置的平均数作为它们的等级。表表18-4 1018-4 10个学生初一与初二数学成绩斯皮尔曼等级相关系数计算表个学生初一与初二数学成绩斯皮尔曼等级相关系数计算表序号序号X X
15、Y YR RX XR RY YD=RD=RX X-R-RY Y1 1747476762.52.53.53.5-1.0-1.01 12 2717175756 65 51 11 13 3727271715 57 7-2-24 44 4686870708 88 80 00 05 5767676761 13.53.5-2.5-2.56.256.256 6737379794 41 13 39 97 7676765659 99 90 00 08 8707077777 72 25 525259 954546262101010100 00 01010747472722.52.56 6-3.5-3.512.25
16、12.25合计合计71071072372358.558.52D思考思考: :同一组数据的积差相关系数和同一组数据的积差相关系数和等级相关系数为什么会有差别?哪一个等级相关系数为什么会有差别?哪一个更准确?更准确?645. 01100105 .5861) 1(6122nnDrR肯德尔等级相关方法有许多种,肯德肯德尔等级相关方法有许多种,肯德尔和谐系数是其中一种。尔和谐系数是其中一种。肯德尔和谐系数常以肯德尔和谐系数常以r r表示,适用于表示,适用于多列等级变量的资料。多列等级变量的资料。肯德尔和谐系数可以反映多个等级变肯德尔和谐系数可以反映多个等级变量变化的一致性。量变化的一致性。公式中:公式中
17、:表示肯德尔和谐系数表示肯德尔和谐系数 K K表示等级评定者的数目,即变量数表示等级评定者的数目,即变量数 n n为被等级评定的对象的数目为被等级评定的对象的数目 R R为被评定对象获得的为被评定对象获得的K K个等级之和个等级之和 SS SSR R为为R R的离差平方和,即的离差平方和,即nnKSSrRW32121( 184 )nRRSSiiR22n=n=7 7评价者评价者 K=10K=10Ri1 12 23 34 45 56 67 78 89 91010红红3 35 52 23 34 44 43 32 24 43 3333310891089橙橙6 66 67 76 67 75 57 77
18、76 66 6636339693969黄黄5 54 45 57 76 66 64 44 45 54 4505025002500绿绿1 11 11 12 22 22 22 21 11 12 21515225225青青4 43 34 44 43 33 35 56 63 35 5404016001600蓝蓝2 22 23 31 11 11 11 13 32 21 11717289289紫紫7 77 76 65 55 57 76 65 57 77 76262384438442802801351613516例表表18-5 18-5 肯德尔和谐系数计算表肯德尔和谐系数计算表 2iR学生学生n=6n=6评价
展开阅读全文