相关分析和回归分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《相关分析和回归分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 分析 回归 课件
- 资源描述:
-
1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第四章 相关分析与回归分析n4.1 简单相关分析简单相关分析n4.2 回归分析回归分析n4.3 非线性回归非线性回归STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n4.1 4.1 简单相关分析简单相关分析n4.1.1 相关分析的基本概念相关分析的基本概念n4.1.2 用用INSIGHT模块作相关分析模块作相关分析n4.1.3 用用“分析家分析家”作相关分析作相关分析STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.1.1 相关分析的基本概念相关分析
2、的基本概念1.1.散点图散点图 散点图是描述变量之间关系的一种直观方法。我们用散点图是描述变量之间关系的一种直观方法。我们用坐标的横轴代表自变量坐标的横轴代表自变量X,纵轴代表因变量,纵轴代表因变量Y,每组数,每组数据据(xi,yi)在坐标系中用一个点表示,由这些点形成的散在坐标系中用一个点表示,由这些点形成的散点图描述了两个变量之间的大致关系,从中可以直观地点图描述了两个变量之间的大致关系,从中可以直观地看出变量之间的关系形态及关系强度。看出变量之间的关系形态及关系强度。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程图图4-1就是不同形态的散点图。就是不同形
3、态的散点图。(a)(b)(c)(d)就两个变量而言,如果变量之间的关系近似地表现为就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图一条直线,则称为线性相关,如图4-1(a)和和(b);如果变;如果变量之间的关系近似地表现为一条曲线,则称为非线性相量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关;如图关或曲线相关;如图4-1(c);如果两个变量的观测点很;如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如分散,无任何规律,则表示变量之间没有相关关系,如图图4-l(d)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与
4、统计应用教程2.2.相关系数相关系数 相关系数是对变量之间关系密切程度的度量。若相关相关系数是对变量之间关系密切程度的度量。若相关系数是根据总体全部数据计算的,称为总体相关系数,系数是根据总体全部数据计算的,称为总体相关系数,记为记为;总体相关系数的计算公式为:;总体相关系数的计算公式为:其中其中COV(X,Y)为变量为变量X和和Y的协方差,的协方差,D(X)和和D(Y)分分别为别为X和和Y的方差。的方差。)()(),(YDXDYXCOVSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 若相关系数是根据样本数据计算的,则称为样本相关若相关系数是根据样本数据计算的
5、,则称为样本相关系数(简称为相关系数),记为系数(简称为相关系数),记为r。样本相关系数的计。样本相关系数的计算公式为:算公式为:一般情况下,总体相关系数一般情况下,总体相关系数是未知的,我们通常是是未知的,我们通常是将样本相关系数将样本相关系数r作为作为的近似估计值。的近似估计值。niiniiniiiyyxxyyxxr12121)()()(STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 相关系数相关系数r有如下性质:有如下性质:相关系数的取值范围:相关系数的取值范围:1 r 1,若,若0 r 1,表,表明明X与与Y之间存在正线性相关关系,若之间存在正线性相关
6、关系,若1 r 0,表明,表明X与与Y之间存在负线性相关关系。之间存在负线性相关关系。若若r=1,表明,表明X与与Y之间为完全正线性相关关系;之间为完全正线性相关关系;若若r=1,表明,表明X与与Y之间为完全负线性相关关系;若之间为完全负线性相关关系;若r=0,说明二者之间不存在线性相关关系。,说明二者之间不存在线性相关关系。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 相关系数相关系数r有如下性质:有如下性质:当当1 r 1时,为说明两个变量之间的线性关系时,为说明两个变量之间的线性关系的密切程度,通常将相关程度分为以下几种情况:当的密切程度,通常将相关程
7、度分为以下几种情况:当|r|0.8时,可视为高度相关;时,可视为高度相关;0.5|r|0.8时,可视为时,可视为中度相关;中度相关;0.3|r|0.5时,视为低度相关;当时,视为低度相关;当|r|0.3时,说明两个变量之间的相关程度极弱,可视为不时,说明两个变量之间的相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数进行显著性检相关。但这种解释必须建立在对相关系数进行显著性检验的基础之上。验的基础之上。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.相关系数的显著性检验相关系数的显著性检验 相关系数的显著性检验也就是检验总体相关系数是否相关系数的
8、显著性检验也就是检验总体相关系数是否显著为显著为0,通常采用费歇尔(,通常采用费歇尔(Fisher)提出的)提出的t分布检验,分布检验,该检验可以用于小样本,也可以用于大样本。检验的具该检验可以用于小样本,也可以用于大样本。检验的具体步骤如下:体步骤如下:1)提出假设:假设样本是从一个不相关的总体中抽出提出假设:假设样本是从一个不相关的总体中抽出的,即的,即H0:=0;H1:0STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 1)提出假设:假设样本是从一个不相关的总体中抽出提出假设:假设样本是从一个不相关的总体中抽出的,即的,即H0:=0;H1:0 2)由样本观
9、测值计算检验统计量:由样本观测值计算检验统计量:的观测值的观测值t0和衡量观测结果极端性的和衡量观测结果极端性的p值:值:p=P|t|t0|=2Pt|t0|3)进行决策:比较进行决策:比较p和检验水平和检验水平 作判断:作判断:p ,拒,拒绝原假设绝原假设H0;p ,不能拒绝原假设,不能拒绝原假设H0。)2(12|2ntrnrtSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.置信椭圆置信椭圆 可以生成两类置信椭圆:可以生成两类置信椭圆:均值置信椭圆:预测两变量均值的置信区域;均值置信椭圆:预测两变量均值的置信区域;预测值置信椭圆:预测两变量分布个别观测值
10、的预测值置信椭圆:预测两变量分布个别观测值的置信区域。置信区域。关于预测值置信椭圆的两点说明:关于预测值置信椭圆的两点说明:1)作为置信曲线,表示数据以设定的百分率(置信水作为置信曲线,表示数据以设定的百分率(置信水平)落入的椭圆区域;平)落入的椭圆区域;2)作为相关性指标。若两个变量不相关,椭圆应该为作为相关性指标。若两个变量不相关,椭圆应该为圆;两个相关的变量有拉长的椭圆,可以用椭圆长短轴圆;两个相关的变量有拉长的椭圆,可以用椭圆长短轴之比来衡量相关的程度。之比来衡量相关的程度。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.1.2 用用INSIGHT模
11、块作相关分析模块作相关分析【例【例4-1】一家大型商业银行在多个地区设有分行,其】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的为弄清楚不良贷款形成的原因,因,希望利用银行业务的为弄清楚不良贷款形成的原
12、因,希望利用银行业务的有关数据做些定量分析,以便找出希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。表控制不良贷款的办法。表4-1就是该银行所属的就是该银行所属的25家分家分行行2002年的有关业务数据。年的有关业务数据。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表4-1 某商业银行2002年的主要业务数据银行想知道,不良贷款是否与贷款余额、应收贷款、贷银行想知道,不良贷款是否与贷款余额、应收贷款、贷款项目的多少、固定资产投资等因素有关款项目的多少、固定资产投资等因素有关?如果有,是如果有,是一种什么样的关系一种什么样的关系?关系强度如
13、何关系强度如何?分行编号不良贷款(亿元)x1各项贷款余额(亿元)x2本年累计应收贷款(亿元)x3贷款项目个数(个)x4本年固定资产投资额(亿元)x510.967.36.8551.921.1111.319.81690.934.8173.07.71773.743.280.87.21014.557.8199.716.51963.2206.8139.47.22864.32111.6368.216.832163.9221.695.73.81044.5231.2109.610.31467.9247.2196.215.81639.7253.2102.212.01097.1STATSTATSTATSTATSA
14、SSAS软件与统计应用教程软件与统计应用教程 设表设表4-1中数据已经存放在数据集中数据已经存放在数据集Mylib.bldk中。中。1.1.制作散点图制作散点图 首先制作变量之间的散点图,以便判断变量之间的相首先制作变量之间的散点图,以便判断变量之间的相关性。步骤如下:关性。步骤如下:1)在在INSIGHT模块中,打开数据集模块中,打开数据集Mylib.bldk;2)选择菜单选择菜单“Analyze(分析)(分析)”“Scatter Plot(Y X)(散点图)(散点图)”;3)在打开的在打开的“Scatter Plot(Y X)”对话框中选定对话框中选定Y变量:变量:Y;选定;选定X变量:变
15、量:x1、x2、x3、x4;4)单击单击“OK”按钮,得到变量的分析结果。按钮,得到变量的分析结果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 从各散点图中可以看从各散点图中可以看出,不良贷款出,不良贷款(Y)与贷款与贷款余额余额(x1)、应收贷款、应收贷款(x2)、贷款项目多少贷款项目多少(x3)、固定、固定资产投资额资产投资额(x4)之间都具之间都具有一定的线性关系。但有一定的线性关系。但从各散点的分布情况看,从各散点的分布情况看,与贷款余额与贷款余额(x1)的线性关的线性关系比较密切,而与固定系比较密切,而与固定资产投资额资产投资额(x4)之间的关之
16、间的关系最不密切。系最不密切。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.相关系数计算相关系数计算 1)在在INSIGHT模块中,打开数据集模块中,打开数据集Mylib.bldk;2)选择菜单选择菜单“Analyze(分析)(分析)”“Multivariate(Y X)(多变量)(多变量)”;3)在打开的在打开的“Multivariate(Y X)”对话框中选定对话框中选定Y变变量:量:Y;选定;选定X变量:变量:x1、x2、x3、x4;4)单击单击“OK”按钮,得到分析结果。按钮,得到分析结果。STATSTATSTATSTATSASSAS软件与统计
17、应用教程软件与统计应用教程结果显示各变量的统计量和相关(系数)矩阵,从相关结果显示各变量的统计量和相关(系数)矩阵,从相关矩阵中可以看出,在不良贷款矩阵中可以看出,在不良贷款Y与其他几个变量的关系与其他几个变量的关系中,与贷款余额中,与贷款余额(x1)的相关系数最大,而与固定资产投的相关系数最大,而与固定资产投资额资额(x4)的相关系数最小。的相关系数最小。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 5)为了检验各总体变量的相关系数是否为零,选择菜为了检验各总体变量的相关系数是否为零,选择菜单:单:“Tables”“CORR p-values”,得到相关系
18、数为零,得到相关系数为零的原假设的的原假设的p值,如图值,如图4-6所示。所示。基于这些基于这些p值,拒绝原假设,即不良贷款与其他几个值,拒绝原假设,即不良贷款与其他几个变量之间均存在着显著的正相关关系。变量之间均存在着显著的正相关关系。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.置信椭圆置信椭圆 继续上述步骤。继续上述步骤。6)选择菜单:选择菜单:“Curves”“Scatter Plot Cont Ellipse”“Prediction:95”,得到不良贷款与其他,得到不良贷款与其他几个变量的散点图及预测值的置信椭圆,如图所示。几个变量的散点图及
19、预测值的置信椭圆,如图所示。变量变量Y和和x1间散点图上的这个椭圆被拉得很长,表明变间散点图上的这个椭圆被拉得很长,表明变量量Y和和x1之间有很强的相关性。之间有很强的相关性。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.1.3 用用“分析家分析家”作相关分析作相关分析【例【例4-2】通常用来评价商业中心经营好坏的一个综合】通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内指标是单位面积的营业额,它是单位时间内(通常为一通常为一年年)的营业额与经营面积的比值。对单位面积营业额的的营业额与经营面积的比值。对单位面积营业额的影响因素的
20、指标有单位小时车流量、日人流量、居民年影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。这几个指标中车流量和人流量是通程度的满意度评分。这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。而居民过同时对几个商业中心进行实地观测而得到的。而居民年平均消费额、消费者对商场的环境、设施及商品的丰年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平均富程度的满意度评分是通过随机采访顾客而得到的平均值数据。表值数据。表4-2为从某市
21、随机抽取的为从某市随机抽取的20个商业中心有关个商业中心有关指标的数据,试据此说明变量间的相关程度。指标的数据,试据此说明变量间的相关程度。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表4-2 20个商业中心有关指标的数据设表设表4-2数据已保存在数据集数据已保存在数据集Mylib.jyzk中。中。商业中心编号单位面积年营业额(万元/平方米)Y每小时机动车流量(万辆)x1日人流量 (万人)x2居民年消费额(万元)x3对商场环境满意度x4对商场设施满意度x5对商场商品丰富程度满意度x612.50.513.901.9479623.20.264.242.86746
22、32.50.724.541.6388743.41.236.981.926101051.80.694.210.7184760.90.362.910.62565152.61.045.531.301079162.71.185.981.28879171.40.611.271.48671183.21.055.772.167109192.91.065.711.74699202.50.584.111.85796STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.1.相关分析的设置相关分析的设置 在在“分析家分析家”中作相关分析的步骤如下:中作相关分析的步骤如下:1)在在“分析
23、家分析家”中打开数据集中打开数据集Mylib.jyzk;2)选择主菜单选择主菜单“Statistics”“Descriptive(描述性统(描述性统计)计)”“Correlations(相关)(相关)”,打开,打开“Correlations”对话框,按图对话框,按图4-8 设置分析变量及内容。设置分析变量及内容。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.结果分析结果分析 显示结果首先给出各个变量的描述性统计量,包括观显示结果首先给出各个变量的描述性统计量,包括观测总数、各变量的均值及标准差等。然后给出变量的相测总数、各变量的均值及标准差等。然后给出
24、变量的相关系数矩阵(分析变量中任两者之间的相关系数),以关系数矩阵(分析变量中任两者之间的相关系数),以及原假设为及原假设为H0:Rho=0(即(即H0:=0)的检验结果)的检验结果(仅给出(仅给出p值),如图值),如图4-9所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 从相关系数的取值来看,单位面积营业额(从相关系数的取值来看,单位面积营业额(Y)与居)与居民年消费额(民年消费额(x3)、日人流量()、日人流量(x2)接近高度相关;单)接近高度相关;单位面积营业额(位面积营业额(Y)与每小时机动车流量()与每小时机动车流量(x1)、对商)、对商
25、场环境的满意度(场环境的满意度(x4)、对商场设施的满意度()、对商场设施的满意度(x5)为)为低度相关;单位面积营业额(低度相关;单位面积营业额(Y)与商场商品丰富程度)与商场商品丰富程度满意度(满意度(x6)则属于中度相关。)则属于中度相关。从相关系数的假设检验结果来看,单位面积营业额从相关系数的假设检验结果来看,单位面积营业额(Y)与居民年消费额与居民年消费额(x3)、日人流量、日人流量(x2)、商场商品的丰富程、商场商品的丰富程度满意度度满意度(x6)、对商场设施的满意度、对商场设施的满意度(x5)的相关系数显著的相关系数显著不为不为0(p 10即可认为模型有很强的共线问即可认为模型有
展开阅读全文