最新SPSS第8章-回归分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《最新SPSS第8章-回归分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 SPSS 回归 分析 课件
- 资源描述:
-
1、2在教育研究中,常常会遇到彼此有关系的两列或多列变量。在教育研究中,常常会遇到彼此有关系的两列或多列变量。根据不同的目的,可以从不同的角度去分析变量之间的关系。根据不同的目的,可以从不同的角度去分析变量之间的关系。上一章介绍的相关分析,旨在分析变量之间关系的强度,可上一章介绍的相关分析,旨在分析变量之间关系的强度,可以找到一个度量这种关系强度的指标以找到一个度量这种关系强度的指标相关系数。相关系数。98.1.2 回归方程回归方程回归分析的数学模型是:回归分析的数学模型是:123(,)kyf x x xx基本假设:基本假设:因变量因变量 y 受到我们已知的的受到我们已知的的 k 个自变个自变量量
2、 x1,x2,x3,xk 的影响,同时还受到一些的影响,同时还受到一些未知因素或随机因素的影响。未知因素或随机因素的影响。10每一组实际观察值每一组实际观察值yi,x1i,x2i,x3i,xki123(,)iiiikiiyf x xxx 服从均数为零的正态分布服从均数为零的正态分布因变量因变量 y 也服从正态分布,其平均数记为:也服从正态分布,其平均数记为:y123(,)kyf x x xx上式称为回归方程,确定回归线的方程即为回归方程。上式称为回归方程,确定回归线的方程即为回归方程。回归分析的主要任务就是要求出这个回归方程右边的函回归分析的主要任务就是要求出这个回归方程右边的函数表达式,也就
3、是求回归方程。数表达式,也就是求回归方程。11在回归分析中,根据所求回归方程函数类型的不同,可在回归分析中,根据所求回归方程函数类型的不同,可分为线性回归分析和非线性回归分析两个大类;又可根分为线性回归分析和非线性回归分析两个大类;又可根据内含自变量个数为一个还是多个而分为一元回归分析据内含自变量个数为一个还是多个而分为一元回归分析和多元回归分析两大类。和多元回归分析两大类。128.1.3 一元线性回归方程一元线性回归方程一元线性回归方程的通式为:一元线性回归方程的通式为:bxay式中式中a回归线在回归线在Y轴上的截距;轴上的截距;b是回归线的斜率,称回是回归线的斜率,称回归系数。归系数。一旦
4、一旦b和和a这两个关键的统计量的值,根据实测数值计算这两个关键的统计量的值,根据实测数值计算出来之后,这个方程就确定了。出来之后,这个方程就确定了。13回归方程的求法:回归方程的求法:最小二乘法,就是应该使误差的平方和最小。最小二乘法,就是应该使误差的平方和最小。当我们做出散点图后,发现无论哪条直线也不可能使所有的当我们做出散点图后,发现无论哪条直线也不可能使所有的散点都在其上。那么哪条直线最有代表性呢,根据最小二乘散点都在其上。那么哪条直线最有代表性呢,根据最小二乘法,如果每一点沿法,如果每一点沿Y轴方向到直线的距离的平方和最小,则轴方向到直线的距离的平方和最小,则这条直线在所有的直线中代表
5、性是最好的,它的表达式就是这条直线在所有的直线中代表性是最好的,它的表达式就是所要求的回归方程。所要求的回归方程。142211()nniiiiiQyy根据上面所说的最小二乘法,其公式为:根据上面所说的最小二乘法,其公式为:把把bxay代入上式,得:代入上式,得:21()niiiQya bx 15求回归方程就是求当上式达到最小时求回归方程就是求当上式达到最小时a与与b的值,而要使的值,而要使上式最小,需分别对上式最小,需分别对a与与b求偏导数,并令其等于零。求偏导数,并令其等于零。由于这部分涉及到高数里的内容,我们不过多介绍,只由于这部分涉及到高数里的内容,我们不过多介绍,只需明白原理就行了。最
6、后求得需明白原理就行了。最后求得b和和a的公式分别是:的公式分别是:2()()()XX YYbXXaYbX16bxay求出求出a和和b之后,可以列出回归方程式:之后,可以列出回归方程式:178.1.4 一元线性回归方程的检验一元线性回归方程的检验根据样本数据计算出的回归方程可能有一定的抽样误差。根据样本数据计算出的回归方程可能有一定的抽样误差。为了考查这两个变量在总体上是否存在线性关系,以及回为了考查这两个变量在总体上是否存在线性关系,以及回归方程对估计预测因变量的有效性如何,在回归方程应用归方程对估计预测因变量的有效性如何,在回归方程应用之前,首先应进行显著性检验。之前,首先应进行显著性检验
7、。18一元线性回归方程的显著性,有以下三种等效的检验方法:一元线性回归方程的显著性,有以下三种等效的检验方法:(1)对回归方程进行方差分析。)对回归方程进行方差分析。(2)对两个变量的相关系数进行与总体零相关的显著性检)对两个变量的相关系数进行与总体零相关的显著性检验。若相关系数显著,则回归方程也显著,即表明两个变量验。若相关系数显著,则回归方程也显著,即表明两个变量存在线性关系,否则则反之。存在线性关系,否则则反之。(3)对回归系数进行显著性检验。)对回归系数进行显著性检验。19以回归系数的显著性为例来说明回归方程检验的意义。以回归系数的显著性为例来说明回归方程检验的意义。回归系数是根据样本
8、数据计算出来的,即使从总体回归系数回归系数是根据样本数据计算出来的,即使从总体回归系数=0的总体中随机抽出的样本,由于抽样误差的影响,计算的总体中随机抽出的样本,由于抽样误差的影响,计算出的回归系数出的回归系数b也可能不等于零。因此不能根据样本回归系也可能不等于零。因此不能根据样本回归系数数b的大小判断的大小判断X与与Y之间是否存在线性关系,而应当看样本之间是否存在线性关系,而应当看样本的的b在以在以=0为中心的抽样分布上出现的概率如何。为中心的抽样分布上出现的概率如何。20如果样本的如果样本的b在其抽样分布上出现的概率较大,则在其抽样分布上出现的概率较大,则b与与=0的的总体无显著性差异,即
9、样本的总体无显著性差异,即样本的b是来自于是来自于=0的总体,这时,的总体,这时,即使即使b数值再大,也不能认为数值再大,也不能认为X与与Y存在线性关系;存在线性关系;反之,如果样本反之,如果样本b在其抽样分布上出现的概率小到一定程度,在其抽样分布上出现的概率小到一定程度,则则b与与=0有显著性差异,即样本的有显著性差异,即样本的b不是来自于不是来自于=0的总体,的总体,这时,即使这时,即使b再小,也只有承认再小,也只有承认X与与Y存在线性关系。存在线性关系。218.1.5 回归方程有效性高低的指标回归方程有效性高低的指标决定系数决定系数回归方程经检验有显著性,这只表明从总体上说回归方程经检验
10、有显著性,这只表明从总体上说X和和Y两个两个变量之间存在线性关系。但是回归方程估计、预测的效果如变量之间存在线性关系。但是回归方程估计、预测的效果如何,即何,即X与与Y线性关系的程度如何,还需进一步加以考查。线性关系的程度如何,还需进一步加以考查。因变量因变量Y的总平方和等于回归平方和与误差平方和之和。的总平方和等于回归平方和与误差平方和之和。222()()()Y YY YY Y 总平方和总平方和 回归平方和回归平方和 误差平方和误差平方和22222222()()()()()()YYYYYYYYYYYY2222()()1()()YYYYYYYY上式进行变换得:上式进行变换得:23从上式可见,若
11、回归平方和在总平方和中所占比率越大,而从上式可见,若回归平方和在总平方和中所占比率越大,而误差平方和所占比率越小,则预测效果越好;若回归平方和误差平方和所占比率越小,则预测效果越好;若回归平方和在总平方和中所占比率小,而误差平方和所占比率大,则预在总平方和中所占比率小,而误差平方和所占比率大,则预测效果越差。测效果越差。当总平方和全由回归平方和所造成,表明预测极好,没有误当总平方和全由回归平方和所造成,表明预测极好,没有误差。当回归平方和为零,表明预测无效果。差。当回归平方和为零,表明预测无效果。24通过对通过对X和和Y变量的相关系数变量的相关系数r的公式变换,可得:的公式变换,可得:222(
12、)()YYrYY也就是说也就是说X和和Y两个变量的相关系数的平方等于回归平方两个变量的相关系数的平方等于回归平方和在总平方和中所占比率。和在总平方和中所占比率。如果如果r2=0.64,表明变量,表明变量Y的变异中有的变异中有64%是由变量是由变量X的变的变异引起的,或者说有异引起的,或者说有64%可以上可以上X的变异推测出来,所以的变异推测出来,所以r2叫做测定系数。叫做测定系数。258.2 一元线性回归分析的一元线性回归分析的SPSS操作操作一元线性回归分析只涉及一个自变量的回归问题。设有两一元线性回归分析只涉及一个自变量的回归问题。设有两个变量个变量X和和Y,变量,变量Y的取值随变量的取值
13、随变量X的取值的变化而变化,的取值的变化而变化,则称则称Y为因变量,为因变量,X为自变量。为自变量。一元线性回归假设因变量和自变量之间为线性关系,用一一元线性回归假设因变量和自变量之间为线性关系,用一定的线性回归模型来拟合因变量和自变量的数据,并通过定的线性回归模型来拟合因变量和自变量的数据,并通过确定模型参数来得到回归方程。确定模型参数来得到回归方程。26例题:例题:现有现有107个国家的城巿化率和识字率的数据,变量个国家的城巿化率和识字率的数据,变量“urban”存放城巿化率值;存放城巿化率值;“literacy”存放识字率,数据文件名为存放识字率,数据文件名为“EG8-1.sav”。将识
展开阅读全文