spss中的回归分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《spss中的回归分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 中的 回归 分析 课件
- 资源描述:
-
1、5.7 回归分析 线性回归线性回归 曲线估计曲线估计 二分量逻辑分析二分量逻辑分析 多项式逻辑分析多项式逻辑分析 标称变量分析标称变量分析 概率回归概率回归 非线性回归非线性回归 加权估计加权估计 2 2阶段最小二乘法阶段最小二乘法5-7-1 线性回归模型kkXXXY22110总体回归模型总体回归模型j也被称为也被称为偏回归系数偏回归系数(partial regression coefficients),表示,表示在其他解释变量保持不变的情况下,在其他解释变量保持不变的情况下,Xj每变化每变化1个单位时,个单位时,Y的均值的均值E(Y)的变化。的变化。kkXXXY22110样本回归函数样本回归
2、函数v参数估计参数估计 最小二乘法v模型统计推断检验模型统计推断检验 拟合优度检验 方程显著性检验(F检验)变量显著性检验(t检验)(1 1)拟合优度检验)拟合优度检验 回归方程的拟合优度检验就是要检验样本回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,从数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度。而判断回归方程对样本数据的代表程度。回归方程的拟合优度检验一般用调整判定系数回归方程的拟合优度检验一般用调整判定系数R2实现。该统计量的值越接近于实现。该统计量的值越接近于1越好。(越好。(注:在一元注:在一元线性回归中拟合优度的检验可用判定
3、系数线性回归中拟合优度的检验可用判定系数R2实现)实现)(2 2)回归方程的显著性检验()回归方程的显著性检验(F F检验)检验)回归方程的显著性检验是对因变量与所有回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检自变量之间的线性关系是否显著的一种假设检验。验。回归方程的显著性检验一般采用回归方程的显著性检验一般采用F F检验,检验,利用方差分析的方法进行。利用方差分析的方法进行。FHk012000:,(3 3)回归系数的显著性检验()回归系数的显著性检验(t t检验)检验)所谓回归系数的显著性检验,就是根据样所谓回归系数的显著性检验,就是根据样本估计的结果对总体回
4、归系数的有关假设进行本估计的结果对总体回归系数的有关假设进行检验。检验。之所以对回归系数进行显著性检验,是因之所以对回归系数进行显著性检验,是因为回归方程的显著性检验只能检验所有回归系为回归方程的显著性检验只能检验所有回归系数是否同时与零有显著性差异,它不能保证回数是否同时与零有显著性差异,它不能保证回归方程中不包含不能较好解释说明因变量变化归方程中不包含不能较好解释说明因变量变化的自变量。因此,可以通过回归系数显著性检的自变量。因此,可以通过回归系数显著性检验对每个回归系数进行考察。验对每个回归系数进行考察。回归参数显著性检验的基本步骤。回归参数显著性检验的基本步骤。提出假设提出假设 计算回
5、归系数的计算回归系数的t t统计量值统计量值 根据给定的显著水平根据给定的显著水平确定临界值,确定临界值,或者计算或者计算t t值所对应的值所对应的p p值值 作出判断作出判断H0:j=0 (j=1,2k)一、一元线性回归 y=a+bx例5-7-1 已知我国分地区家庭人均食品支出、人均收入。试作一元线性回归分析。(e5-7-1)操作步骤:使用系统默认选择项进行线性回归分析Analyze-Regression-Linear分析回归线性 Dependent:存放因变量 Independent:存放自变量 输出结果及结果分析变量引入或剔出表:Model 1 引入变量 income,用强迫输入法Ent
6、er。输输 入入 移移 去去 的的 变变 量量b bincomea.输入模型1输入的变量移去的变量方法已输入所有请求的变量。a.因变量:foodexpb.模型摘要表模型摘要表 相关系数相关系数R=0.923,判定系数判定系数R R2 2=0.852,=0.852,调整判定系数调整判定系数R R2 2=0.847,=0.847,估计值的标准误为估计值的标准误为73.8373.83 注:在一元线性回归中可用判定系数注:在一元线性回归中可用判定系数R2来判断模型的拟合来判断模型的拟合度。调整判定系数度。调整判定系数R2的值越大,模型的拟合优度越好。的值越大,模型的拟合优度越好。模型摘要模型摘要.92
7、3a.852.84773.829模型1RR 方调整的 R 方估计的标准差预测变量:(常量),income。a.方差分析表方差分析表 回归的均方回归的均方(RegressionMean Square)=878382.334,(RegressionMean Square)=878382.334,剩余剩余(残差)残差)的均方的均方(Residual-Mean square)=5450.755,F=161.149 P=0.000.(Residual-Mean square)=5450.755,F=161.149 P=0.000.可以可以认为这两个变量之间有直线关系认为这两个变量之间有直线关系.注:注:
8、H0为模型线性关系不成立为模型线性关系不成立,即即b=0A AN NO OV VA Ab b878382.331878382.33161.149.000a152621.13285450.7551031003.529回归残差合计模型1平方和df均方F显著性预测变量:(常量),income。a.因变量:foodexpb.系数系数a a-53.08667.963-.781.441.422.033.92312.694.000(常量)income模型1B标准误非标准化系数Beta标准化系数t显著性因变量:foodexpa.变量显著性检验(变量显著性检验(t 检验)检验)回归系数:回归系数:t=12.69
9、4,p=0.00,拒绝原假设,显著不为拒绝原假设,显著不为0常数项:常数项:t=-0.781,p=0.441,接受原假设,常数项与,接受原假设,常数项与0没有显著差异。没有显著差异。注意:在实际中一般不以注意:在实际中一般不以t检验决定常数项是否保留在模型中,而是从经济意检验决定常数项是否保留在模型中,而是从经济意义方面分析回归线是否应该通过原点。义方面分析回归线是否应该通过原点。回归方程:回归方程:常数项常数项=-53.086,回归系数回归系数=0.422,则线性回归方程为则线性回归方程为:y=-53.086+0.422x 二、多元回归分析1、从“Analyze”(分析)“Regressio
10、n”(回归)“Linear”(线性),打开 Linear线性回归主对话框。2、在左侧的源变量栏中选择一数值变量作为因变量进入、在左侧的源变量栏中选择一数值变量作为因变量进入Dependent栏中,栏中,选择一个或更多的变量作为自变量进入选择一个或更多的变量作为自变量进入Independent(s)栏中。栏中。3、如果要对不同的自变量采用不同的引入方法,可利用、如果要对不同的自变量采用不同的引入方法,可利用“Previous”与与“Next”按钮把自变量归类按钮把自变量归类到不同的自变量块到不同的自变量块(Block)中,中,然后对不同的变量子然后对不同的变量子集选用不同的引入方法(集选用不同的
11、引入方法(Method)。)。EnterEnter(进入):强迫引入法,默认选择项。定义的全部自变量均引入方(进入):强迫引入法,默认选择项。定义的全部自变量均引入方程。程。RemoveRemove(移去):强迫剔除法。定义的全部自变量均删除。(移去):强迫剔除法。定义的全部自变量均删除。ForwardForward(向前):向前引入法。自变量由少到多一个一个引入回归方程,(向前):向前引入法。自变量由少到多一个一个引入回归方程,直到不能按检验水准引入新的变量为止。该法的缺点是:当两个变量一起时效果直到不能按检验水准引入新的变量为止。该法的缺点是:当两个变量一起时效果好,单独时效果不好,有可能
12、只引入其中一个变量,或两个变量都不能引入。好,单独时效果不好,有可能只引入其中一个变量,或两个变量都不能引入。BackwardBackward(向后):向后剔除法。自变量由多到少一个一个从回归方程中(向后):向后剔除法。自变量由多到少一个一个从回归方程中剔除,直到不能按检验水准剔除为止,能克服向前引入法的缺点。当两个变量一剔除,直到不能按检验水准剔除为止,能克服向前引入法的缺点。当两个变量一起时效果好,单独时效果不好,该法可将两个变量都引入方程。起时效果好,单独时效果不好,该法可将两个变量都引入方程。StepwiseStepwise(逐步):逐步引入一剔除法。将向前引入法和向后剔除法结合(逐步
13、):逐步引入一剔除法。将向前引入法和向后剔除法结合起来,在向前引入的每一步之后都要考虑从已引入方程的变量中剔除作用不显著起来,在向前引入的每一步之后都要考虑从已引入方程的变量中剔除作用不显著者,直到没有一个自变量能引入方程和没有一个自变量能从方程中剔除为止。缺者,直到没有一个自变量能引入方程和没有一个自变量能从方程中剔除为止。缺点同向前引入法,但选中的变量比较精悍。点同向前引入法,但选中的变量比较精悍。说明:为弥补各种选择方法和各种标准的局限性,不妨分说明:为弥补各种选择方法和各种标准的局限性,不妨分别用各种方法和多种引入或剔别用各种方法和多种引入或剔除处理同一问题,若一些变量常除处理同一问题
14、,若一些变量常被选中,它们就值得重视。被选中,它们就值得重视。4、Selection variable(Selection variable(选择变量):可从源变量栏中选择变量):可从源变量栏中选择一个变量,单击选择一个变量,单击RuleRule后,通过该变量大于、小于或等于某后,通过该变量大于、小于或等于某一数值,选择进入回归分析的观察单位。一数值,选择进入回归分析的观察单位。5、Case Labels(个案标签):在左侧的源变量框中选择(个案标签):在左侧的源变量框中选择一变量作为标签变量进入一变量作为标签变量进入 Case Labels框框中。中。6、Statistics(统计)对话框统
15、计)对话框单击单击“Statistics”按钮,进入统计对话框如图按钮,进入统计对话框如图:Estimates(默认选择项默认选择项):回归系数的估计值:回归系数的估计值(B)及其标准误及其标准误(StdError)、)、常数常数(Constant););标准化回归系数(标准化回归系数(Beta););B的的t值及其双尾显著性水平值及其双尾显著性水平(Sig.)。)。Model fit(默认选择项):列出进入或从模型中剔除的变量;显示下列拟默认选择项):列出进入或从模型中剔除的变量;显示下列拟合优度统计量合优度统计量:复相关系数(复相关系数(R)、)、判定系数(判定系数(R2)、)、调整调整
16、R2(Adjusted R Square)、)、估计值的标准误以及方差分析表。估计值的标准误以及方差分析表。Confidence intervals:回归系数回归系数 B的的 95可信区间(可信区间(95Confidence interval for B)。)。Descriptives:变量的均数、标准差、相关系数矩阵及单尾检验。变量的均数、标准差、相关系数矩阵及单尾检验。Covariance matrix:方差方差协方差矩阵。协方差矩阵。R sqared change:R2和和 F值的改变,以及方差分析值的改变,以及方差分析 P值的改变。值的改变。Part and partial corre
17、lations:显示方程中各自变量与因变量的零阶相关显示方程中各自变量与因变量的零阶相关(Zero一一order,即,即Pearson相关)、偏相关相关)、偏相关(Partial)和部分相关和部分相关(part)。)。进行此进行此项分析要求方程中至少有两个自变量。项分析要求方程中至少有两个自变量。Collinearity diagnostic(共线性诊断)。显示各变量的容差(共线性诊断)。显示各变量的容差(Tolerance)、)、方差膨胀因子方差膨胀因子(VIC,Variance Inflation Factor)和共线性的诊断表。和共线性的诊断表。容差(容差(Tolerance)是不能由方
18、程中其它自变量解释的方差所占是不能由方程中其它自变量解释的方差所占的构成比。所有进入方程的变量的容差必须大于默认的容差水平值的构成比。所有进入方程的变量的容差必须大于默认的容差水平值(Tolerance:0.0001)。)。该值愈小,说明该自变量与其他自变量的该值愈小,说明该自变量与其他自变量的线性关系愈密切。该值的倒数为方差膨胀因子(线性关系愈密切。该值的倒数为方差膨胀因子(Variance Inflation Factor)。)。当自变量均为随机变量时,若它们之间高度相关,则称当自变量均为随机变量时,若它们之间高度相关,则称自变量间存在共线性。在自变量间存在共线性。在多元线性回归时,共线性
19、会使参数估计不多元线性回归时,共线性会使参数估计不稳定。逐步选择变量是解决共线性的方法之一。稳定。逐步选择变量是解决共线性的方法之一。DurbinWaston:用于随机误差项的分析,以检验回归模型用于随机误差项的分析,以检验回归模型中的误差项的独立性。如果误差项不独立,那么对回归模型的任何中的误差项的独立性。如果误差项不独立,那么对回归模型的任何估计与假设所做出的结论都是不可靠的。估计与假设所做出的结论都是不可靠的。计算计算DW值值 给定给定,由,由n和和k的大小查的大小查DW分布表,得临界值分布表,得临界值dL和和dU 比较、判断比较、判断 0D.W.dL 存在正自相关 dLD.W.dU 不
20、能确定 dU D.W.4dU 无自相关4dU D.W.4 dL 不能确定4dL D.W.4 存在负自相关 说明:当说明:当D.W.值在值在2左右时,模型不存在一阶自相关。左右时,模型不存在一阶自相关。Casewise diagnostic:对标准化残差:对标准化残差(服从均数服从均数=0,标准差,标准差=1的正的正态分布态分布)进行诊断。进行诊断。判断有无奇异值(离群值)(判断有无奇异值(离群值)(outliers)。)。Outliers:显示标准化残差超过:显示标准化残差超过n个标准差的奇异值,个标准差的奇异值,n=3为默认值。为默认值。All Cases:显示每一例的标准化残差、实测值和预
21、测值、:显示每一例的标准化残差、实测值和预测值、残差。残差。7、Plots(图)对话框(图)对话框 单击单击“Plots”按钮,对话框如下图所示。按钮,对话框如下图所示。Plots可帮助分析可帮助分析资料的正态性、线性和方差齐性,还可帮助检测奇异值或异常值。资料的正态性、线性和方差齐性,还可帮助检测奇异值或异常值。(1)散点图:可选择如下任何两个变量为)散点图:可选择如下任何两个变量为Y(纵轴变量)与纵轴变量)与X(横轴变量)作图。为横轴变量)作图。为 获得更多的图形,可单击获得更多的图形,可单击“Next”按钮来重按钮来重复操作过程。复操作过程。DEPENDENT:因变量。因变量。*ZPRE
22、D:标准化预测值。标准化预测值。*ZRESID:标准化残差。标准化残差。*DRESID:删除的残差。删除的残差。*ADJPRED:调整残差。调整残差。*SRESID:Student氏残差。氏残差。*SDRESID:Student氏删除残差。氏删除残差。(2)Standardized Residual Plots:标准化残差图。标准化残差图。Histogram:标准化残差的直方图,并给出正态曲线。标准化残差的直方图,并给出正态曲线。Normal Probality Plot:标准化残差的正态概率图(标准化残差的正态概率图(PP图)。图)。(3)Produce all Partial plots:
23、偏残差图。偏残差图。8、Save(保存新变量)对话框 单击“Save”按钮,对话框如下图所示。每项选择都会增加新变量到正在使用的数据文件中。(1)预测值()预测值(Predicted Values):):Unstandardized:未标准化的预测值,简称预测值未标准化的预测值,简称预测值(新变量为新变量为pre-_1)。Standardized标准化的预测值(新变量为标准化的预测值(新变量为Zpr_1)。)。SEOf mean prediction:预测值的标准误(新变量为预测值的标准误(新变量为 Sep_l)。)。(2)残差(残差(Residuals)Unstandardized未标准化残
24、差(新变量为未标准化残差(新变量为res_1)。)。Standardized:标准化残差(新变量为标准化残差(新变量为Zre_1)。)。(3)预测区间估计(预测区间估计(Prediction Intervals)Mean:是总体中当是总体中当X为某定值时预测值的均数的可信区间(新变量为某定值时预测值的均数的可信区间(新变量lmci_1为为下限,下限,umci_1为上为上 限。限。Individual:个体个体Y值的容许区间。即总体中,当值的容许区间。即总体中,当X为某定值时,个体为某定值时,个体Y值的值的波波动范围(新变量动范围(新变量lici_1为下限,为下限,uici_1为上限)。为上限)
25、。Confidence Intervals:可信区间。默认为可信区间。默认为 95的可信区间,但用户可以自的可信区间,但用户可以自己设定。己设定。9、Options选择项对话框 单击“Option”按钮,打开Options对话框,如下图。(1)逐步方法准则()逐步方法准则(Stepping Method Criteria):):Use Probability of F(使用使用 F显著水平值):当候选变量中最显著水平值):当候选变量中最大大 F值的值的 P值小于或等于引入值(默认:值小于或等于引入值(默认:005)时,引入相应的变)时,引入相应的变量;已进入方程的变量中,最小量;已进入方程的变
展开阅读全文