统计学实验—SPSS与R软件应用与实例-第6章回归分析-SPSS课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学实验—SPSS与R软件应用与实例-第6章回归分析-SPSS课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 实验 SPSS 软件 应用 实例 章回 分析 课件
- 资源描述:
-
1、2022-7-24统计学实验第6章回归分析统计学实验统计学实验SPSS和和R软件应用与实例软件应用与实例 主编:费宇主编:费宇2022-7-24统计学实验第6章回归分析第第6 6章章 回归分析回归分析2022-7-24统计学实验第6章回归分析一、实验目的一、实验目的F 通过运用通过运用SPSS进行相关分析和回归分析进行相关分析和回归分析;F 熟悉熟悉SPSS的分析(的分析(Analyze)菜单中相)菜单中相关(关(Correlate),回归(),回归(Regression)和一般线性模型(和一般线性模型(General Linear Model)等模块的主要功能等模块的主要功能F 掌握运用掌握
2、运用SPSS进行相关分析和回归分析进行相关分析和回归分析的基本操作过程,并能读懂的基本操作过程,并能读懂SPSS输出的输出的结果。结果。2022-7-24统计学实验第6章回归分析二、实验环境二、实验环境F 系统软件系统软件Windows2000或或WindowsXP或或Windows7;F 统计软件统计软件SPSS16.0或更高版本。或更高版本。2022-7-24统计学实验第6章回归分析三、实验内容三、实验内容F 相关分析相关分析F 一元线性回归一元线性回归的估计的估计F 多元线性回归多元线性回归的估计的估计F 逐步回归逐步回归的估计的估计F 虚拟变量回归虚拟变量回归的估计的估计F Logis
3、tic回归回归的估计的估计F 回归曲线的估计回归曲线的估计2022-7-24统计学实验第6章回归分析第第6 6章章 回归分析回归分析F6.1 相关分析相关分析F6.2 一元线性回归一元线性回归F6.3 多元线性回归多元线性回归F6.4 虚拟变量回归虚拟变量回归F6.5 Logistic回归回归F6.6 曲线回归曲线回归2022-7-24统计学实验第6章回归分析6.1 6.1 相关分析相关分析F【例【例6.1】(数据文件为数据文件为li6.1.sav)为研究初中一年为研究初中一年级男生身高级男生身高x(单位:厘米单位:厘米)、体重、体重z(单位:千克单位:千克)和肺活量和肺活量y(单位:升单位:
4、升)的关系,随机抽取了的关系,随机抽取了16名名初一男生测量得有关数据如表初一男生测量得有关数据如表6.1所示所示:表表6.1初一男生身高、体重和肺活量的测量值初一男生身高、体重和肺活量的测量值身高x体重z肺活量y身高x体重z肺活量y140.137.02.25162.548.32.75151.538.53.0165.542.52.5161.242.13.25148.036.52.25172.846.53.25165.845.43.25150.038.03.0164.043.53.0153.542.22.75149.539.72.75170.554.53.5159.644.53.0157.037
5、.02.25162.545.03.2F(1)绘制变量散点图,分析身高)绘制变量散点图,分析身高x、体重、体重z和肺活量和肺活量y之间是否存在相关关系;之间是否存在相关关系;F(2)计算简单相关系数,分析身高)计算简单相关系数,分析身高x、体、体重重z和肺活量和肺活量y的之间是否存在直线相关关的之间是否存在直线相关关系;系;F(3)计算偏相关系数,分析身高)计算偏相关系数,分析身高x、体重、体重z和肺活量和肺活量y的之间的偏相关关系。的之间的偏相关关系。2022-7-24统计学实验第6章回归分析2022-7-24统计学实验第6章回归分析【统计理论统计理论】F给定容量为给定容量为n的一个样本的一个
6、样本,样本简单相关,样本简单相关系数(系数(correlation coefficient)r的计算公的计算公式如下式如下12211()()(6.1)()()niiixynniiiixxyyrxxyy2022-7-24统计学实验第6章回归分析【统计理论统计理论】F设三个变量设三个变量x、y和和z是相互关联的一组变量,是相互关联的一组变量,那么,在控制了变量那么,在控制了变量z的影响后,变量的影响后,变量x和和y的偏相关系数(的偏相关系数(partial correlation coefficient)为)为:,22 (6.2)11xyxz yzxy zxzyzrr rrrr(1)画散点图,观察
7、身高)画散点图,观察身高x、体重、体重z和肺活量和肺活量y之间的相关关系之间的相关关系2022-7-24统计学实验第6章回归分析2022-7-24统计学实验第6章回归分析【软件操作软件操作】F打开数据文件打开数据文件li6.1.sav F选择选择GraphsLegacy DiaglogsScatter/DotF在在Scatter/Dot对话框中选中对话框中选中Matrix Scatter,点击,点击DefineF将身高将身高x、体重、体重z和肺活量和肺活量y选入选入Matrix Variables中,中,点击点击OK,可得图,可得图6.1。2022-7-24统计学实验第6章回归分析图6.1 身
8、高x、体重z和肺活量y矩阵式散点图2022-7-24统计学实验第6章回归分析【程序方式程序方式】GRAPH/SCATTERPLOT(MATRIX)=X Z Y/MISSING=LISTWISE.(2)计算身高)计算身高x、体重、体重z和肺活量和肺活量y之间的相之间的相关系数关系数2022-7-24统计学实验第6章回归分析F选择选择AnalyzeCorrelateBivariateF将身高将身高x、体重、体重z和肺活量和肺活量y三个变量同时选三个变量同时选入入VariablesF在在Correlation Coefficients中选中选Pearson,点,点OK即可得相关系数表表即可得相关系数
9、表表6.2。2022-7-24统计学实验第6章回归分析【软件操作软件操作】2022-7-24统计学实验第6章回归分析表6.2 初一男生身高、体重和肺活量的相关系数表Correlations x 身高,cmz 体重,kgy 肺活量,Lx 身高,cmPearson Correlation1.810*.650*Sig.(2-tailed).000.006N161616z体重,kgPearson Correlation.810*1.707*Sig.(2-tailed).000.002N161616y 肺活量,LPearson Correlation.650*.707*1Sig.(2-tailed).0
10、06.002 N161616*.Correlation is significant at the 0.01 level(2-tailed).【程序方式程序方式】2022-7-24统计学实验第6章回归分析CORRELATIONS/VARIABLES=X Z Y/PRINT=TWOTAIL NOSIG/MISSING=PAIRWISE.(3)计算偏相关系数,分析身高)计算偏相关系数,分析身高x、体重、体重z和和肺活量肺活量y的之间的偏相关关系的之间的偏相关关系2022-7-24统计学实验第6章回归分析F选择选择AnalyzeCorrelatePartialF将身高将身高x和肺活量和肺活量y两个变
11、量同时选入两个变量同时选入VariablesF再将控制变量体重再将控制变量体重z选入选入Controlling for中,中,点点OK即可得相关系数表表即可得相关系数表表6.3。2022-7-24统计学实验第6章回归分析【软件操作软件操作】2022-7-24统计学实验第6章回归分析表6.3初一男生身高、体重和肺活量偏相关系数表CorrelationsControl Variablesx 身高,cmy 肺活量,Lz 体重,kgx 身高,cmCorrelation1.000.186Significance(2-tailed).508df013y肺活量,LCorrelation.1861.000Si
12、gnificance(2-tailed).508.df130【程序方式程序方式】2022-7-24统计学实验第6章回归分析PARTIAL CORR/VARIABLES=X Y BY Z/SIGNIFICANCE=TWOTAIL/MISSING=LISTWISE.2022-7-24统计学实验第6章回归分析6.2一元线性回归一元线性回归F【例【例6.2】(数据文件为数据文件为li6.2.sav)表表6.4是华尔街日报是华尔街日报2019年年年年鉴鉴(The Wall Street Journal Almanac 2019)上公布的美国各上公布的美国各航空公司业绩的统计数据:航班正点到达的比率和每航
13、空公司业绩的统计数据:航班正点到达的比率和每10万名乘客万名乘客投诉的次数。投诉的次数。表6.4美国航空公司航班正点率与乘客投诉率航空公司名称航班正点率%(x)投诉率(次/10万名乘客)(y)SouthwestContinentalNorthwestUSUnitedAmericanDeltaAmericawestTWA81.876.676.675.773.872.271.270.868.50.210.580.850.680.740.930.721.221.25F(1)试以航班正点率为自变量,投诉率为)试以航班正点率为自变量,投诉率为因变量建立回归方程;因变量建立回归方程;F(2)如果航班正点率
14、为)如果航班正点率为80%,估计每,估计每10万万名乘客投诉的次数是多少?名乘客投诉的次数是多少?2022-7-24统计学实验第6章回归分析2022-7-24统计学实验第6章回归分析【统计理论统计理论】F设设y与与x之间有直线相关关系,且之间有直线相关关系,且y是随机变是随机变量,但量,但x是非随机变量,它们之间的关系可是非随机变量,它们之间的关系可以用下式表示以用下式表示:01(6.3)yx2022-7-24统计学实验第6章回归分析【统计理论统计理论】F采用最小二乘方法可以得到回归系数的估采用最小二乘方法可以得到回归系数的估计值为计值为:F从而得到回归方程从而得到回归方程:112101()(
15、)(6.4)()niiiniixxyyxxyx01 (6.5)yx2022-7-24统计学实验第6章回归分析【统计理论统计理论】F回归方程的显著性检验等价于以下检验回归方程的显著性检验等价于以下检验:F对于一元线性回归来说,有两种等价的方法,即对于一元线性回归来说,有两种等价的方法,即F检验和检验和t检验。检验。F检验的统计量为检验的统计量为:Ft检验的统计量如下检验的统计量如下:0111:0:0(6.6)HHSSR(6.7)SSE/(2)Fn121 (6.8)()niitxx2022-7-24统计学实验第6章回归分析【统计理论统计理论】F 200221()1(2)(6.9)()niixxyt
16、nnxx200221()1(2)1(6.10)()niixxytnnxx(1)绘制变量散点图绘制变量散点图计算相关系数和一元计算相关系数和一元线性回归线性回归2022-7-24统计学实验第6章回归分析2022-7-24统计学实验第6章回归分析【菜单方式菜单方式】F打开数据文件打开数据文件li6.2.savF选择选择GraphsLegacy Diaglogs Scatter/DotSimple ScatterplotF将将y选入选入Y Axis,将,将x选入选入X Axis点击点击OK,即,即可得散点图图可得散点图图6.2。2022-7-24统计学实验第6章回归分析图6.2 航班正点率x和投诉率
17、散点图2022-7-24统计学实验第6章回归分析【程序方式程序方式】GRAPH/SCATTERPLOT(BIVAR)=x WITH y/MISSING=LISTWISE.2022-7-24统计学实验第6章回归分析【菜单方式菜单方式】F打开数据文件打开数据文件li6.2.savF选择选择AnalyzeCorrelateBivariate CorrelationsF将将y和和x选入选入Variables,选中,选中Pearson,Two-tailed和和Flag significant correlations点击点击OK,可得航班正点率,可得航班正点率 和投诉率和投诉率 的相关系数表表的相关系数
18、表表6.5。2022-7-24统计学实验第6章回归分析 CorrelationsCorrelationsx 航班正点率%y 投诉率(次/10万名乘客)x 航班正点率%Pearson Correlation1-.883*Sig.(2-tailed).002N99y 投诉率(次/10万名乘客)Pearson Correlation-.883*1Sig.(2-tailed).002N99*.Correlation is significant at the 0.01 level(2-tailed).表6.5 航班正点率x和投诉率y的相关系数表2022-7-24统计学实验第6章回归分析【程序方式程序方
19、式】CORRELATIONS/VARIABLES=x y/PRINT=TWOTAIL NOSIG/MISSING=PAIRWISE.2022-7-24统计学实验第6章回归分析【菜单方式菜单方式】F打开数据文件打开数据文件li6.2.savF选择选择AnalyzeRegressionLinear RegressionF将将y选入选入Dependent,将,将x选入选入Independent(s)点击点击OK,可得表,可得表6.6和表和表6.7。2022-7-24统计学实验第6章回归分析表6.6 航班正点率x和投诉率y的方差分析表 ANOVAbModelSum of SquaresdfMean S
20、quareFSig.1Regression.6381.63824.674.002aResidual.1817.026 Total.8198 a.Predictors:(Constant),x 航班正点率%b.Dependent Variable:y 投诉率(次/10万名乘客)2022-7-24统计学实验第6章回归分析 CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd.ErrorBeta1(Constant)6.0181.052 5.719.001x 航班正点率%-.070.014-.8
21、83-4.967.002a.Dependent Variable:y 投诉率(次/10万名乘客)表6.7 航班正点率x和投诉率y的回归方程系数表2022-7-24统计学实验第6章回归分析【程序方式程序方式】REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05)POUT(.10)/NOORIGIN /DEPENDENT y /METHOD=ENTER x.(2)如果航班正点率为)如果航班正点率为80%,对每,对每10万名乘万名乘客投诉的次数进行预测客投诉的次数进行预测2022-7-24统计学实验
22、第6章回归分析2022-7-24统计学实验第6章回归分析【菜单方式菜单方式】F打开数据文件打开数据文件li6.2.sav,在在 列中最末处输入列中最末处输入80F选择选择AnalyzeRegressionLinear RegressionF在在save选项中选项中Predicted Values下选中下选中UnstandardizedF在在Predicted Intervals选中选中Individual(个值(个值的预测),点击的预测),点击Continue回到主对话框,回到主对话框,点点OK即可。即可。2022-7-24统计学实验第6章回归分析【程序方式程序方式】REGRESSION /M
23、ISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05)POUT(.10)CIN(95)/NOORIGIN /DEPENDENT y /METHOD=ENTER x /SAVE PRED ICIN.2022-7-24统计学实验第6章回归分析6.3 6.3 多元线性回归多元线性回归F【例【例6.3】(数据文件为】(数据文件为li6.3.sav)某公司)某公司经理想研究公司员工的年薪问题,根据初经理想研究公司员工的年薪问题,根据初步分析,他认为员工的当前年薪步分析,他认为员工的当前年薪y(元元)与员与员工的开始年薪工的开始年
24、薪x1(元元)、在公司的工作时间、在公司的工作时间x2(月月)、先前的工作经验、先前的工作经验x3(月月)和受教育年和受教育年限限x4(年年)有关系,他随机抽样调查了有关系,他随机抽样调查了36个员个员工,收集到表工,收集到表6.8数据数据(略)。(略)。F(1)经理想根据以上样本数据,构建一个)经理想根据以上样本数据,构建一个模型来反映模型来反映y与与x1、x2、x3和和x4之间关系,之间关系,并希望利用该模型在给定一个员工的并希望利用该模型在给定一个员工的x1、x2、x3和和x4的条件下,预测该员工的当前年薪的条件下,预测该员工的当前年薪y;F(2)经理认为,公司男女员工的薪水结构)经理认
25、为,公司男女员工的薪水结构不同,他想在建立模型的时候能把性别因不同,他想在建立模型的时候能把性别因素考虑进来,这是否可行?素考虑进来,这是否可行?2022-7-24统计学实验第6章回归分析2022-7-24统计学实验第6章回归分析【统计理论统计理论】F多元线性回归统计模型的一般形式为多元线性回归统计模型的一般形式为:F模型的基本假定为模型的基本假定为:F(1)且相互独立;且相互独立;F(2)自变量)自变量 是是非随机的,且互非随机的,且互不相关不相关;F(3)自变量与随机误差项不相关,即自变量与随机误差项不相关,即01 1,1,(6.12)iippiiyxxin2(0,)iN1,pxxCov(
展开阅读全文