统计学课件相关与回归分析课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学课件相关与回归分析课件.pptx》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 课件 相关 回归 分析
- 资源描述:
-
1、2023-5-61第八章 相关与回归分析第一节 相关与回归分析的基本概念 第三节 一元线性回归分析 第四节 多元线性回归分析【学习目标】通过对本章的学习,重点掌握回归分析的估计和检验方法;掌握相关分析的种类及三种相关系数的计算方法;在此基础上能够运用相关分析和回归分析的基本方法解释实际社会经济问题。重点与难点:相关系数的计算及其检验;多元线性回归分析。第五节 非线性回归分析 第二节 相关分析 第1页/共92页2023-5-62第一节 相关与回归分析的基本概念 (一)函数关系 一、相关关系与函数关系 第八章 相关与回归分析 函数关系是指现象之间存在着严格的依存关系,亦即当其它条件不变时,对于某一
2、自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。第2页/共92页2023-5-63第一节 相关与回归分析的基本概念 (二)统计关系 一、相关关系与函数关系 第八章 相关与回归分析统计关系不同于函数关系,当重复观测时,观测点不是完全落在统计关系曲线上,而是围绕统计关系曲线散布。统计关系可以表示为确定部分和随机性部分二者之和,这是回归分析的基础。相关关系因果关系第3页/共92页2023-5-64案例分析相关关系与因果关系一家研究机构有一项惊人的发现:统计数据显示,脚长的儿童拼写能力比脚短的儿童强。原来他们调查的是一群年龄不同的儿童,
3、脚长的儿童比脚短的儿童年龄大!赶快回去量一下儿子的脚长我要把脚拉长一点!第4页/共92页2023-5-65按涉及变量的多少分为按照表现形式不同分为按照变化方向不同分为直线相关曲线相关负相关正相关复相关单相关偏相关第八章 相关与回归分析第5页/共92页2023-5-664.按相关的程度分为5.按变量之间因果 关系的方向分为完全相关不完全相关不相关双向因果相关单向因果相关虚假相关第八章 相关与回归分析第6页/共92页2023-5-67第一节 相关与回归分析的基本概念 第八章 相关与回归分析三、相关分析与回归分析 回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的依赖关系。相关分析是
4、测度两个变量之间的线性关联度的,并用一些指数(相关系数)表示相关程度。第7页/共92页2023-5-68第一节 相关与回归分析的基本概念 第八章 相关与回归分析三、相关分析与回归分析 q相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;q相关分析中x、y均为随机变量,回归分析中只有y为随机变量;q相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。区别:第8页/共92页2023-5-69第一节 相关与回归分析的基本概念 第八章 相关与回归分析三、相关分析与回归分析联系:q 相关分析是回归分析的基础和前提。q 回归分析是相关分析的深入和继续。第9页/共92页2023-5-61
5、0第一节 相关与回归分析的基本概念 第八章 相关与回归分析四、相关表与相关图 (一)简单相关表 将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便得到简单的相关表。第10页/共92页2023-5-611第一节 相关与回归分析的基本概念 第八章 相关与回归分析 企业编号企业编号月产量(千吨)月产量(千吨)X生产费用生产费用(万元万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用第11页/共92页2023-5-612第一节 相关与回归分析的基本概念 第八章 相关与回归分析四、
6、相关表与相关图 (二)分组相关表 单变量分组表 双变量分组表 三变量分组表。第12页/共92页2023-5-613第一节 相关与回归分析的基本概念 第八章 相关与回归分析 1.单变量分组表 表 某纺织厂工人看管织机台数和时劳动生产率相关表 第13页/共92页2023-5-614第一节 相关与回归分析的基本概念 第八章 相关与回归分析 2.双变量分组表 表居住时间与对百货商场的熟悉程度的双变量分组表第14页/共92页2023-5-615第一节 相关与回归分析的基本概念 第八章 相关与回归分析 3.三变量分组表 假定对于某项私家车购买意向的调查,最初以教育水平和私家车拥有情况进行分析,对1000人
7、调查的结果用二维列联表表示如:第15页/共92页2023-5-616第一节 相关与回归分析的基本概念 第八章 相关与回归分析 3.三变量分组表 表教育程度和私家车拥有状况的双变量分析第16页/共92页2023-5-617第八章 相关与回归分析 从上表中可以看出,文化程度越高的人拥有私家车的比例越高,这和实际情况不太相符,于是我们引入收入变量,作三变量的交叉列表分析:教育程度、收入与私家车拥有状况的三变量分析 私家车拥有状私家车拥有状况况收入水平收入水平低收入低收入高收入高收入教育程度教育程度教育程度教育程度本科及以上本科及以上本科以下本科以下本科及以上本科及以上本科以下本科以下有有没有没有20
8、%(20)80%(80)20%(140)80%(560)40%(60)60%(90)40%(20)60%(30)列合计列合计100%100%100%100%被调查者人数被调查者人数10070015050第17页/共92页2023-5-618正 相 关负 相 关曲线相关不 相 关xyxyxyxy第八章 相关与回归分析(三)相关图第18页/共92页2023-5-619第八章 相关与回归分析 第二节 相关分析 一、简单相关系数及其检验(一)简单相关系数的定义 简单相关系数简称相关系数,是测量两个变量之间线性相关的方向和程度的指标。总体相关系数的表达式为:YDXDYXCov,式中:YXCov,为变量X
9、与变量Y的协方差 XD YD 为变量Y的方差为变量X的方差第19页/共92页2023-5-620第八章 相关与回归分析 第五节 相关分析 一、简单相关系数及其检验 (一)简单相关系数的定义 r 样本相关系数是总体相关系数的估计值。22yyxxyyxxr 简单相关系数通常采用下面的计算公式:2222)()(yynxxnyxxynr第20页/共92页2023-5-621相关系数r的取值范围:r0 为正相关,r 0 为负相关;|r|=0 表示不存在关系;|r|1 表示完全相关;|r|0.4 为低度线性相关;0.4|r|0.7为显著性线性相关;0.7|r|1.0为高度显著性线性相关。第八章 相关与回归
10、分析第21页/共92页2023-5-622第八章 相关与回归分析 第五节 相关分析 一、简单相关系数及其检验 (二)简单相关系数的检验样本相关系数的检验有两种方法:直接检验法,检验法。t第22页/共92页2023-5-623提出假设:0:0:10HH目的检验两变量间线性相关性是否显著步骤构造检验统计量:)2(122ntrnrt第八章 相关与回归分析第23页/共92页2023-5-624 根据给定的显著性水平,确定临界值 ;2t 计算检验统计量并做出决策。22ntt 确定原假设的拒绝规则:22ntt步骤第八章 相关与回归分析第24页/共92页2023-5-625第八章 相关与回归分析 20.02
11、5200.97 8210.9710.2910.29262.447tttntH有:拒绝,表示总体的两变量间线性相关性显著。00:H0:0:,05.0,97.0,810HHrn提出假设:则解:已知当 成立时,则统计量)2(122ntrnrt第25页/共92页2023-5-626第八章 相关与回归分析 第五节 相关分析 二、复相关系数 复相关系数是测量一个变量与其它多个变量之间线性相关程度的指标。为了测定一个变量y与其它多个变量 之间的相关系数,可以考虑构造一个关于的线性组合,通过计算该线性组合与之间的简单相关系数作为变量与之间的复相关系数。具体计算过程如下:kxxx,21kxxx,21第一步,用
12、y 对作回归,得kkxxy110第26页/共92页2023-5-627第八章 相关与回归分析 第五节 相关分析 ;y 第二步,计算 y 和的简单相关系数,此简单相关系数即为y与 之间的复相关系数。kxxx,2122yyyyyyyyR222yyyyR复相关系数的计算公式为:第27页/共92页2023-5-628第八章 相关与回归分析 第五节 相关分析 二、复相关系数 ;复相关系数与简单相关系数的区别是简单相关系数的取值范围是-1,1,而复相关系数的取值范围是0,1。这是因为,在两个变量的情况下,回归系数有正负之分,所以在研究相关时,也有正相关和负相关之分;但在多个变量时,偏回归系数有两个或两个以
13、上,其符号有正有负,不能按正负来区别,所以复相关系数也就只取正值。第28页/共92页2023-5-629第八章 相关与回归分析 当两个变量同时受其它变量影响时,有必要研究当控制其它变量不变时,该两个变量之间的相关关系。这种相关关系被称为偏相关关系。第五节 相关分析 三、偏相关系数 ;计算偏相关系数的原因在于任何两个变量这间的相关关系都可能受其余变量的影响。要考察两个变量之间的纯相关关系,必须排除其余变量的影响,或者说必须使其余变量保持不变。第29页/共92页2023-5-630第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 偏相关系数的计算是以回归分析为基础的。以三个变量的情形为例,
14、此种情况下,的偏相关系数有三个,分别记作 3.12r2.13r 1.23r1x3.12r3x2x为与之间的相关系数;保持不变时,、和 之间的相关系数;1x2.13r2x与为保持不变时,之间的相关系数;3x为1.23r2x3x1x与 保持不变时,之间的相关系数;第30页/共92页2023-5-631第八章 相关与回归分析 第五节 相关分析 uxx3101计算残差3101xxuu 3x1x此时中不再含有对的影响。2x3x第二步,求对的回归估计式vxx3102计算残差3102xxvv 3x2x此时中不再含有对的影响。第一步,求对的回归估计式1x3x第31页/共92页2023-5-632第八章 相关与
15、回归分析 第五节 相关分析 u v 第三步,计算和的简单相关系数u 3xu v 3x1x2x由于和中都不再包含的影响,因此和的简单相关系数就是保持不变时,与之间的相关系数。v 223.12 vuvur所以偏相关系数第32页/共92页2023-5-633第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 可以证明,231312222211 rrrxxxxvu21321121rxxu22322221rxxv2232132313123.1211rrrrrr第33页/共92页2023-5-634第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 类似的 2232122312132.1311
16、rrrrrr2212132113231.2311rrrrrr 当变量个数多于3个时,求偏相关系数的原则不变,即应先排除其余变量对所考察两个变量的影响,然后求这两个变量之间的简单相关系数。只是变量越多,数学处理以及偏相关系数的表达式就越复杂。第34页/共92页2023-5-635第二节 一元线性回归分析第八章 相关与回归分析一、一元线性回归分析随机误差项的基本假定 在回归分析中,最简单最基本的单方程模型为一元线性回归模型。一元线性回归分析的总体回归模型为:iiiuxy10 为常数项或截距项,为斜率系数,是随机误差项,又称随机干扰项。第35页/共92页2023-5-636第二节 一元线性回归分析第
17、八章 相关与回归分析一、一元线性回归分析随机误差项的基本假定 第二,模型的设定误差。在线性回归模型中加入随机误差项是基于以下原因:第一,模型不可能包含所有的解释变量。第三,测量误差的影响。第四,其他随机因素的影响。第36页/共92页2023-5-637第二节 一元线性回归分析第八章 相关与回归分析一、一元线性回归分析随机误差项的基本假定 线性回归模型由两部分构成,确定性部分和随机性部分,为确定性部分,称为对于给定值的期望值,可以写为:上式被称为总体线性回归方程。第37页/共92页2023-5-638第二节 一元线性回归分析第八章 相关与回归分析一、一元线性回归分析随机误差项的基本假定 满足以下
18、假定的线性回归模型称为古典(或经典)线性回归模型 假定1:回归模型是正确设定的假定2:解释变量是非随机的假定3:随机误差项的均值为零假定4:随机误差项的方差为一个不变的常数(等方差假定)假定5:随机误差项的观测值互不相关(非序列相关假定)假定6:解释变量与随机误差项不相关假定7:随机误差项服从正态分布假定8:没有一个解释变量是其他任何解释变量的完全线性组合(无多重共线性假定,只适用于多元线性回归模型)第38页/共92页2023-5-639第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 最小二乘法的意义在于使为了得到这些估计值而最为广泛使用的方法就是普通最小二乘法 xy
19、10 为样本回归方程。2102iiiixyyyQ达到最小来确定01、一般用 01、分别表 分别表示参数的估计iiiyye称为回归残差第39页/共92页2023-5-640bxaybxay残差(Residual):eyy第40页/共92页2023-5-641第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 0)(2100iixyQ0)(2101iiixxyQ 根据微积分的极值定理,对 求相应于 、的偏导数,并令其等于0,即可求得:Q01 xynxnyxxnyxxyn110221)(第41页/共92页2023-5-642 r0 r0 r=0b0 b0 b=0 xyyxSSr
20、bSSbr;第八章 相关与回归分析第42页/共92页2023-5-643第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 样本回归直线具有下述性质:第一、它通过 y 和 x 的样本平均数 和 确定的那一点;第二、的平均值和 的平均值相等;第三、残差的平均值是零;第四、残差和 不相关;第五、残差与x不相关。yxiy iyiy 第43页/共92页2023-5-6449520.0,9757.02rr,55086,37887,625,916,162xxyyxn由计算表知xy10第八章 相关与回归分析第44页/共92页2023-5-645序号序号能源消耗量能源消耗量(十万吨)(十
21、万吨)x工业总产值工业总产值(亿元)(亿元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408
22、合计合计91662555086 2617537887第45页/共92页2023-5-646第八章 相关与回归分析5142.6169167961.0166257961.091655086166259163788716102221 xyxxnyxxynxy7961.05142.6第46页/共92页2023-5-647第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 在回归分析中,不要试着对常数项进行解释,原因有两点:首先,随机误差项部分地是由于忽略了许多边缘自变量而生成的,这些变量的平均效应被置于常数项中。其次,常数项是当所有自变量与误差项为0时,因变量的值,但是自变量与随
展开阅读全文