[管理学]管理统计学第6章相关与回归课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《[管理学]管理统计学第6章相关与回归课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理学 管理 统计学 相关 回归 课件
- 资源描述:
-
1、2022-8-91第六章第六章 相关与回归分析相关与回归分析 2022-8-922022-8-93相关分析和回归分析有什么用?相关分析和回归分析有什么用?一个国家香烟的消费量与癌症的发病率有关系吗?一个国家香烟的消费量与癌症的发病率有关系吗?父母的身高是否影响其子女的身高?父母的身高是否影响其子女的身高?公司股票的市盈率与老总的薪酬有关联吗?公司股票的市盈率与老总的薪酬有关联吗?接受高学历教育的人是否比低学历的人有更高的薪水?接受高学历教育的人是否比低学历的人有更高的薪水?现实世界中存在着大量诸如此类的问题,用统计语言来概况,现实世界中存在着大量诸如此类的问题,用统计语言来概况,就是两个或者更
2、多个变量之间,是否存在相互关联?进而,就是两个或者更多个变量之间,是否存在相互关联?进而,存在相关关系的变量间又是如何相互影响的?存在相关关系的变量间又是如何相互影响的?相关分析和回归分析可以用来回答这类问题,它们是研究现相关分析和回归分析可以用来回答这类问题,它们是研究现象之间相互关系的两种基本方法。本章介绍这两种方法的理象之间相互关系的两种基本方法。本章介绍这两种方法的理论与应用。论与应用。2022-8-94实例实例1:中国妇女生育水平的决定因素是什么中国妇女生育水平的决定因素是什么?妇女生育水平除了受计划生育政策影响以外,还可能与社会、妇女生育水平除了受计划生育政策影响以外,还可能与社会
3、、经济、文化等多种因素有关。经济、文化等多种因素有关。1.影响中国妇女生育率变动的因素有哪些?影响中国妇女生育率变动的因素有哪些?2.各种因素对生育率的作用方向和作用程度如何?各种因素对生育率的作用方向和作用程度如何?3.哪些因素是影响妇女生育率主要的决定性因素?哪些因素是影响妇女生育率主要的决定性因素?4.如何评价计划生育政策在生育水平变动中的作用?如何评价计划生育政策在生育水平变动中的作用?5.计划生育政策与经济因素比较计划生育政策与经济因素比较,什么是影响生育率的决定因素?什么是影响生育率的决定因素?6.如果某些地区的计划生育政策及社会、经济、文化等因素发如果某些地区的计划生育政策及社会
4、、经济、文化等因素发生重大变化,预期对这些地区的妇女生育水平会产生怎样的生重大变化,预期对这些地区的妇女生育水平会产生怎样的影响?影响?2022-8-95 据世界卫生组织统计,全球肥胖症患者达据世界卫生组织统计,全球肥胖症患者达3 3亿人,其中儿亿人,其中儿童占童占22002200万人,万人,1111亿人体重过重。肥胖症和体重超常早已不是发亿人体重过重。肥胖症和体重超常早已不是发达国家的达国家的“专利专利”,已遍及五大洲。目前,全球因,已遍及五大洲。目前,全球因”吃吃”致病乃致病乃至死亡的人数已高于因饥饿死亡的人数。至死亡的人数已高于因饥饿死亡的人数。(引自引自光明日报光明日报刘军刘军/文)文
5、)问题问题:肥胖症和体重超常与死亡人数真有显著的数量关系吗肥胖症和体重超常与死亡人数真有显著的数量关系吗?这些类型的问题可以运用相关分析与回归分析的方法去解决。这些类型的问题可以运用相关分析与回归分析的方法去解决。实例实例2:全球吃死的人比饿死的人多全球吃死的人比饿死的人多?2022-8-966.1 相关分析相关分析7.1.1 相关关系的概念相关关系的概念客观现象之间的数量依存关系,可以分为:客观现象之间的数量依存关系,可以分为:一种是函数关系一种是函数关系;一种是相关关系。一种是相关关系。1.函数关系与相关关系函数关系与相关关系7.1.1 相关关系的概念相关关系的概念7.1.1 相关关系的概
6、念相关关系的概念6.1.1 相关关系的概念相关关系的概念2022-8-971)函数关系)函数关系是一一对应的确定关系;是一一对应的确定关系;当一个或几个变量取一定的值时,另一个变量有确定值当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。与之相对应,我们称这种关系为确定性的函数关系。可以用数学分析的方法去研究可以用数学分析的方法去研究一般情况下确定性函数关系可表示为一般情况下确定性函数关系可表示为:y=f(x),其中其中 x 称为自变量,称为自变量,y 称为因变量称为因变量一个自变量,各观测点落在一条线上一个自变量,各观测点落在一条线上 2022-8
7、-982022-8-992)相关关系)相关关系(correlation)当一个或几个相互联系的变量取一定数值时,与之当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系。称为具有不确定性的相关关系。用相关与回归分析方法研究用相关与回归分析方法研究 这种关系有二个明显特点:这种关系有二个明显特点:1 1)现现象之间确实存在数量上的依存关系,即某一社象之间确实存在数量上的依存关系,即某一社会经济现象变化
8、要引起另一社会经济现象的变化;会经济现象变化要引起另一社会经济现象的变化;2 2)现现象之间的这种依存关系是不严格的,即无法象之间的这种依存关系是不严格的,即无法用数学公式严格表示。用数学公式严格表示。2022-8-910一般可表示为一般可表示为 Y=f(X,u)(u为随机变量为随机变量)当变量当变量 x 取某个值时,变量取某个值时,变量 y 的取值可能有几个的取值可能有几个各观测点分布在直线周围各观测点分布在直线周围(一个自变量)(一个自变量)2022-8-9112022-8-912函数关系和相关关系,在一定条件下是可函数关系和相关关系,在一定条件下是可以互相转化的以互相转化的函数关系函数关
9、系存在观测误差存在观测误差相关关系相关关系规律性认识规律性认识2022-8-9132.相关关系的种类相关关系的种类(1)从涉及的变量数量看从涉及的变量数量看 简单相关:两个现象的相关简单相关:两个现象的相关 多重相关(复相关):三个或三个以上多重相关(复相关):三个或三个以上(2)从变量相关关系的表现形式看)从变量相关关系的表现形式看 线性相关线性相关散布图接近一条直线散布图接近一条直线 非线性相关非线性相关散布图接近一条曲线散布图接近一条曲线2022-8-914(3)从变量相关关系变化的方向看从变量相关关系变化的方向看 正相关正相关两个变量同方向变化两个变量同方向变化 同增同减同增同减 负相
10、关负相关两个变量反方向变化两个变量反方向变化 一增一减一增一减 2022-8-915(4)从变量相关的程度看)从变量相关的程度看 完全相关完全相关 不相关不相关 不完全相关不完全相关 2022-8-9163.相关关系的描述相关关系的描述对现象变量之间是否存在相关关系以及存对现象变量之间是否存在相关关系以及存在怎样的相关关系进行分析、作出判断,这是进在怎样的相关关系进行分析、作出判断,这是进行相关分析的前提。通过编制相关表和相关图,行相关分析的前提。通过编制相关表和相关图,可以直观地、大致地判断现象变量之间是否存在可以直观地、大致地判断现象变量之间是否存在相关关系以及关系的类型。相关关系以及关系
11、的类型。2022-8-917 简简单单相相关关表表 根根据据总总体体单单位位的的原原始始资资料料汇汇编编的的相相关关表表分分组组相相关关表表 将将原原始始资资料料进进行行分分组组而而编编制制的的相相关关表表单单变变量量分分组组表表 按按自自变变量量分分组组 双双变变量量分分组组表表 按按自自变变量量和和因因变变量量均均分分组组相关表是表现现象变量之间相关关系的表格。相关表是表现现象变量之间相关关系的表格。是根据自变量大小的顺序进行排列所编制的表。是根据自变量大小的顺序进行排列所编制的表。(1)相关表)相关表2022-8-918编号编号人均月销售额人均月销售额(千元千元)利润率利润率()1234
12、567891013345667783.06.26.68.110.412.612.316.316.818.5例例1 1简单相关表:简单相关表:自变量的值从小到大顺序排列,因变自变量的值从小到大顺序排列,因变量的值一一对应平行排列编制。量的值一一对应平行排列编制。为研究商店人均月销售额为研究商店人均月销售额和利润率的关系,调查和利润率的关系,调查10家商店取得家商店取得10对数据,以人均销对数据,以人均销售额为自变量,利润率为因变量,编制简单相关表售额为自变量,利润率为因变量,编制简单相关表2022-8-919所谓相关图,是把相关的两个变量之间的关系所谓相关图,是把相关的两个变量之间的关系在平面直
13、角坐标在平面直角坐标(第一象限第一象限)中反映出来。通常将自变中反映出来。通常将自变量量(x)置于横轴上,因变量置于横轴上,因变量(y)置于纵轴上,而将两个变置于纵轴上,而将两个变量相对应的变量值用坐标点形式描绘出来。相关图就量相对应的变量值用坐标点形式描绘出来。相关图就是用相关点的分布状况来描述相关关系的,所以又称是用相关点的分布状况来描述相关关系的,所以又称为为散点图散点图。根据相关图,可以直观地看出变量之间相。根据相关图,可以直观地看出变量之间相关关系的模式。关关系的模式。(2)相关图)相关图2022-8-920例如,前述人均月销售额与利润率的关系,例如,前述人均月销售额与利润率的关系,
14、可用相关图表示如下:可用相关图表示如下:利润率利润率(%)人均销售额人均销售额(千元千元)120人均销售额与利润率相关图人均销售额与利润率相关图5101523845672022-8-921 x与与y的一些可能关系的散点图的一些可能关系的散点图2022-8-922相关分析的作用相关分析的作用1.1.确定现象之间是否确有依存关系,这是相关分析的确定现象之间是否确有依存关系,这是相关分析的前提。前提。2.确定相关关系的表现形式。是直线相关,还是曲线确定相关关系的表现形式。是直线相关,还是曲线相关,这是相关分析的出发点;相关,这是相关分析的出发点;3.3.研究现象之间关系的密切程度和方向,并检验其有研
15、究现象之间关系的密切程度和方向,并检验其有效性。效性。2022-8-923 图表形式虽然能直观的展现变量之间的图表形式虽然能直观的展现变量之间的相关关系,但是对变量相关关系及相关程度相关关系,但是对变量相关关系及相关程度的描述不够精确。的描述不够精确。在统计学中,对不同类型的变量数据,在统计学中,对不同类型的变量数据,常采用各种相关系数来具体度量变量间相关常采用各种相关系数来具体度量变量间相关的程度。的程度。l简单线性相关系数;简单线性相关系数;lSpearman等级相关系数;等级相关系数;6.1.2 相关系数相关系数2022-8-924 简单线性相关系数是在直线相关条件简单线性相关系数是在直
16、线相关条件下,表明两个现象之间相关关系的方向和密下,表明两个现象之间相关关系的方向和密切程度的综合性指标。切程度的综合性指标。这种相关系数是最常用的,简称为相关这种相关系数是最常用的,简称为相关系数。系数。总体相关系数总体相关系数样本相关系数样本相关系数 r1.简单线性相关系数简单线性相关系数2022-8-925 (,)()()Cov X YVar X Var Y总体相关系数反映总体两个变量总体相关系数反映总体两个变量X 和和Y 的线性相关程度。的线性相关程度。对于所研究的总体,表示两个相互联系变量对于所研究的总体,表示两个相互联系变量相关程度的总体相关系数为:相关程度的总体相关系数为:总体相
17、关系数总体相关系数2022-8-926特点:特点:p 对于特定的总体来说,对于特定的总体来说,X和和Y的数值是的数值是既定的,总体相关系数是客观存在的特既定的,总体相关系数是客观存在的特定数值。表现为一个常数。定数值。表现为一个常数。p 一般不可能直接观测总体的两个变量一般不可能直接观测总体的两个变量的全部数值,所以总体相关系数一般是的全部数值,所以总体相关系数一般是不知道的。不知道的。2022-8-927 样本相关系数样本相关系数 通过通过X和和Y 的样本观测值去计算样本相关系数。的样本观测值去计算样本相关系数。变量变量X和和Y 的样本相关系数通常表示用的样本相关系数通常表示用 :XYrXY
18、r两个变量的协方差。两个变量的协方差。与与因变量数列的标准差;因变量数列的标准差;自变量数列的标准差;自变量数列的标准差;资料项数资料项数相关系数;相关系数;式中:式中:YXNrYYNXXNYYXXNrXYYXYXXYXY 2222;)(1)(1)()(1 2022-8-928为便于计算,相关系数可用下式计算:为便于计算,相关系数可用下式计算:)()()(2222 iiiiiiiiYYnXXnYXYXnr代入公式计算代入公式计算相关系数相关系数:(做表格(做表格)编编号号XYXYX2Y21合合计计YX2YXY2X2022-8-929特点:特点:样本相关系数是根据从总体中抽取的随机样样本相关系数
19、是根据从总体中抽取的随机样本的观测值计算出来的,是对总体相关系数的估本的观测值计算出来的,是对总体相关系数的估计,它是个随机变量。计,它是个随机变量。2022-8-930为研究美国软饮料公司的广告费用为研究美国软饮料公司的广告费用X和销售数量和销售数量Y的关系,的关系,分析分析7种主要品牌公司的有关数据种主要品牌公司的有关数据品牌名称品牌名称广告费用广告费用X/百万百万美元美元销售数量销售数量Y/百万百万箱箱Coca-Cola131.31929.2Pepsi-Cola92.41384.6Diet-Coke60.4811.4Sprite55.7541.5Dr.Pepper40.2546.9Mou
20、tain Dew29.0535.67-up11.6219.5例例2022-8-931编号编号广告费用广告费用x销售数量销售数量yXYX2Y21131.31929.2253303.9617239.693721812.64292.41384.6127937.048537.761917117.16360.4811.449008.563648.16658369.96455.7541.530161.553102.49293222.25540.2546.921985.381616.04299099.61629.0535.615532.4841286867.36711.6219.52546.2134.564
21、8180.25合计合计420.65968.7500475.0935119.77224669.23978148.07.596823.722466976.4207.3511977.59686.42009.5004757)()(222222 YYNXXNYXXYNr2022-8-932对相关系数对相关系数 r 的解释:的解释:(1)相关系数的取值在相关系数的取值在-1与与1之间。之间。(2)当当r=0时,表明时,表明X与与Y没有线性相关关系。没有线性相关关系。注意:注意:r是对变量之间线性相关关系的度量。是对变量之间线性相关关系的度量。r=0只是表明两只是表明两个变量之间个变量之间不存在线性关系不存
22、在线性关系,它并不意味着,它并不意味着X 与与Y 之间不之间不存在其他类型的关系。可能存在非线性关系。存在其他类型的关系。可能存在非线性关系。2022-8-933(3)在大多数情况下,在大多数情况下,X与与Y 的样本观测值之间存在着一定的的样本观测值之间存在着一定的线性关系。即线性关系。即 0r 0 表明表明X与与Y 为正相关为正相关;若若 r 0 表明表明X与与Y 为负相关为负相关。2022-8-934(4)当当r=1 时,表明时,表明X与与Y完全线性相关完全线性相关:若若r=1,称,称X与与Y完全正相关;完全正相关;若若r=-1,称,称X与与Y完全负相关。完全负相关。一般标准:一般标准:0
23、.8 r 1,表示高度相关;,表示高度相关;0.5 r 0.8,表示中度相关;,表示中度相关;0.3 r 0.5,表示低度相关;,表示低度相关;0 r 0.3,表示相关关系很弱,基本可以认,表示相关关系很弱,基本可以认为没有线性相关关系。为没有线性相关关系。注:这样的说明必须建立在通过显著性检验的基础上。注:这样的说明必须建立在通过显著性检验的基础上。2022-8-935相关系数相关系数(取值及其意义取值及其意义)2022-8-936使用相关分析的注意事项使用相关分析的注意事项 X和和Y 都是相互对称的随机变量,所以都是相互对称的随机变量,所以 相关系数只反映变量间的线性相关程度,不能说相关系
24、数只反映变量间的线性相关程度,不能说明非线性相关关系。明非线性相关关系。相关系数不能确定变量的因果关系,也不能说明相关系数不能确定变量的因果关系,也不能说明相关关系具体接近于哪条直线。不能从一个变量的相关关系具体接近于哪条直线。不能从一个变量的变化去推测另一个变量的具体变化。变化去推测另一个变量的具体变化。YXXYrr 进行相关分析要有实际意义。进行相关分析要有实际意义。2022-8-937注意:相关关系注意:相关关系因果关系!因果关系!典型的错误推断:典型的错误推断:统计分析表明,庆祝生日次数越多的人越长寿。因此,统计分析表明,庆祝生日次数越多的人越长寿。因此,庆祝生日有利于健康。庆祝生日有
25、利于健康。调查表明,世界各国人均电视机拥有量与预期寿命存在调查表明,世界各国人均电视机拥有量与预期寿命存在很强的正相关性。因此,电视机拥有量越高,预期寿命很强的正相关性。因此,电视机拥有量越高,预期寿命越长。越长。对小学各年级学生的抽样调查表明,学生的识字水平与对小学各年级学生的抽样调查表明,学生的识字水平与他们鞋子的尺寸高度正相关。因此,学生穿的鞋越大,他们鞋子的尺寸高度正相关。因此,学生穿的鞋越大,他的识字水平就越高。他的识字水平就越高。2022-8-9382.相关系数的显著性检验相关系数的显著性检验 为什么要检验?为什么要检验?样本相关系数是随抽样而变动的随机变量样本相关系数是随抽样而变
展开阅读全文