《回归分析的基本思想及其初步应用》培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《回归分析的基本思想及其初步应用》培训课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归分析的基本思想及其初步应用 回归 分析 基本 思想 及其 初步 应用 培训 课件
- 资源描述:
-
1、1.1回归分析的基本思想及其初步应用高中数学选修选修1-2选修选修1-21-2统计案例统计案例5.引入线性回归模型引入线性回归模型ybxae6.了解模型中随机误差项了解模型中随机误差项e产产生的原因生的原因7.了解相关指数了解相关指数 R2 和模型拟和模型拟合的效果之间的关系合的效果之间的关系8.了解残差图的作用了解残差图的作用9.利用线性回归模型解决一类利用线性回归模型解决一类非线性回归问题非线性回归问题10.正确理解分析方法与结果正确理解分析方法与结果 比必修3中“回归”增加的内容数学数学统计统计1.画散点图画散点图2.了解最小二乘法了解最小二乘法的思想的思想3.求回归直线方程求回归直线方
2、程ybxa4.用回归直线方程用回归直线方程解决应用问题解决应用问题.两个变量间的相关关系两个变量间的相关关系 自变量取值一定时,因变量的取值带有一定随机性的两个自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做变量之间的关系叫做相关关系相关关系(正相关、负相关)(正相关、负相关)相关关系与函数关系的异同点:相关关系与函数关系的异同点:相关关系相关关系函数函数相同点相同点不同点不同点对具有相关关系的两个变量进行统计分析的方法叫对具有相关关系的两个变量进行统计分析的方法叫回归分析回归分析 均是指两个变量的关系均是指两个变量的关系 非确定关系非确定关系 确定的关系确定的关系一、复习
3、回顾:一、复习回顾:复习回顾复习回顾.研究两个变量间的相关关系的方法和步骤研究两个变量间的相关关系的方法和步骤()、画散点图,并判断二者之间是否有线性关系;()、画散点图,并判断二者之间是否有线性关系;()、()、预报和决策。预报和决策。()、建立并求出回归直线方程;()、建立并求出回归直线方程;abxy .y )()(2121121xbyaxnxxnyxxxyyxxbniiniiiniiniii其中其中 3.求线性回归方程的步骤求线性回归方程的步骤:复习回顾复习回顾abxy (1)(1)计算平均数计算平均数(2)(2)计算计算 与与 的积的积,求求(3)(3)计算计算(4)(4)将上述有关结
4、果代入公式,求将上述有关结果代入公式,求b b、a a,写出回归直线方程写出回归直线方程 ,xyixiy1niiix y niix12例例1 1 从某大学中随机选取名女大学生,其身从某大学中随机选取名女大学生,其身高和体重数据如表所示:高和体重数据如表所示:编号编号1 12 23 34 45 56 67 78 8身高身高/cm/cm165165 165165 157157 170170 175175 165165 155155 170170体重体重/kg/kg48485757505054546464616143435959求根据女大学生的身高预报体重的回归方程,求根据女大学生的身高预报体重的回
5、归方程,并并预报一名身高为预报一名身高为172cm的女大学生的体重。的女大学生的体重。()、画散点图,并判断二者之间是否有线性关系;()、画散点图,并判断二者之间是否有线性关系;()、建立并求出回归直线方程;()、建立并求出回归直线方程;()、()、预报和决策。预报和决策。712.85849.0 xy)(316.60712.85172849.0172kgyx时,当练习练习:假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费和所支出的维修费用用 y(万元),有如下的统计资料。(万元),有如下的统计资料。使用年限使用年限x 23456维修费用维修费用y 2.23.85.56.57.
6、0若由资料知若由资料知,y对对x呈线性相关关系。试求:呈线性相关关系。试求:(1)线性回归方程)线性回归方程 ;(2)估计使用年限为)估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?ybxa解:解:(1)由已知数据制成表格。)由已知数据制成表格。12345合计合计23456202.23.85.56.57.0254.411.422.032.542.0112.349162536904;5;xy5521190;112.3.iiiiixx yixiyiix y2ixi1.23,0.08.ba1.230.08.yx所以有所以有(2)当)当x=10时,时,万元)(38.12 y4、思考:、思
7、考:、身高为、身高为172cm的女大学生的体重一定是的女大学生的体重一定是60.316kg吗?吗?、为什么根据得到的一次函数求出的结论不一定、为什么根据得到的一次函数求出的结论不一定是实际值?产生误差的原因是什么?是实际值?产生误差的原因是什么?二、新课:二、新课:、从散点图中可以看出,样本点散布在某一条直线、从散点图中可以看出,样本点散布在某一条直线的附近,而不是一条直线,所以不能用一次函数的附近,而不是一条直线,所以不能用一次函数y=bx+ay=bx+a来描述它们之间的关系。这时我们可以用下列来描述它们之间的关系。这时我们可以用下列回归模型回归模型y=bx+a+ey=bx+a+e来表示。来
8、表示。我们把自变量我们把自变量x x称作称作解释变量解释变量,因变量,因变量y y称作称作预报预报变量变量,e e称作称作随机误差随机误差、函数模型、函数模型y=bx+a与线性回归模型与线性回归模型y=bx+a+e的关系:的关系:(1)、线性回归模型、线性回归模型y=bx+a与我们熟悉的一次函数模与我们熟悉的一次函数模型的不同之处是增加了型的不同之处是增加了随机误差随机误差e,因为变量,因为变量y的的值由自变量值由自变量x和随机误差和随机误差e共同确定。即共同确定。即自变量自变量x只只解释部分解释部分y的变化的变化。(2)、当线性回归模型:、当线性回归模型:y=bx+a+e理想化时,即所在理想
9、化时,即所在的遗传因素一样、所有的生活方式一样、所有的的遗传因素一样、所有的生活方式一样、所有的测量都没有误差测量都没有误差,此时,此时e=0,线性回归模型,线性回归模型就变成了函数模型。因此,一次函数模型是线性就变成了函数模型。因此,一次函数模型是线性回归模型的回归模型的特殊形式特殊形式,线性回归模型是一次函数,线性回归模型是一次函数模型的模型的一般形式一般形式。、在实际应用中,我们用回归方程、在实际应用中,我们用回归方程中的中的 来估计线性回归模型来估计线性回归模型 中的中的 ,由于,由于 ,所以,所以也是一个估计值。也是一个估计值。axby y eabxy abx )(abxye yye
10、 对于样本点对于样本点),(),(),(2211nnyxyxyx而言,它们的随机误差分别为:而言,它们的随机误差分别为:)2,1()(niabxyeiii 其估计值为:其估计值为:)2,1()(niaxbyyyeiii 称估计值称估计值 为相应点为相应点 的的e),(iiyx残差残差、当我们求出回归直线方程后,可以通过、当我们求出回归直线方程后,可以通过残差残差来来判断模型拟合程度的效果,判断原始数据中是否存在判断模型拟合程度的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为可疑数据,这方面的分析工作称为残差分析残差分析。从两个。从两个方面说明:方面说明:(1)、残差图残差图(以例为
11、例)(以例为例)对照女大学生的身高和体重的原始数据,结合求出的回归直线方对照女大学生的身高和体重的原始数据,结合求出的回归直线方程,求出相应的残差数据程,求出相应的残差数据编号编号 身高身高165165165165157157170170175175165165155155170170体重体重48485757505054546464616143435959残差残差-6.3732.6272.419-4.6181.1376.627-2.8830.382根据表格中的数据,以样本编号为横坐标,残差值为纵坐标,根据表格中的数据,以样本编号为横坐标,残差值为纵坐标,做出散点图(这样的散点图称作做出散点图(
12、这样的散点图称作残差图残差图)、若残差点比、若残差点比较均匀地落在水较均匀地落在水平的带状区域中,平的带状区域中,说明选用模型较说明选用模型较好,且带状区的好,且带状区的宽度越窄,说明宽度越窄,说明拟合精度越高,拟合精度越高,回归方程的预报回归方程的预报精度越高。精度越高。、若个别点的残差较大,要考虑采集样本的过程中是否有人为、若个别点的残差较大,要考虑采集样本的过程中是否有人为错误。错误。(2)、相关指数、相关指数 niiniiiyyyyR12122)()(1R2越大,模型的拟合效果越好越大,模型的拟合效果越好、建立回归模型的基本步骤:、建立回归模型的基本步骤:(1)、确定研究对象,明确哪个
13、变量是解释变量,哪、确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;个变量是预报变量;(2)、画出确定好的解释变量和预报变量的散点图,、画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系);观察它们之间的关系(如是否存在线性关系);(3)、确定回归模型,按一定的规则求出回归方程;、确定回归模型,按一定的规则求出回归方程;(4)、得出结果后进行残差分析。、得出结果后进行残差分析。例例 一个车间为了规定工时定额,需确定加工一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了零件所花费的时间,为此进行了10次试验,测得次试验,测得的数据列于表中:的数
展开阅读全文