3.1 回归分析的基本思想及其初步应用.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《3.1 回归分析的基本思想及其初步应用.ppt》由用户(四川三人行教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 3.1 回归 分析 基本 思想 及其 初步 应用 下载 _其它资料_高考专区_数学_高中
- 资源描述:
-
1、数学数学 第三章第三章 统计案例统计案例 3.13.1 回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用 数学数学 目标导航目标导航 课标要求课标要求 1.1.通过对典型案例的探究通过对典型案例的探究, ,了解回归分析的基本思想、方法了解回归分析的基本思想、方法 及其初步应用及其初步应用. . 2.2.会求回归直线方程会求回归直线方程, ,并用回归直线方程进行预报并用回归直线方程进行预报. . 3.3.了解最小二乘法的思想方法了解最小二乘法的思想方法, ,理解回归方程与一般函数的理解回归方程与一般函数的 区别与联系区别与联系. . 素养达成素养达成 通过本节的学习通过本节的学习,
2、,培养数据分析、数学运算和数学建模的核培养数据分析、数学运算和数学建模的核 心素养心素养. . 数学数学 新知导学新知导学 素养养成素养养成 课堂探究课堂探究 素养提升素养提升 数学数学 1.1.线性回归模型线性回归模型 新知导学新知导学素养养成素养养成 (2)(2)对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),),(x,(xn n,y,yn n),),回归直线的斜率和回归直线的斜率和 截距的最小二乘估计分别为截距的最小二乘估计分别为b= = 1 2 1 ()() () n ii i n i i xx yy xx
3、 = = 1 2 2 1 n ii i n i i x ynx y xnx , ,a= =y- -bx, ,其中其中 称为样本点的中心称为样本点的中心. . 相关相关 (1)(1)回归分析是对具有回归分析是对具有 关系的两个变量进行统计分析的一关系的两个变量进行统计分析的一 种常用方法种常用方法. . ( (x, ,y) ) 数学数学 ( (3 3) )线性回归模型线性回归模型y=bx+a+e,y=bx+a+e,其中其中a a和和b b是模型的未知参数是模型的未知参数,e,e称为称为 ,x,x称为称为 ,y,y称为称为 . . 随机误差随机误差 解释变量解释变量 预报变量预报变量 思考思考 1
4、:1:线性回归方程线性回归方程y= =bx+x+a中中b的意义是什么的意义是什么? ?其中不随其中不随x x 的变化而变化的的变化而变化的 量是哪个量是哪个? ? 答案答案: :线性回归方程线性回归方程y= =a+ +bx x 中的中的b表示表示 x x 增加增加 1 1 个单位时个单位时, ,y的平均变化量的平均变化量 为为b, ,而而a表示表示y不随不随 x x 的变化而变化的量的变化而变化的量. . 数学数学 思考思考 2:2:对有线性相关关系的两个变量建立的回归直线方程对有线性相关关系的两个变量建立的回归直线方程y= =a+ +bx x 中中, ,回归回归 系数系数b能否为能否为 0?
5、0? 答案答案: :b=0=0 时时, ,两个变量不具有线性相关关系两个变量不具有线性相关关系, ,故故b0.0. 2.2.线性回归分析线性回归分析 (1)(1)残差的概念残差的概念 对于样本点对于样本点(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),),(x,(xn n,y,yn n) )而言而言, ,它们的随机误差为它们的随机误差为 e ei i= = , , i=1,2,i=1,2,n,n,其估计值为其估计值为 ie=y=yi i- - i y= = ,i=1,2,i=1,2,n,n,ie称为称为 相应于点相应于点(x(xi i,y,yi i) )的残差的残差. .
6、y yi i- -bxbxi i- -a a y yi i- -bx xi i- -a 数学数学 纵坐标纵坐标 (2)(2)残差图残差图 作图时作图时 为残差为残差, , 可以选为样本编号可以选为样本编号, ,或身高数或身高数 据据, ,或体重的估计值等或体重的估计值等, ,这样作出的图形称为残差图这样作出的图形称为残差图. .在残差图中在残差图中, ,残差点残差点 地落在水平的带状区域中地落在水平的带状区域中, ,说明选用的模型比较合适说明选用的模型比较合适, ,这样这样 的带状区域的宽度的带状区域的宽度 , ,说明模型拟合精度越高说明模型拟合精度越高, ,回归方程的预报回归方程的预报 精度
7、越高精度越高. . 横坐标横坐标 比较均匀比较均匀 越窄越窄 (3)(3)残差平方和残差平方和 残差平方和残差平方和 2 i 1 () n i i yy , ,残差平方和残差平方和 , ,模型拟合效果越好模型拟合效果越好. . 越小越小 数学数学 思考思考3:3:在画两个变量的散点图时在画两个变量的散点图时, ,预报变量在预报变量在x x轴上轴上, ,解释变量在解释变量在y y轴上吗轴上吗? ? 答案答案: :错误错误, ,由于预报变量的值可以类比为函数的函数值由于预报变量的值可以类比为函数的函数值, ,解释变量的值解释变量的值 可以类比为函数的自变量的取值可以类比为函数的自变量的取值, ,故
8、预报变量在故预报变量在y y轴上轴上, ,解释变量在解释变量在x x轴上轴上. . 3.3.建立回归模型的基本步骤建立回归模型的基本步骤 (1)(1)确定研究对象确定研究对象, ,明确哪个变量是明确哪个变量是 , ,哪个变哪个变 量是量是 . . 解释变量解释变量 预报变量预报变量 (2)(2)画出解释变量和预报变量的画出解释变量和预报变量的 , ,观察它们之间的关系观察它们之间的关系( (如如 是否存在线性关系等是否存在线性关系等).). 散点图散点图 数学数学 (3)(3)由经验确定回归方程的类型由经验确定回归方程的类型( (如观察到数据呈线性关系如观察到数据呈线性关系, ,则选用线性回归
9、则选用线性回归 方程方程y= =bx+x+a).). 残差图残差图 (4)(4)按一定规则按一定规则( (如最小二乘法如最小二乘法) )估计回归方程中的参数估计回归方程中的参数. . (5)(5)得出结果后分析得出结果后分析 是否有异常是否有异常( (如个别数据对应残差如个别数据对应残差 , , 残差呈现残差呈现 等等),),若存在异常若存在异常, ,则检查数据是否则检查数据是否 有误有误, ,或模型是否合适等或模型是否合适等. . 过大过大 不随机的规律性不随机的规律性 思考思考4:4:为什么在线性回归分析前必须先进行相关性检验为什么在线性回归分析前必须先进行相关性检验? ? 答案答案: :
10、因为具有相关关系是进行线性回归分析的前提因为具有相关关系是进行线性回归分析的前提, ,如果忽略了这一步如果忽略了这一步 骤骤, ,所求的回归方程无实际意义所求的回归方程无实际意义, ,所以在进行线性回归分析前必须进行相所以在进行线性回归分析前必须进行相 关性检验关性检验. . 数学数学 名师点津名师点津 残差图也是用来刻画回归效果的残差图也是用来刻画回归效果的, ,判断依据是判断依据是: :残差点比较均匀地分残差点比较均匀地分 布在水平带状区域中布在水平带状区域中, ,带状区域越窄带状区域越窄, ,说明模型拟合精度越高说明模型拟合精度越高, ,回归方程回归方程 预报精度越高预报精度越高. .
11、(1)(1)“R R 2 2、残差图”在回归分析中的作用 、残差图”在回归分析中的作用: : R R 2 2 是用来刻画回归效果的是用来刻画回归效果的, ,由由 R R 2 2=1 =1- - 2 1 2 1 () () n ii i n i i yy yy 可知可知 R R 2 2 越大越大, ,意味着残差意味着残差 平方和越小平方和越小, ,也就是说模型的拟合效果就越好也就是说模型的拟合效果就越好. . 数学数学 (2)(2)非线性回归分析非线性回归分析 非线性回归分析非线性回归分析 研究两个变量的关系时研究两个变量的关系时, ,我们常常根据样本数据作出散点图我们常常根据样本数据作出散点图
12、, ,观察散点观察散点 图中样本点的分布图中样本点的分布, ,从整体看从整体看, ,如果样本点没有分布在某一条直线附近如果样本点没有分布在某一条直线附近, , 我们就称这两个变量之间不具有线性相关关系我们就称这两个变量之间不具有线性相关关系, ,即非线性相关关系即非线性相关关系. . 若两个变量是非线性的相关关系若两个变量是非线性的相关关系, ,可以通过非线性函数进行拟合可以通过非线性函数进行拟合, ,其方其方 法是通过变换先将其转化成线性函数法是通过变换先将其转化成线性函数, ,利用最小二乘法得到线性回归方利用最小二乘法得到线性回归方 程再通过相应的变换程再通过相应的变换, ,得到非线性回归
13、方程得到非线性回归方程. . 常见的非线性回归模型及转化为线性模型的方法常见的非线性回归模型及转化为线性模型的方法 a.a.将幂函数将幂函数y=axy=axn n(a,n(a,n为常数为常数,a,x,y,a,x,y均为正值均为正值) )化为线性函数化为线性函数. .将将y=axy=axn n 两边取常用对数两边取常用对数, ,则有则有lg y=nlg x+lg a,lg y=nlg x+lg a,令令 =lg y,v=lg x,b=lg a=lg y,v=lg x,b=lg a代代 入上式得入上式得 =nv+b(=nv+b(其中其中n,bn,b是常数是常数),),其图象是一条直线其图象是一条直
14、线. . 数学数学 b.b.将指数函数将指数函数y=cay=cax x(a0,c0,a,c(a0,c0,a,c为常数为常数) )化为线性函数化为线性函数. .将将y=cay=cax x两边两边 取常用对数取常用对数, ,则有则有lg y=xlg a+lg c,lg y=xlg a+lg c,令令 =lg y,b=lg c,d=lg a,=lg y,b=lg c,d=lg a,代入代入 上式得上式得 =dx+b(d,b=dx+b(d,b是常数是常数),),它的图象是一条直线它的图象是一条直线. . c.c.将对数函数将对数函数y=a+bln x(a,by=a+bln x(a,b为常数为常数) )
15、化为线性函数化为线性函数, ,令令 =y,v=ln x,=y,v=ln x, 得线性函数得线性函数 =a+bv,=a+bv,它的图象是一条直线它的图象是一条直线. . 数学数学 课堂探究课堂探究素养提升素养提升 题型一题型一 回归直线方程回归直线方程 例例11 (2018(2018 临沂高二检测临沂高二检测) )下表提供了某厂节能降耗技术改造后生产下表提供了某厂节能降耗技术改造后生产 甲产品过程中记录的产量甲产品过程中记录的产量x(x(吨吨) )与相应的生产能耗与相应的生产能耗y(y(吨标准煤吨标准煤) )的几组的几组 对照数据对照数据: : x/x/吨吨 3 3 4 4 5 5 6 6 y/
16、y/吨标准煤吨标准煤 2.52.5 3 3 4 4 4.54.5 数学数学 (1)(1)请画出上表数据的散点图请画出上表数据的散点图; ; 解解: :(1)(1)由题设所给数据由题设所给数据, ,可得散点图如图可得散点图如图. . 数学数学 (2)(2)请根据上表提供的数据请根据上表提供的数据, ,用最小二乘法求出用最小二乘法求出 y y 关于关于 x x 的回归直线方程的回归直线方程y= =bx+x+a; ; 解解: :(2)(2)由数据由数据, ,计算得计算得: : 4 2 1 i i x =86,=86,x= = 3456 4 =4.5,=4.5,y= = 2.5344.5 4 =3.5
17、,=3.5, 又已知又已知 4 ii 1i x y =66.5,=66.5,由最小二乘法确定的回归方程的系数为由最小二乘法确定的回归方程的系数为: :b= = 4 1 4 2 2 1 4 4 ii i i i x yx y xx = = 2 66.544.53.5 8644.5 =0.7,=0.7,a= =y- -bx=3.5=3.5- -0.70.74.5=0.35,4.5=0.35,因此因此, ,所求的回归直线方所求的回归直线方 程为程为y=0.7x+0.35.=0.7x+0.35. 数学数学 (3)(3)已知该厂技改前已知该厂技改前100100吨甲产品的生产能耗为吨甲产品的生产能耗为90
18、90吨标准煤吨标准煤. .试根据试根据(2)(2) 求出的回归直线方程求出的回归直线方程, ,预测生产预测生产100100吨甲产品的生产能耗比技改前降低吨甲产品的生产能耗比技改前降低 多少吨标准煤多少吨标准煤? ? ( (参考数值参考数值:3:32.5+42.5+43+53+54+64+64.5=66.5)4.5=66.5) 解解: :(3)(3)由由(2)(2)的回归方程及技改前生产的回归方程及技改前生产100100吨甲产品的生产能耗吨甲产品的生产能耗, ,得降低得降低 的生产能耗为的生产能耗为9090- -(0.7(0.7100+0.35)=19.65100+0.35)=19.65吨标准煤
19、吨标准煤. . 数学数学 方法技巧方法技巧 求回归直线方程的三个步骤求回归直线方程的三个步骤 (1)(1)画散点图画散点图: :由样本点是否呈条状分布来判断两个量是否具有线性由样本点是否呈条状分布来判断两个量是否具有线性 相关关系相关关系. . (2)(2)求回归系数求回归系数: :若存在线性相关关系若存在线性相关关系, ,则求回归系数则求回归系数. . (3)(3)写方程写方程: :写出回归直线方程写出回归直线方程. .并利用回归直线方程进行预测说明并利用回归直线方程进行预测说明. . 数学数学 解析解析: :x= = 1 4 (0+1+3+4)=2,(0+1+3+4)=2,y= = 2.2
20、4.34.86.7 4 =4.5,=4.5,而回归直线方程过而回归直线方程过 样本点的中心样本点的中心(2,4.5),(2,4.5),所以所以a= =y- -0.950.95x=4.5=4.5- -0.950.952=2.6.2=2.6.故选故选 A.A. 即时训练即时训练1 1- -1:1:(2018(2018 南昌高二检测南昌高二检测) )已知已知x,yx,y的取值如表所示的取值如表所示: : x x 0 0 1 1 3 3 4 4 y y 2.22.2 4.34.3 4.84.8 6.76.7 若从散点图分析若从散点图分析,y,y 与与 x x 线性相关线性相关, ,且且y=0.95x+
21、=0.95x+a, ,则则a的值等于的值等于( ( ) ) (A)2.6(A)2.6 (B)6.3(B)6.3 (C)2(C)2 (D)4.5(D)4.5 数学数学 备用例题备用例题 某个服装店经营某种服装某个服装店经营某种服装, ,在某周内获纯利润在某周内获纯利润y(y(元元) )与该周与该周 每天销售这种服装件数每天销售这种服装件数x x之间的一组数据关系如表之间的一组数据关系如表: : x/x/件件 3 3 4 4 5 5 6 6 7 7 8 8 9 9 y/y/元元 6666 6969 7373 8181 8989 9090 9191 已知已知: : 7 2 1 i i x =280,
22、=280, 7 2 1 i i y =45 309,=45 309, 7 ii 1i x y x xi iy yi i=3 487.=3 487. 参考公式参考公式: :回归直线的方程是回归直线的方程是y= =bx+x+a, ,其中其中b= = 1 2 2 1 n ii i n i i x ynx y xnx , ,a= =y- -bx.x. 数学数学 解解: :(1)(1)x= = 3456789 7 =6,=6, y= = 66697381899091 7 = = 559 7 . . (1)(1)求求x, ,y; ; 数学数学 (2)(2)画出散点图画出散点图; ; 解解: :(2)(2)
23、散点图如图所示散点图如图所示. . 数学数学 (3)(3)求获纯利润求获纯利润y(y(元元) )与每天销售件数与每天销售件数x x之间的线性回归方程之间的线性回归方程. . 解解: :(3)(3)由散点图知由散点图知y y与与x x有线性相关关系有线性相关关系, ,设线性回归方程为设线性回归方程为y= =bx+x+a, , 因为因为 7 2 1 i i x =280,=280, 7 2 1 i i y =45 309,=45 309, 7 ii 1i x y =3 487,=3 487,x=6,=6,y= = 559 7 , , 所以所以b= = 559 348776 7 280736 = =
展开阅读全文