2.1一元线性回归模型 课件高中数学人教A版(2019)选择性必修第三册.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《2.1一元线性回归模型 课件高中数学人教A版(2019)选择性必修第三册.pptx》由用户(四川天地人教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2.1一元线性回归模型 课件 高中数学人教A版2019选择性必修第三册 2.1 一元 线性 回归 模型 高中 学人 2019 选择性 必修 第三 下载 _选择性必修 第三册_人教A版(2019)_数学_高中
- 资源描述:
-
1、8.2.1一元线性回归模型一元线性回归模型8.2.2一元线性回归模型参数的最小二乘估计(一元线性回归模型参数的最小二乘估计(1)讲课人:邢启强2自变量取值一定时,因变量的取值带有一定随自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系机性的两个变量之间的关系,叫做相关关系. .相关关系的概念相关关系的概念2 2、相关关系与函数关系的异同点、相关关系与函数关系的异同点不同点不同点:函数关系是一种确定的关系,因果关系;而:函数关系是一种确定的关系,因果关系;而相关关系是一种非确定性关系,也可能是伴随关系。相关关系是一种非确定性关系,也可能是伴随关系。相同点相同点:均是指
2、两个变量的关系:均是指两个变量的关系相关关系相关关系当自变量取值一定当自变量取值一定, ,因变量的取值带有一定的因变量的取值带有一定的随机性(随机性( 非确定性关系非确定性关系) )函数关系函数关系-函数关系指的是自变量和因变量之间的关系函数关系指的是自变量和因变量之间的关系是相互唯一确定的是相互唯一确定的. .1 1、对相关关系的理解、对相关关系的理解复习引入复习引入讲课人:邢启强3散点图散点图1、散点图:将样本中n个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.2、分类:(1)正相关、负相关正相关:如果散点图的点散布在从左
3、下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也近似的由小变大,对于两个变量的这种相关关系,我们称为正相关负相关:如果散点图的点散布的位置是从在左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值也近似的由大变小,对于两个变量的这种相关关系,我们称为负相关.(2)线性相关和非线性相关两个变量之间相关关系的确定两个变量之间相关关系的确定(1).经验作出推断(2).通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断复习引入复习引入讲课人:邢启强4样本相关系数riiiiniii=1nn2222iii=1i=1ni=1nn22i=1i=1=x -xy
4、 -yxxyyx y -nxyx-nxy-ny=r (1)当r 0时,称成对样本数据正相关;当r 0时,称成对样本数据负相关(2)r的取值范围为-1,1 (3)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.获得总体中所有的成对数据往往是不容易的,因此,我们还是要用样本估计总体的思想来解决问题,也就是说,我们先要通过抽样获取两个变量的一些成对样本数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了解两个变量之间的相关程度,对于简单随机样本而言,样本具有随机性,因此样本相关系数r也具有随机性,一般地,样本容量越大,用样本相
5、关系数估计两个变量的相关系数的效果越好。复习引入复习引入讲课人:邢启强5通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等关,以及线性相关程度的强弱等.下面我们研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,下面我们研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并利用模型进行预测的问题并利用模型进行预测的问题.如果能像建立函数模型刻画两个变量之间的确定性
6、关系那样,通过建如果能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型刻画两个随机变量的相关关系,那么我们就可以利立适当的统计模型刻画两个随机变量的相关关系,那么我们就可以利用这个模型研究两个变量之间的随机关系,并通过模型进行预测用这个模型研究两个变量之间的随机关系,并通过模型进行预测.讲课人:邢启强6 问题问题1:生活经验告诉我们,儿子的身高与父亲的身高相关:生活经验告诉我们,儿子的身高与父亲的身高相关.一般来说,父亲的一般来说,父亲的身高较高时,儿子的身高通常也较高身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了为了进一步研究两者之间的关系,
7、有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表名男大学生的身高及其父亲的身高,得到的数据如表1所示所示.编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182160165170175180185190162164166168170172174176178180182184儿子身高/cm父亲身高/cm可以发现,散点大致分布在一条可以发现,散点大致分布在一条从左下角到右上角的直线附近,从左下角到右上角的
8、直线附近,表明儿子身高和父亲身高线性相表明儿子身高和父亲身高线性相关关. .利用统计软件,求得样本相利用统计软件,求得样本相关系数为关系数为r0.886r0.886,表明儿子身,表明儿子身高和父亲身高正线性相关,且相高和父亲身高正线性相关,且相关程度较高关程度较高。复习引入复习引入讲课人:邢启强7 问题问题2:根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?以用函数模型刻画吗?列表法是函数的一种表示方法,但并不是所有列表表示的数据都是函数关系,要成为函数关系必须满列表法是函数的一种表示方法,但并不是所有列表表示
9、的数据都是函数关系,要成为函数关系必须满足函数的定义,即应满足足函数的定义,即应满足“集合集合A中的任意一个数,在集合中的任意一个数,在集合B中都存在唯一的数与它对应中都存在唯一的数与它对应”.编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182表表中的中的数据,存在父亲身高相同而儿子身高不同的情况数据,存在父亲身高相同而儿子身高不同的情况.例如,第例如,第6个和第个和第8个观测父亲的身高均为个观测父亲的身高均
10、为172cm,而对应的儿子的身高为而对应的儿子的身高为176cm和和174cm;同样在第;同样在第3,4个观测中,儿子的身高都是个观测中,儿子的身高都是170cm,而父亲的身高,而父亲的身高分别为分别为173cm,169cm.可见儿子的身高不是父亲身高的函数同样父亲的身高也不是儿子身高的函数,所可见儿子的身高不是父亲身高的函数同样父亲的身高也不是儿子身高的函数,所以不能用函数模型来刻画以不能用函数模型来刻画.学习新知学习新知问题问题3:从成对样本数据的散点图和样本相关系数可以发现,散点大致分布在一条直线附近表明儿子身从成对样本数据的散点图和样本相关系数可以发现,散点大致分布在一条直线附近表明儿
11、子身高和父亲身高有较强的线性关系高和父亲身高有较强的线性关系.我们可以这样理解,由于有其他因素的存在,使儿子身高和父亲身高我们可以这样理解,由于有其他因素的存在,使儿子身高和父亲身高有关系但不是函数关系有关系但不是函数关系.那么影响儿子身高的其他因素是什么?那么影响儿子身高的其他因素是什么?影响儿子身高的因素除父亲的身外,还有母亲的身高、生活的环境、饮食习惯、营养水平、体育锻影响儿子身高的因素除父亲的身外,还有母亲的身高、生活的环境、饮食习惯、营养水平、体育锻炼等随机的因素,儿子身高是父亲身高的函数的原因是存在这些随机的因素炼等随机的因素,儿子身高是父亲身高的函数的原因是存在这些随机的因素.讲
12、课人:邢启强8 问题问题4:由问题由问题3我们知道,正是因为存在这些随机的因素,使得儿子的身高呈我们知道,正是因为存在这些随机的因素,使得儿子的身高呈现出随机性各种随机因素都是独立的,有些因素又无法量化现出随机性各种随机因素都是独立的,有些因素又无法量化.你能否考虑到这些随机因你能否考虑到这些随机因素的作用,素的作用,用类似于函数的表达式,表示儿子身高与父亲身高的关系吗?用类似于函数的表达式,表示儿子身高与父亲身高的关系吗?如果用如果用x表示父亲身高,表示父亲身高,Y表示儿子的身高,用表示儿子的身高,用e表示各种其他随机因素影响之和,称表示各种其他随机因素影响之和,称e为随机误差,由于儿子身高
13、与父亲身高线性相关,所以为随机误差,由于儿子身高与父亲身高线性相关,所以Y=bx+a.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差,模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随机的,如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.学习新知学习新知讲课人:邢启强9追问追问:为什么要假设为什么要假设E(e)=0,而不假设其为某个不为,而不假设其为某个不为0的常数?的常数?因为误差是随机的,即取各种正负误差的因
14、为误差是随机的,即取各种正负误差的可能性一样,所以它们可能性一样,所以它们均值的理想状态应该为均值的理想状态应该为0.思考:你能结合父亲与儿子身高的实例,说明回归模型思考:你能结合父亲与儿子身高的实例,说明回归模型的意义?的意义?2,( )0,( ).YbxaeE eD e 学习新知学习新知讲课人:邢启强10思考思考:你能结合父亲与儿子身高的实例,说明回归模型:你能结合父亲与儿子身高的实例,说明回归模型的意义?的意义?2,( )0,( ).YbxaeE eD e 问题问题5:你能结合具体实例解释产生模型中随机误差项的原因吗?你能结合具体实例解释产生模型中随机误差项的原因吗?(1 1)除父亲身高
15、外)除父亲身高外, ,其他可能影响儿子身高的因素其他可能影响儿子身高的因素, ,比如母亲身高、生活环境、饮食习惯和锻炼时间等比如母亲身高、生活环境、饮食习惯和锻炼时间等. .(2 2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差在测量儿子身高时,由于测量工具、测量精度所产生的测量误差. .(3 3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似关系也是产生随机误差来近似这种关系,这种近似关系也是产生随机误差e e的原因的原因. .产生随机误
16、差产生随机误差e e的原因有:的原因有:学习新知学习新知讲课人:邢启强11 问题问题6:为了研究两个变量之间的相关关系,我们建立了一元线性回归模型:为了研究两个变量之间的相关关系,我们建立了一元线性回归模型达式达式 刻画的是变量刻画的是变量Y与变量与变量x之间的线性相关关系,之间的线性相关关系,其中参数其中参数a和和b未知,我们能否通过样本数据估计参数未知,我们能否通过样本数据估计参数a和和b?2,( )0,( ).YbxaeE eD e 参数a和b刻画了变量Y与变量x的线性关系,因此通过样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.学
展开阅读全文