8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《8.2.2一元线性回归模型参数的最小二乘估计ppt课件-2022新人教A版(2019)《高中数学》选择性必修第三册.ppt》由用户(Q123)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学 8.2 一元 线性 回归 模型 参数 最小 估计 ppt 课件 _2022 新人 2019 选择性 必修 第三 下载 _选择性必修 第三册_人教A版(2019)_数学_高中
- 资源描述:
-
1、 8.2.2 一元线性回归模型 参数的最小二乘估计 高二数学选择性必修 第三册 第八章 成对数据的统计分析学习目标1.通过用数学方法刻画散点与直线接近的程度,体会一元线性回归模型参数的最小二乘估计原理,能推导参数估计公式;2.通过对残差和残差图的分析,能用残差判断一元线性回归模型的有效性.3.核心素养:直观想象、数据分析、数学运算.一、回顾旧知1.一元线性回归模型2,()0,().YbxaeE eD e 2.一元线性回归模型与函数模型的区别Y称为因变量或响应变量x称为自变量或解释变量e是Y与bx+a之间的随机误差a称为截距参数b称为斜率参数二、探究新知1.问题1.为了研究两个变量之间的相关关系
2、,我们建立了一元线性回归模型表达式 刻画的是变量Y与变量x之间的线性相关关系,其中参数a和b未知,我们能否通过样本数据估计参数a和b?2,()0,().YbxaeE eD e 与函数不同,回归模型的参数一般是无法精确求出的,只能通过成对样本数据估计这两个参数.参数a和b刻画了变量Y与变量x的线性关系,因此通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.2问题2.我们怎样寻找一条“最好”的直线,使得表示成对样本数据的这些散点在整体上与这条直线最“接近”?从成对样本数据出发,用数学的方法刻画“从整体上看,各散点与直线最接近”利用点到直
3、线y=bx+a的“距离”来刻画散点与该直线的接近程度,然后用所有“距离”之和刻画所有样本观测数据与该直线的接近程度.父亲身高/cm180175170165160160165 170 175 180 185 190儿子身高/cm 185 父亲身高/cm180175170165160160165 170 175 180 185 190儿子身高/cm 185 我们设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),(xn,yn)父亲身高/cm180175170165160160165 170 175 180 185 190儿子身高/cm 185(1,2,3,-).iiii
4、iiiiiiiybxae inybxaeexyxbxa由),得(显然越小,表示点,与点,的距离越小,0,.iiix y即样本数据点离直线y=bx+a的竖直距离越小,如上图特别地,当e时,表示点在这条直线上1-)niiiybxa因此可用(来刻画各样本观测数据与直线y=bx+a的整体接近程度.iixy,y=bx+aiixbxa,1|()|niiiybxa21(,)()niiiQ a bybxa残差平方和:求a,b的值,使Q(a,b)最小1111,nniiiixx yynn记221122112112()()()()(,)()()()()()2()()()nniiiiiinniiiiiiniiinii
5、iybxaybxaybxayyyyb xQ a by bxy bxb xxy bxayyb xxn y baabxxyx1111()()()()()()()()()()()()0nniiiiiinniiiiyyb xxy bxay bx ayyb xxy bx ayybxxy bx any nyb nx nx221()()(,)niiiyyb xxQ an ybxab2(,)()0=Q a bn ybxaa ybx当取最小时,取最小值,即21112122(,)()(2()()()=b()nnniiiiiniiiiiQ a bxyyb xxxxyxbyyy此时,上式是关于b的二次函数,因此要使Q
6、取得最小值,当且仅当b的取值为121()()()niiiniixxyybxxybxa .,的最小二乘估计叫做求得abab(,).x y经验回顾直线必经过符号相同与rb3.最小二乘法 我们将 称为Y 关于x 的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫最小二乘法ybxa 1122211()()()nniiiiiinniiiixxyyx ynxybxxxnx aybx 4.问题2:依据用最小二乘估计一元线性回归模型参数的公式,求出儿子身高Y关于父亲身高x的经验回归方程.儿子的身高不一定会是177cm,这是因为还有其他影响儿子身高的因素,回归模型
7、中的随机误差清楚地表达了这种影响,父亲的身高不能完全决定儿子的身高,不过,我们可以作出推测,当父亲的身高为176cm时,儿子身高一般在177cm左右.1).当x=176时,,如果一位父亲身高为176cm,他儿子长大后身高一定能长到177cm吗?为什么?177y 0 83928 957 y.x.0.83928.957yx的意义?b2).根据经验回归方程 中斜率的具体含义,高个子的父亲一定生高个子的儿子吗?同样,矮个子的父亲一定生矮个子的儿子吗?根据经验回归方程 中斜率0.839可以解释为父亲身高每增加1cm,其儿子的身高平均增加0.839cm.由模型可以发现,高个子父亲x=185(cm),则0.
8、83928.957yx184.172 cm.y 我们可以通过残差 来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.12,neee(1)残差的定义,eabxY一元线性回归模型,Yy对于通过观测得响应到的数据 称量为变观测值,y通过经验回归方程得到称为预报值的.eyy残观测值减去预报值称为即差5.判断模型拟合的效果:残差分析作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据或体重估计值等,这样作出的图形称为残差图 从上面的残差图可以看出,残差有正有负,残差点比较均匀地分布在横轴的两边,可以判断样本数据基本满足一元线性回归模型对于随机误差的假设.所以,通过观察
9、残差图可以直观判断样本数据是否满足一元线性回归模型的假设,从而判断回归模型拟合的有效性.6.问题3:儿子身高与父亲身高的关系,运用残差分析所得的一元线性回归模型的有效性吗?一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.所以,只有图(4)满足一元线性回归模型对随机误差的假设图(1)显示残差与观测时间有线性关系,应将时间变量纳入模型;图(2)显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;图(3)说明残差的方差不是一个常数,随观测时间变大而变大根据一元线性回归模型中对随机误差的
10、假定,残差应是均值为0,方差为 的随机变量的观测值.27.观察以下四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?1.残差等于观测值减预测值;2.残差的平方和越小越好;3.原始数据中的可疑数据往往是残差绝对值过大的数据;4.对数据刻画效果比较好的残差 图特征:残差点比较均匀的集中在水平带状区域内1.关于残差图的描述错误的是()A.残差图的横坐标可以是样本编号 B.残差图的横坐标也可以是解释变量或预报变量 C.残差点分布的带状区域的宽度越窄相关指数越小 D.残差点分布的带状区域的宽度越窄残差平方和越小C三、巩固新知2.根据如下样本数据:得到的经验回归方程为 ,则则()A.0,
11、0A.0,0B.0,0,0 C.0 C.0D.0,0D.0,0 x23456Y42.5-0.5-2-3aaaabbbbybxaB 5.5,0.25xy25.51.417.5b 61()()24.5iiixx yy 21()17.5niixx7 95 abxy.3.某种产品的广告支出费用x(单位:万元)与销售额Y(单位:万元)的数据如表:已知Y关于x的经验回归方程为 =6.5x+17.5,则当广告支 出费用为5万元时,残差为_.x x2 24 45 56 68 8Y Y30304040606050507070yy当x=5时,=6.55+17.5=50,表格中对应y=60,于是残差为60-50=1
12、0.104.已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为()A.=1.5x+2 B.=-1.5x+2C.=1.5x-2 D.=-1.5x-2yyyyB编号123456胸径/cm18.120.122.224.426.028.3树高/m18.819.221.021.022.122.1编号789101112胸径/cm29.632.433.735.738.340.2树高/m22.422.623.024.323.924.71).例1.经验表明,对于同一树种,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径
展开阅读全文
链接地址:https://www.163wenku.com/p-3588377.html