概率统计Ⅰ课程第10章课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《概率统计Ⅰ课程第10章课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 课程 10 课件
- 资源描述:
-
1、 1信息管理学院信息管理学院 徐晔徐晔第第10章章 回归分析回归分析 2信息管理学院信息管理学院 徐晔徐晔 10.1 10.1 一元线性回归一元线性回归一、回归的概念一、回归的概念1885年年F.Galton(高尔登高尔登)选取了大量的豌豆种子选取了大量的豌豆种子,将将它们分成它们分成7个不同的重量组,然后说服住在各地的朋个不同的重量组,然后说服住在各地的朋友按照一致的指示种友按照一致的指示种70颗种子颗种子,每一重量组种每一重量组种10颗颗,连种两代连种两代,结果如下表结果如下表 种子直径种子直径(0.01英寸英寸)上一代上一代 15 16 17 18 19 20 21下一代下一代 15.4
2、 15.7 16.0 16.3 16.6 17 17.3注意到注意到:小个子豌豆的下一代没有上一代那么小小个子豌豆的下一代没有上一代那么小而大个子豌豆的下一代比上一代要小一些而大个子豌豆的下一代比上一代要小一些 3信息管理学院信息管理学院 徐晔徐晔F.Galton称这一现象为回复变异称这一现象为回复变异,他说他说:回复变异是理想平均子型回复变异是理想平均子型(下一代下一代)与父型与父型(上一代上一代)有差异的趋势使回复到可以粗糙地也许正确地称之有差异的趋势使回复到可以粗糙地也许正确地称之平均祖先型平均祖先型这就是回归现象这就是回归现象人类的身高也是如此人类的身高也是如此 4信息管理学院信息管理
3、学院 徐晔徐晔二、一元线性回归模型二、一元线性回归模型miXYi,2,1,和和设设具具有有相相关关关关系系的的变变量量称称为为解解释释变变量量的的量量是是可可以以控控制制或或精精确确观观测测其其中中,iX的的值值不不能能确确定定取取一一固固定定值值时时但但变变化化的的量量是是依依赖赖YXXYii,的的概概率率分分布布并并可可以以确确定定是是一一个个随随机机变变量量不不过过YY,记为记为的函数的函数并且是并且是有关有关与与的数学期望的数学期望,iiXXEYy),(21mxxxfEY 的的关关系系与与来来描描述述因因此此可可用用函函数数imxyxxxfy),(21 5信息管理学院信息管理学院 徐晔
4、徐晔的的回回归归方方程程对对称称为为mmxxxyxxxfy,),(2121 yY 令令 ),(21mxxxfY则则有有称称为为随随机机扰扰动动项项的的回回归归模模型型对对上上式式称称为为,21mxxxY 6信息管理学院信息管理学院 徐晔徐晔yx和和若若考考虑虑两两个个变变量量之之间间具具有有线线性性相相关关关关系系和和且且假假定定yx一元线性回归方程为一元线性回归方程为)(xfy 一元线性回归模型为一元线性回归模型为 )(xfYx10 x10称为回归系数称为回归系数10,1010,的的估估计计量量(值值)若若根根据据样样本本得得到到xy10 则则称称方方程程的的样样本本线线性性回回归归方方程程
5、对对为为xy 7信息管理学院信息管理学院 徐晔徐晔三、样本线性回归方程的建立三、样本线性回归方程的建立1.散点图散点图例例1.考察某种纤维的强度与其拉伸倍数的关系考察某种纤维的强度与其拉伸倍数的关系,下表是下表是实际测定的实际测定的24个纤维样品的强度与相应的拉伸倍数的个纤维样品的强度与相应的拉伸倍数的记录记录:iiyxiiyx 8信息管理学院信息管理学院 徐晔徐晔1234567891012345678912345678910123456789纤维强度随拉伸纤维强度随拉伸倍数增加而增加倍数增加而增加关关系系应应是是线线性性关关系系与与拉拉伸伸倍倍数数的的主主要要因因此此可可以以认认为为强强度度
6、y并且并且24个点大致分个点大致分布在一条直线附近布在一条直线附近xy10 即即xy8587.01505.0 事实上事实上,用用最小二乘法最小二乘法可以得到线性回归方程可以得到线性回归方程 9信息管理学院信息管理学院 徐晔徐晔2.最小二乘法最小二乘法ninyxyxii,2,1,),(,个样本点个样本点为为假定假定和和对变量对变量xyxy10 的回归方程的回归方程对对要求要求10,即求回归系数即求回归系数但几乎不可能但几乎不可能1010,的的估估计计出出因因此此可可以以利利用用样样本本点点做做xy10 从而得到回归方程的估计从而得到回归方程的估计上式称为样本回归方程上式称为样本回归方程其图象称为
7、样本回归直线其图象称为样本回归直线 10信息管理学院信息管理学院 徐晔徐晔尽尽可可能能接接近近与与样样本本点点希希望望样样本本回回归归直直线线),(10iiyxxy ),(iiyxixiyxy10iy 为此引入以下概念为此引入以下概念:残差残差:iiyy 回回归归直直线线偏偏离离程程度度与与描描述述样样本本点点),(iiyx残差平方和残差平方和SSE niiiyyQSSE12)(描述样本回归直线与所有样本点的拟合程度描述样本回归直线与所有样本点的拟合程度 11信息管理学院信息管理学院 徐晔徐晔残差平方和越小,拟合得就越好残差平方和越小,拟合得就越好最最小小使使因因此此要要求求SSE,10 ni
8、iiyyQSSE12)(niiixy1210)(求求偏偏导导和和对对的的最最小小值值为为求求残残差差平平方方和和10,QQ niiixyQ1100)(2 niiiixxyQ1101)(2 12信息管理学院信息管理学院 徐晔徐晔令偏导数为零令偏导数为零,得得0)(21100 niiixyQ 0)(21101 niiiixxyQ niiniiyxn1110 niiiniiniiyxxx112110 niix1乘乘以以加加n乘乘以以 13信息管理学院信息管理学院 徐晔徐晔 niixnx11记记 niiyny11iniiniiniininiiyxnyxxnxi 11112211)(niiniixnyn
展开阅读全文