概率论与数理统计A1课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《概率论与数理统计A1课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 A1 课件
- 资源描述:
-
1、19.1 9.1 回归分析的概念回归分析的概念 9.2 9.2 一元线性回归一元线性回归 9.3 9.3 可可线性化的一元非线性回归线性化的一元非线性回归9.4 9.4 单因素试验方差分析单因素试验方差分析 回归分析及方差分析回归分析及方差分析 Ch92 “回归”一词的历史渊源“回归回归”一词最早由一词最早由Francis Galton引入。引入。十九世纪,英国生物学家兼统计学家高尔顿研究发现:十九世纪,英国生物学家兼统计学家高尔顿研究发现:其中其中x表示父亲身高,表示父亲身高,y 表示成年儿子的身高(单位:英表示成年儿子的身高(单位:英寸,寸,1英寸英寸=2.54厘米)。这表明子代的平均高度
2、有向中心厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。归分析的思想渗透到了数理统计的其它分支中。xy516.073.3339.19.1回归分析的基本概念回归分析的基本概念变量之间的关系确定性关系非确定性关系(相关关系)4 正相关 线性相关 不相关 相关系数:统计依赖关系 负相关 11XY 有因果关系 回回归归分分析析 正相关 无因果关系 相相关关分分析析 非线性相关 不相关 负相关对变量间对变量间统计依赖关系统计依赖关系的考察主要是通过的考察主要是通过相关分析相关
3、分析(correlation analysis)(correlation analysis)或或回归分析回归分析(regression analysis)(regression analysis)来完成的。来完成的。对于相关关系,虽然不能求出变量之间精确的函数关系式,对于相关关系,虽然不能求出变量之间精确的函数关系式,但是通过大量的观测数据,可以发现它们之间存在一定的但是通过大量的观测数据,可以发现它们之间存在一定的统计规律性。统计规律性。5回归分析回归分析是研究一个变量关于另一个(些)变量的具体依是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。赖关系的计算方法和理论。分为:
4、一元线性回归、多元线性回归、可线性化的非线性归分为:一元线性回归、多元线性回归、可线性化的非线性归(双曲线、指数、对数、二次、幂函数等)(双曲线、指数、对数、二次、幂函数等)6基本方法基本方法考察随机变量考察随机变量Y Y与普通变量与普通变量x x之间的相关关系之间的相关关系.例例1.1.在农业生产中小麦的亩产量在农业生产中小麦的亩产量Y Y与所施肥料量与所施肥料量x x有一定关系,有一定关系,在一定范围内,若施肥量大,亩产也较高。在一定范围内,若施肥量大,亩产也较高。问题:问题:Y Y是怎样依赖施肥料量是怎样依赖施肥料量x x的变化的。的变化的。问题的特征:问题的特征:x x是普通变量是普通
5、变量,Y,Y是随机变量是随机变量.处理方法:处理方法:按数理统计处理问题的方法。按数理统计处理问题的方法。7(1)(1)先进行一些试验,先进行一些试验,分别取不同的值分别取不同的值),(21nxxxY Y也得到也得到 个相应观察值个相应观察值xn),(21nyyy得到得到n n对数据对,称为样本数据点对数据对,称为样本数据点),(,),(),(2211nnyxyxyx(2)(2)散点图散点图,),(,),(),(2211画画在在平平面面直直角角坐坐标标系系中中将将nnyxyxyxYxo),(nnyx8(3)(3)寻找寻找Y Y与与x x的数量关系:的数量关系:.),(的的具具体体形形式式 xf
6、Y 其中其中.,差差为不可控制的随机误为不可控制的随机误为随机变量为随机变量为普通变量为普通变量 Yx.的未知的关系表达的未知的关系表达与与是是xYf一般地,一般地,),0(,)(),(2NxxfY且取,9 例例1 合金的强度合金的强度y(107Pa)与合金中碳的与合金中碳的含量含量x(%)有关。为研究两个变量间的关系。有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为首先是收集数据,我们把收集到的数据记为(xi,yi),i=1,2,n。本例中,我们收集到。本例中,我们收集到12组组数据,列于表数据,列于表1中中 进行回归分析首先是回归函数形式的选择。当只有一个自变量时,通常
7、可采用画散点图 的方法进行选择。10表1 合金钢强度y与碳含量x的数据 序号序号x(%)y(107Pa)序号序号x(%)y(107Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.011 为找出两个量为找出两个量间存在的回归函间存在的回归函数的形式,可以数的形式,可以画一张图:把每画一张图:把每一对数一对数(xi,yi)看成看成直角坐标系中的直角坐标系中的一个点,在图上一个点,在图上画出画出n个点,称这个点,称这张图为散
8、点图,张图为散点图,见右图。见右图。0.1 00.1 50.2 04 05 06 0碳含量合 金 钢 强 度图8.4.1 合金钢强度及碳含量的散点图12 从散点图我们发现从散点图我们发现1212个点基本在一条直线附近,这说明两个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示个变量之间有一个线性相关关系,这个相关关系可以表示为为 这便是这便是y y关于关于x x的一元线性回归的数据结构式。通常假定的一元线性回归的数据结构式。通常假定 在对未知参数作区间估计或假设检验时,还需要假定误在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即差服从正态分布,
9、即显然假定(显然假定(2 2)比假定()比假定(1 1)强)强 xY10)1()(,0)(2VarE)2(),(210 xNy13由于由于 0 0,1 1均未知,需要我们从收集到的数据均未知,需要我们从收集到的数据(x xi i,y yi i),i=i=1,2,1,2,n n,出发进行估计。在收集数据时,我们一般要求,出发进行估计。在收集数据时,我们一般要求观察独立地进行,观察独立地进行,即假定即假定y y1 1,y y2 2,y yn n,相互独立。综合上述诸项假定,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型:我们可以给出最简单、常用的一元线性回归的数学模型
10、:)(),.,1(,i10,独立同分布,其分布为各Nnixyiii149.2 9.2 一元线性回归一元线性回归xY101.本节考虑的模型是其中10,都是未知参数,为回归系数,1.0)(Exx10)(10,分别是直线的截距和斜率。xx10)(称为Y关于x的经验回归函数。方程 xY10称为Y关于x的经验线性回归方程,或经验回归方程,其相应的图形称为经验回归直线。此模型称为一元线性回归模型,基于此种模型的统计分析称为一元线性回归分析.152.下面用最小二乘法来求对于自变量x和因变量y的n对观察值10,的最小二乘估计的最小二乘估计),),.(,(),(2211nnyxyxyxnixYiii,.,2,1
展开阅读全文