回归分析模型课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《回归分析模型课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 模型 课件
- 资源描述:
-
1、 另一类是另一类是相关关系相关关系。例如消费者对某种商品的月。例如消费者对某种商品的月需求量与该种商品的价格的关系。又如农作物的需求量与该种商品的价格的关系。又如农作物的单位面积产量与降雨量、施肥量等的关系。这类单位面积产量与降雨量、施肥量等的关系。这类关系不能用函数来表达。变量之间的这种非确定关系不能用函数来表达。变量之间的这种非确定性关系,称为相关关系。性关系,称为相关关系。 对于相关关系,虽然不能求出变量之间精确的函对于相关关系,虽然不能求出变量之间精确的函数关系式,但是通过大量的观测数据,可以发现数关系式,但是通过大量的观测数据,可以发现它们之间存在着一定的统计规律性。它们之间存在着一
2、定的统计规律性。 由一个(或一组)非随机变量来估计或预测某一由一个(或一组)非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型和所个随机变量的观测值时,所建立的数学模型和所进行的统计分析,称为回归分析。如果这个模型进行的统计分析,称为回归分析。如果这个模型是线性的,就称为线性回归分析。研究两个变量是线性的,就称为线性回归分析。研究两个变量间的相关关系的回归分析,称为一元回归分析。间的相关关系的回归分析,称为一元回归分析。4.1.一元线性回归模型一元线性回归模型 在一元回归分析里,我们要考察的是随机变在一元回归分析里,我们要考察的是随机变量量 与非随机变量与非随机变量 之间的相互关
3、系。虽然之间的相互关系。虽然 和和 之间没有确定的函数关系。但是我们可以之间没有确定的函数关系。但是我们可以借助函数关系来表达它们之间的统计规律性。借助函数关系来表达它们之间的统计规律性。用以近似地描述具有相关关系的变量间的联系用以近似地描述具有相关关系的变量间的联系的函数,称为回归函数。的函数,称为回归函数。 YxYx 由于由于 与与 之间不存在完全确定的函数关系,之间不存在完全确定的函数关系,因此必须把随机波动产生的影响考虑在内。于是因此必须把随机波动产生的影响考虑在内。于是有一元线性回归模型的一般形式为有一元线性回归模型的一般形式为xY0120,YxED其中其中 是固定的未知参数,也称为
4、回归系数,是固定的未知参数,也称为回归系数,自变量自变量 是非随机可精确观测的,是非随机可精确观测的, 是均值为是均值为0,方差为方差为 的随机变量,在模型中它代表其他随的随机变量,在模型中它代表其他随机因素对机因素对Y产生的影响。产生的影响。01, x2x( )yE Y 一元线性回归分析的主要任务是用样本值对一元线性回归分析的主要任务是用样本值对回归系数回归系数 和和 作点估计;对作点估计;对 作假设检作假设检验;在验;在 处对处对 作预测,并对作预测,并对 作区间估计。作区间估计。01, 0 xxy记记 ,则,则 ,称为,称为 对对 的的回归直线方程。回归直线方程。01yxy01, y10
5、1121()(),()niiiniixxyyyxxx 的无偏估计为的无偏估计为2211()2neiiiyyn2残差平方和残差平方和参数参数 的置信水平为的置信水平为 的置信区间为的置信区间为22001122221111(2),(2)()()eenniiiixxtntnnnxxxx01参数参数 的置信水平为的置信水平为 的置信区间为的置信区间为1111222211(2)(2),()()eenniiiinnttxxxx11参数参数 的置信水平为的置信水平为 的置信区间为的置信区间为221122122()(),(2)(2)nniiiiiiyyyynn21用用 的回归值的回归值 作为作为 的预测值,的
6、预测值,同时同时 的置信水平为的置信水平为 的预测区间为的预测区间为200122120012211()(2) 1,()1()(2) 1()eniieniixxytnnxxxxytnnxx0y10010 yx0y0y4.2. 多元线性回归模型多元线性回归模型 有多个自变量的线性回归模型称为多元线性有多个自变量的线性回归模型称为多元线性回归模型。假定回归模型。假定 是一个可以观测的随机变量,是一个可以观测的随机变量, 为为k个自变量,且有个自变量,且有Y12,kx xx01 122(1)kkYxxx现假定对于变量现假定对于变量 与自变量与自变量 已得到已得到n组观测数据如下:组观测数据如下:Y12
7、,kx xx 与与 观测值表观测值表ix 变量 序号 1 2 nY1x2x11xkxY21x1kx1y2yny12x1nx22x2nx2kxknx在理论模型式(在理论模型式(1)下,可以认为表中数据满足)下,可以认为表中数据满足YX01 12 2(1,2,)jjjk kjjyxxxjn若记若记11121100212222111211,1kknnnknkkyxxxyxxxYXyxxx则上式可用矩阵表示为则上式可用矩阵表示为未知参数未知参数 估计式为估计式为1()TTX XX Y于是,有经验回归方程为于是,有经验回归方程为01Tk01122kkyxxx 的无偏估计为的无偏估计为2221()1nii
8、iyynk对于给定自变量对于给定自变量 ,用,用来预测来预测*12,kx xx*01122kkyxxx 称称 为为 的点预测,的点预测, 的的 的置信区间为的置信区间为* y100210021(1), 1(1)kkijijijkkijijijyc x x tnkyc x x tnk*01 122kkyxxx*yy11()()ijTCcX X4.3 利用利用Matlab软件实现软件实现 (1)b,bint,r,rint,stats=regress(Y,X,alpha),其中其中b是回归方程中的参数估计值,是回归方程中的参数估计值,bint是是b的置信的置信区间,区间,r和和rint分别表示残差及
9、残差对应的置信区间。分别表示残差及残差对应的置信区间。Stats包含三个数字,分别是相关系数,包含三个数字,分别是相关系数,F统计量及统计量及对应的概率对应的概率p值。值。其中其中 ,因变量数据向量,因变量数据向量Y和自变量数据矩阵和自变量数据矩阵X按以按以下排列方式输入下排列方式输入一、多元线性回归一、多元线性回归 1121111222221211,1kknnknnxxxyxxxyXYxxxy对一元线性回归,取对一元线性回归,取k1即可。即可。(2)当要画出残差及其置信区间,使用命令)当要画出残差及其置信区间,使用命令 rcoplot(r,rint) 作残差分析图。作残差分析图。 01012
展开阅读全文