双变量回归与相关课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《双变量回归与相关课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变量 回归 相关 课件
- 资源描述:
-
1、第一节 直 线 回 归函数关系与回归关系函数关系与回归关系 函数关系函数关系当一个变量取一定值时,另一个当一个变量取一定值时,另一个变量有确定值与之相对应,称这变量有确定值与之相对应,称这种关系为确定性的函数关系。种关系为确定性的函数关系。回归关系1、现现象之间确实存在数量上的依存象之间确实存在数量上的依存 关系。关系。2、现现象之间这种依存关系是不严格象之间这种依存关系是不严格 的,即无法用数学公式表示。的,即无法用数学公式表示。3、当变量、当变量 x 取某个值时,变量取某个值时,变量 y 取取 值可能有几个观测点分布在直线值可能有几个观测点分布在直线 周围周围一、直线回归的概念一、直线回归
2、的概念回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归二、直线回归方程二、直线回归方程 的求法的求法 直线回归的任务就是要找出一个变量随另一个变直线回归的任务就是要找出一个变量随另一个变量变化的数量依存关系,我们把这样的方程叫做量变化的数量依存关系,我们把这样的方程叫做直线回归方程直线回归方程。YabX 是由自变量是由自变量 X X 推算应变量推算应变量 Y Y 估计值估计值 a a是回归直线在是回归直线在Y Y 轴上的截距;轴上的截距;b b为样本的回归系数,即回归直线斜率为样本的回归系数,即回归直线斜率 表示当表示当X
3、 X变动一个单位时,变动一个单位时,Y Y平均变动平均变动b b个个 单位。单位。Y 残差(residual)或剩余值,即实测值Y与假定回归线上的估计值 的纵向距离 求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。YYY原则:最小二乘法(least sum of squares),即可保证各实 测点至直线的纵向距离的平方和最小直线回归方程的求法 2YYXXXYllnXXnYXXYXXYYXXb/)()(222XbYa图7-1 母血与新生儿脐带血TSH水平散点图2.53.03.54.04.55.05.50.00.20.40.60.81.01.21.41.61.82.02.
4、2母血TSH水平(mU/L)X新生儿脐带血TSH水平(mU/L)YXYX尿肌酐含量如表9-1,估计尿肌酐含量对其年龄的直线回归方程.公式公式 ,n2bbSbSbt0 Sb为回归系数的标准误为回归系数的标准误XXXYXXXYblSSS.2 SY.X为为Y的剩余标准差的剩余标准差扣除扣除X的影响后的影响后Y的变异程度。的变异程度。22nYYsXY2222XXYYXXYYYYYYYYYY回归部分)(YY)(YY 总情况Y剩余部分)(YY 实测点),(YXPYX X回剩总回剩总同样有:即所以有因为等式两边平方后再求和SSSSSSYYYYYYYYYYYYYYYY222)()()(:,0)(2,)()()
5、(反映除反映除 x 以外的其他因素对以外的其他因素对 y 取值的影响,也称为不可解取值的影响,也称为不可解释的平方和或剩余平方和释的平方和或剩余平方和 SSSS残残反映由于反映由于 x 与与 y 之间的线性关之间的线性关系引起的系引起的 y 的取值变化,也称的取值变化,也称为可通过回归解释的平方和为可通过回归解释的平方和 SSSS回回 SSSS总总反映应变量反映应变量 n 个观察值与其个观察值与其均值总离差平方和均值总离差平方和离差平方和分解离差平方和分解(三个平方和意义)(三个平方和意义)SS总总2)(YY,Y的的离离均均差差平平方方和和(total sum of squares),未未考考
6、虑虑X与与Y的的回回归归关关系系时时Y的的总总变变异异。1 n SS剩剩2)(YY,为为剩剩余余平平方方和和(residual sum of squares),X对对Y的的线线性性影影响响之之外外的的一一切切因因素素对对Y的的变变异异,即即总总变变异异中中,无无法法用用X解解释释的的部部分分。SS剩剩越越小小,回回归归效效果果越越好好。2 n SS回回2)(YY,为为回回归归平平方方和和(regression sum of squares),由由于于X与与Y的的直直线线关关系系而而使使Y变变异异减减小小的的部部分分,即即总总变变异异中中,可可以以用用X解解释释的的部部分分。SS回回越越大大,回
7、回归归效效果果越越好好。1 222222.()()()()22YYXYXYXXXXY XYYYYYYSSSSSSSSllSSblb llSSYYSMSnn剩总回总回剩剩公式可写成:2222XXYYXXYYYYF检验(见教材检验(见教材P153)1.1.建立假设建立假设 H0:=0 =0 H1:00对0这一假设是否成立还可进行如下t检验 0bbbtS,2n Y XbXXSSl 2nSSSXY残 2.t 检验(见教材P153)见教材P15302,2/0YnStY见教材P154),()2(2/)2(2/YnYnStYStY见教材P154置信区间、预测区间、回归方程置信区间、预测区间、回归方程bxay
8、预测上限预测上限预测下限预测下限例9-4 回归方程的应用回归方程的应用 相关相关 -变量间的协同变化关系变量间的协同变化关系 直线相关直线相关(linear correlation):简单相关:简单相关(simple correlation),用于,用于双变量双变量正态分正态分布资料。布资料。回归回归 -变量间的数量依存关系变量间的数量依存关系 第二节第二节 直线相关直线相关 为了研究父亲与成年儿子为了研究父亲与成年儿子身高之间的关系,卡尔身高之间的关系,卡尔.皮皮尔逊测量了尔逊测量了1078对父子的对父子的身高。把身高。把1078对数字表示对数字表示在坐标上,如图。用水平在坐标上,如图。用水
9、平轴轴X上的数代表父亲身高,上的数代表父亲身高,垂直轴垂直轴Y上的数代表儿子的上的数代表儿子的身高,身高,1078个点所形成的个点所形成的图形是一个散点图。它的图形是一个散点图。它的形状象一块橄榄状的云,形状象一块橄榄状的云,中间的点密集,边沿的点中间的点密集,边沿的点稀少,其主要部分是一个稀少,其主要部分是一个椭圆。椭圆。YYXXXYlllYYXXYYXXr22r无单位,无单位,-1 r 1。r 值为正值为正 正相关正相关,为负为负 负相关;负相关;(与回归系数(与回归系数b b的符号相同)的符号相同)二、相关系数意义与计算二、相关系数意义与计算相关系数意义相关系数意义 r rr rr rr
展开阅读全文