高考第一轮复习-变量间的相关关系与独立检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《高考第一轮复习-变量间的相关关系与独立检验课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高考 第一轮 复习 变量 相关 关系 独立 检验 课件
- 资源描述:
-
1、第5课时 变量间的相关关系回归分析及独立性检验 赵建文 1.会作两个相关变量的数据的散点图,会利用会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系散点图认识变量的相关关系. 2.了解最小二乘法的思想,能根据给出的线性了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程回归方程系数公式建立线性回归方程. 3.了解独立检验了解独立检验(只要求只要求22列联表列联表)的基本思想、的基本思想、方法简单应用方法简单应用. 4.了解假设检验的基本思想、方法简单应用了解假设检验的基本思想、方法简单应用. 5.会求回归方程,并能进行回归分析会求回归方程,并能进行回归分析、 (3
2、)正相关正相关 在散点图中,点散布在从在散点图中,点散布在从 到到 的区的区域对于两个变量的这种相关关系,我们将它称为正相域对于两个变量的这种相关关系,我们将它称为正相关关 基础知识梳理基础知识梳理左上角左上角右下角右下角 1两个变量的线性相关两个变量的线性相关(1)相关关系 自变量取值一定时,因变量的取值带有一定随机性的自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系两个变量之间的关系,则称这两个变量具有则称这两个变量具有 . 注意:相关关系是一种不确定性关系注意:相关关系是一种不确定性关系相关关系相关关系(2)散点图 在平面直角坐标系中在平面直角坐标系中,表示表示具有相关关
3、系的两个变量具有相关关系的两个变量的一组数据的图形的一组数据的图形叫做叫做 .散点图散点图 (5)线性相关关系、回归直线线性相关关系、回归直线 如果散点图中点的分布从整体上看大致如果散点图中点的分布从整体上看大致在在 ,就称这两个变量之间具有线性相关,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线关系,这条直线叫做回归直线一条直线附近一条直线附近 (4)负相关负相关 在散点图中,点散布在从在散点图中,点散布在从 到到 的的区域,两个变量的这种相关关系称为负相关区域,两个变量的这种相关关系称为负相关右上角右上角左下角左下角(6)相关系数相关系数r用来衡量两个变量的相关程度,其公式为:1
4、2211()()niiinniiiix ynxyrxxyy 0r1; 当当r0时时,表示两个变量正相关;表示两个变量正相关; 当当r00(4)建立回归模型的基本步骤建立回归模型的基本步骤确定研究对象确定研究对象,明确解释变量与预报变量明确解释变量与预报变量;画出解释变量与预报变量的散点图画出解释变量与预报变量的散点图;由经验确定回归方程的类型由经验确定回归方程的类型;估计回归方程中的参数估计回归方程中的参数;对回归模型进行进行残差分析对回归模型进行进行残差分析,若存在异常,则检验若存在异常,则检验数据是否有误,或模型是否合适。数据是否有误,或模型是否合适。 (5)随机误差产生的原因)随机误差产
5、生的原因 用回归模型近似真实模型差异产生误差;用回归模型近似真实模型差异产生误差; 忽略了某些因素的影响;忽略了某些因素的影响; 观测误差。观测误差。上面三项误差越小,说明我们的回归模型的拟合效果越上面三项误差越小,说明我们的回归模型的拟合效果越好。好。3回归分析回归分析(1)回归分析回归分析对具有对具有 的两个变量进行统计分析的一种常的两个变量进行统计分析的一种常用方法用方法相关关系相关关系(2)残差分析残差分析 回归模型中随机误差回归模型中随机误差 的估计值的估计值 (其中(其中 )叫相应点()叫相应点(xi,yi)的残差的残差。ieiiiyyeabxyii 残差图残差图 在直角坐标系中,
6、以样本编号或解释变量为横在直角坐标系中,以样本编号或解释变量为横坐标,残差为纵轴坐标作出的图像叫残差图。坐标,残差为纵轴坐标作出的图像叫残差图。 残差分析残差分析 若残差点比较均匀的分布在横轴附近很窄的区域内,若残差点比较均匀的分布在横轴附近很窄的区域内,说明回归模型拟合较好,若个别点离横轴较远,需要检查说明回归模型拟合较好,若个别点离横轴较远,需要检查数据收集是否有误差,若取样有误差作出修行正,并对回数据收集是否有误差,若取样有误差作出修行正,并对回归模型进行修改,否则,分析其他原因归模型进行修改,否则,分析其他原因. (3)拟合效果分析总体偏差平方和niiyy12)(残差平方和niiiyy
7、12)(回归平方和2211)nniiiiiyyyy( 用用R2来刻画回归的效果来刻画回归的效果,R2 ,表表示示 .越大越大拟合效果越好拟合效果越好22121()1()niiiniiyyRyy 相关指数相关指数方差估计niiiyyn122)21( 用 来刻画回归效果, 值越小,表明拟合效果越好.224独立性检验独立性检验(1)分类变量的定义分类变量的定义如果某种变量的不同如果某种变量的不同“值值”表示个体所属的不同类别,表示个体所属的不同类别,像这样的变量称为像这样的变量称为 (2)22列联表列联表一般地,假设有两个分类变量一般地,假设有两个分类变量X和和Y,它们的值域分,它们的值域分别为别为
8、x1,x2和和y1,y2,其样本频数列联表,其样本频数列联表(称为称为22列列联表联表)为为分类变量分类变量y1y2总计总计x1abx2cd总计总计acbdabcdabcd(3)二维条形图(4)三维柱状图三维柱状图 将分类变量X取值x1,x2与Y的取值y1,y2的取值用条形图表示出来,可以估计满足条件可以估计满足条件Xx1的个体中具有的个体中具有Yy1的个体所占的比例的个体所占的比例 ,也可以估计满足条件,也可以估计满足条件Xx2的个体中具有的个体中具有Yy2的个体所占的比例的个体所占的比例 .“两个比例两个比例的值相差越大,的值相差越大,H1成立的可能性就越大成立的可能性就越大”baadcd
9、 在坐标系中作出分类变量在坐标系中作出分类变量X、Y取值的柱形图,主对角取值的柱形图,主对角线上两个柱形高度的乘积线上两个柱形高度的乘积ad与副对角线上的两个柱形高与副对角线上的两个柱形高度的乘积度的乘积bc相差越大,相差越大,H1成立的可能性就越大成立的可能性就越大 通过三维柱形图和二维条形图,可以粗略地判断两个通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度结论的可靠程度基础知识梳理基础知识梳理 (5)独立性检验 用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判
10、断的可靠程度具体步骤是: 根据实际问题需要的可信程度确定临界值k0; 利用公式K2 ,由观测数据计算得到随机变量K2的观测值k; 如果kk0,就以(1P(K2k0)100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据 利用利用K2来确定在多大程度可以认为来确定在多大程度可以认为“两个分类变量有两个分类变量有关系关系”的方法称为的方法称为独立性检验独立性检验. 1在对两个变量x,y进行线性回归分析时有下列步骤:对所求出的回归方程作出解释;收集数据(xi,yi),i1,2,n;求线性回归方程;求相关系数;根据所搜集的数据绘制散点图如果根据可靠性要求能够作出变量
展开阅读全文