书签 分享 收藏 举报 版权申诉 / 18
上传文档赚钱

类型回归分析与独立性检验课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4409872
  • 上传时间:2022-12-07
  • 格式:PPT
  • 页数:18
  • 大小:665.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《回归分析与独立性检验课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    回归 分析 独立性 检验 课件
    资源描述:

    1、返回目录返回目录 1.随机误差 由于所有的样本点不共线,而只是散布在某一条由于所有的样本点不共线,而只是散布在某一条直线的附近,实际上,直线的附近,实际上,y=bx+a+e,e是是y与与 =bx+a之之间的误差间的误差.通常通常e为随机变量,称为随机误差,它的均值为随机变量,称为随机误差,它的均值E(e)=0,方差方差D(e)=20.这样线性回归模型的完整表这样线性回归模型的完整表达式为达式为 .y=bx+a+eE(e)=0,D(e)=2y y 返回目录返回目录 随机误差随机误差e的方差的方差2越小,通过回归直线越小,通过回归直线 =bx+a预报真实值预报真实值y的精确度越高的精确度越高.随机

    2、误差是引起预报值随机误差是引起预报值 与与真实值真实值y之间的误差的原因之一,其大小取决于随机误之间的误差的原因之一,其大小取决于随机误差的方差差的方差.2.残差 对于样本点对于样本点(x1,y1),(x2,y2),(xn,yn)而言,相应于而言,相应于它们的随机误差为它们的随机误差为ei=yi-yi=yi-bxi-a,i=1,2,n,其估计值为其估计值为ei=,i=1,2,n,ei称为相应于点称为相应于点(xi,yi)的残差的残差.y y a a-bxbx-y y y y -y yi ii ii ii iy y 3.残差分析 在研究两个变量间的关系时,首先要根据散点图来粗在研究两个变量间的关

    3、系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟略判断它们是否线性相关,是否可以用线性回归模型来拟合数据合数据.然后,可以通过残差然后,可以通过残差e1,e2,en来判断模型拟合的来判断模型拟合的效果,判断原始数据中是否存在可疑数据效果,判断原始数据中是否存在可疑数据.这方面的分析这方面的分析工作称为残差分析工作称为残差分析.4.残差图 作图时纵坐标为残差,横坐标可以选为样本编号,这作图时纵坐标为残差,横坐标可以选为样本编号,这样作出的图形称为残差图样作出的图形称为残差图.返回目录返回目录 5.列联表 假设有两个分类变量假设有两个分类变量X和和Y,它们的值域分别为,

    4、它们的值域分别为x1,x2和和y1,y2,其样本频数列联表为,其样本频数列联表为 此表称为此表称为22列联表列联表.根据观测数据计算由公式根据观测数据计算由公式 .给出的检验随机变量给出的检验随机变量K2的的值值k,其值越大,说明,其值越大,说明“X与与Y有关系有关系”成立的可能性越大成立的可能性越大.y1y2总计x1aba+bx2cdc+d总计a+cb+d返回目录返回目录(其中(其中n=a+b+c+d为样本容量)为样本容量)a+b+c+dd d)c c)(b bd d)(a ab b)(c c(a ab bc c)-n n(a ad dK K2 22 2+=返回目录返回目录 例例1 每立方米

    5、混凝土的水泥用量每立方米混凝土的水泥用量x(单位:单位:kg)与与28天后混凝天后混凝土的抗压强度土的抗压强度Y(单位:(单位:kg/cm2)之间的关系有如下数据)之间的关系有如下数据:X150160170180190200210220230240250260Y56.958.361.664.668.171.374.177.480.282.686.489.7返回目录返回目录 求回归直线方程和相关系数,求回归直线方程和相关系数,通常用计通常用计算器来完成算器来完成.在有的较专门的计算器中,可通过直接按在有的较专门的计算器中,可通过直接按键得出回归直线方程的系数和相关系数键得出回归直线方程的系数和相

    6、关系数.而如果用一般而如果用一般的科学计算器进行计算的科学计算器进行计算,则要先列出相应的表格,则要先列出相应的表格,有,有了表格中的相关数据了表格中的相关数据,回归方程中的系数和相关系数,回归方程中的系数和相关系数都容易求出都容易求出.(1)对变量)对变量Y与与x进行相关性检验;进行相关性检验;(2)如果)如果Y与与x之间具有线性相关关系,求回归直之间具有线性相关关系,求回归直线方程线方程.(1)由题目中的数据得如下表格)由题目中的数据得如下表格:i i123456x xi i150160170180190200y yi i56.958.361.664.668.171.3x xi iy yi

    7、 i8535932810472116281293914260i i789101112x xi i210220230240250260y yi i74.177.480.282.686.489.7x xi iy yi i155611702818446198242160023322返回目录返回目录 返回目录返回目录 查得查得r0.05=0.576,因因rr0.05,说明变量说明变量Y与与x之间具有线性相关关系之间具有线性相关关系.943943 182182 12121 1i i=i ii iy yx x572.94,572.94,5454 600,600,51851812121 12 212121

    8、12 2=i ii ii ii iy yx x72.672.6y y205,205,x x=999999.0 0)6 6.72721212-4 4.5457254572)()(2052051212-518600518600(6 6.72722052051212-182943182943r r2 22 2=为了进行相关性检验,通常将有关数据为了进行相关性检验,通常将有关数据列成表格,然后借助于计算器算出各个量,为求回归列成表格,然后借助于计算器算出各个量,为求回归直线方程扫清障碍直线方程扫清障碍.返回目录返回目录(2)a=y-bx=10.28.于是所求的线性回归方程是于是所求的线性回归方程是:=

    9、0.304x+10.28.304304.0 02052051212-5186005186006 6.72722052051212-182943182943b b2 2=y y 在在10年期间,一城市居民的年收入与某种商品的销售额年期间,一城市居民的年收入与某种商品的销售额之间的关系有如下数据之间的关系有如下数据:返回目录返回目录 第几年第几年1 12 23 34 45 5城市居民年收入(亿元)城市居民年收入(亿元)32.232.231.131.132.932.935.835.837.137.1某商品销售额(万元)某商品销售额(万元)25.025.030.030.034.034.037.037.

    10、039.039.0第几年第几年6 67 78 89 91010城市居民年收入(亿元)城市居民年收入(亿元)38.038.039.039.043.043.044.644.646.046.0某商品销售额(万元)某商品销售额(万元)41.041.042.042.044.044.048.048.051.051.0返回目录返回目录(1)略略(2)=1.447x-15.843.(1)画出散点图画出散点图;(2)如果散点图中的各点大致分布在一条直线附近,如果散点图中的各点大致分布在一条直线附近,求求Y与与x之间的回归直线方程之间的回归直线方程.y y 返回目录返回目录 例例2 在某医院,因为患心脏病而住院的

    11、在某医院,因为患心脏病而住院的665名男性病名男性病人中,有人中,有214人秃顶,而另外人秃顶,而另外772名不是因为患心脏病名不是因为患心脏病而住院的男性病人中有而住院的男性病人中有175人秃顶人秃顶.请用独立性检验方请用独立性检验方法判断秃顶与患心脏病是否有关系?法判断秃顶与患心脏病是否有关系?首先由题目中的数据画出首先由题目中的数据画出22列联表,列联表,然后根据表中的数据算出然后根据表中的数据算出K2的值,据的值,据K2的值就可以判的值就可以判断秃顶与心脏病是否有关系断秃顶与心脏病是否有关系.返回目录返回目录 根据题目所给的数据得到如下根据题目所给的数据得到如下22列联表列联表:根据表

    12、中的数据,得到根据表中的数据,得到:K2=所以有所以有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”.患心脏病患其他病合计秃顶214175389不秃顶4515971048合计66577214376.635.6.635.16.37316.373772772665665048048 1 1389389451)451)175175-597597(214(214437437 1 12 2 (1)独立性检验的关键是准确地计算)独立性检验的关键是准确地计算K2,在计算时,要充分利用,在计算时,要充分利用22列联表列联表.(2)学习相关和无关的判定一定要结合实际问题,学习相关和无关的判定

    13、一定要结合实际问题,从现实中寻找例子,从而增强学习数学的兴趣从现实中寻找例子,从而增强学习数学的兴趣.返回目录返回目录 为考察高中生的性别与是否喜欢数学课程之间的关系,为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取了在某城市的某校高中生中随机抽取了300名学生,得到名学生,得到如下如下22列联表列联表:判定性别与是否喜欢数学的关系判定性别与是否喜欢数学的关系.经计算知经计算知K24.5143.841.95%的把握可判定高的把握可判定高中生的性别与是否喜欢数学课程有关系中生的性别与是否喜欢数学课程有关系.返回目录返回目录 喜欢数学喜欢数学不喜欢数学不喜欢数学合计合计男男3785122女女35143178合计合计72228300返回目录返回目录

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:回归分析与独立性检验课件.ppt
    链接地址:https://www.163wenku.com/p-4409872.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库