1、一元线性回归模型(1)高二年级 数学新闻播报(1)1999-2008年,俄罗斯GDP增长率与国际石油价格的相关系数为0.86,2009-2014年该系数达到0.98.(2)瑞士洛桑国际管理学院对企业国际竞争力的研究也显示,公司文化与企业管理竞争力的相关系数在几个因子中是最高的.(3)分析表明1990年至2011年我国财政收入与企业注册资本之间的关系呈高度线性相关,其相关系数高达0.987,而斜率竟为0.148.问题 自行选择标准,将下列变量之间的关系分为两类,并分别阐述每一类中变量关系的特点:(1)圆的面积S与半径r之间的关系;(2)16岁学生的体重w与身高h之间的关系;(3)商品销售量Q与销
2、售价格P之间的关系;(4)匀速运动的物体,其运动的路程S与时间t之间的关系;(5)科技创新能力y与人才培养近亲繁殖率x之间的关系;(6)学习成绩f与平均学习时间t之间的关系.问题 自行选择标准,将下列变量之间的关系分为两类,并分别阐述每一类中变量关系的特点:(1)圆的面积S与半径r之间的关系;(2)16岁学生的体重w与身高h之间的关系;(3)商品销售量Q与销售价格P之间的关系;(4)匀速运动的物体,其运动的路程S与时间t之间的关系;(5)科技创新能力y与人才培养近亲繁殖率x之间的关系;(6)学习成绩f与平均学习时间t之间的关系.2Sr Svt(2)16岁学生的体重w与身高h之间的关系;(3)商
3、品销售量Q与销售价格P之间的关系;(5)科技创新能力y与人才培养近亲繁殖率x之间的关系;(6)学习成绩f与平均学习时间t之间的关系.(2)16岁学生的体重w与身高h之间的关系;(3)商品销售量Q与销售价格P之间的关系;(5)科技创新能力y与人才培养近亲繁殖率x之间的关系;(6)学习成绩f与平均学习时间t之间的关系.两个变量之间有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性,统计学上称为相关关系.一、相关关系例1 已知某班级学生数学成绩与物理成绩的对应表如下:这个班级学生的数学成绩与物理成绩之间存在相关关系吗?数学888279899278795683666174687
4、77880物理87916686887991539377626962587968数学51589873758469767143748270756563物理50658279599859877642759146688355一、相关关系数学43515658616365666869707173747475物理42505365625583776259467679697559数学75767778787979808282838488899298物理68875879796691689191939887868882一、相关关系405060708090100405060708090100物理数学散点图如果两个变量之间
5、的关系可以近似地用一次函数来刻画,则称这两个变量线性相关.此时,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.一、相关关系(1)16岁学生的体重与身高之间的关系;(2)商品销售量与销售价格之间的关系;(3)创新能力与人才培养近亲繁殖率之间的关系;(4)学习成绩与平均学习时间之间的关系.练习 如果将下列两个变量之间的关系看成线性相关,则哪些是正相关?哪些是负相关?正相关负相关正相关负相关一、相关关系例2 某地区从某一年开始进行了环境污染整治,得到了如下数据:第x年1234567污染指数y6.15.24.54.73.8
6、3.43.1作出这些成对数据的散点图,直观地判断污染指数y与x是否线性相关,如果是,进一步判断是正相关还是负相关.1234567 x1234567yO追问1 你能找出近似描述y与x之间关系的一次函数表达式吗?0.56.5yx 过(1,6)和(7,3)类似这样的直线有多少条?1234567 x1234567yO误差预测值追问2 是“最好”的直线吗?衡量标准是什么?0.56.5yx 第x年1234567污染指数y6.1 5.2 4.5 4.7 3.8 3.4 3.10.56.5x65.554.543.530.1-0.35.5-0.5 0.2-0.2-0.1 0.1误差平方和最小1234567 x1
7、234567yO0.56.5yx 0.4756.3yx 追问2 是“最好”的直线吗?衡量标准是什么?误差平方和最小0.4756.3yx y关于x的回归直线方程“最好”的直线误差平方和最小二、回归直线方程1234567 x1234567yO使 最小记追问3 回归直线方程是如何通过计算得到的呢?设变量x与y的n对成对数据为 ,求出y关于x的回归直线方程 .(,),1,2,3,iix yinybxa误差平方和最小iy 则误差平方和为:21()niiiyy最小二乘法21()niiiybxaibxaybxa设变量x与y的n对成对数据为 ,求出y关于x的回归直线方程 .(,),1,2,3,iix yin追
8、问3 回归直线方程是如何通过计算得到的呢?称为回归系数b1221niiiniix ynx yxnx121()()()niiiniixxyybxx aybx1111,nniiiixx yynn其中,12345676.15.24.54.73.83.43.1-3-10123-2练习 验证例2中y关于x的回归直线方程为0.4756.3yx()()xxyy2()xxxy1.70.10.3-0.6-1-1.30.8-5.1-0.10-0.6-2-3.9-1.6910149413.30.47528b 71()()13.3iiixxyy xxyy4x 4.4y 721()28iixx121()()()niii
9、niixxyybaybxxx,6.3a 求回归直线方程的步骤1.计算:,x y2.列表求和:1()(),niiixxyy21()niixx121()(),()niiiniixxyybaybxxx3.代入公式计算:4.写出回归直线方程ybxa练习 验证例2中y关于x的回归直线方程为0.4756.3yx 追问1 你能估计出该地区第8年的污染指数吗?当 时,0.47586.32.5y 8x 追问2 第8年的污染指数一定是2.5吗?不一定一、相关关系课堂小结(1)线性相关(2)正相关与负相关二、回归直线方程课堂小结ybxa1221niiiniix ynx yxnx121()()()niiiniixxy
10、ybxx aybx1111,nniiiixx yynn其中,“回归”一词的由来“回归”是由英国著名生物学家兼统计学家高尔顿提出.1889年,他在研究祖先与后代身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有它们的父母的平均身高高;身材较矮的父母他们的孩子也较矮,但这些孩子的平均身高却比他们的父母的平均身高高.图片来自互联网资源“回归”一词的由来 高尔顿把这种后代身高向总体平均值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.图片来自互联网资源人教社B版课本:P111练习A第2题作业作业人教社B版课本:P112练习B第6题