《统计案例》单元复习巩固参考模板范本.doc
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《统计案例》单元复习巩固参考模板范本.doc》由用户(林田)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计案例 统计 案例 单元 复习 巩固 参考 模板 范本
- 资源描述:
-
1、 统计案例单元复习巩固【学习目标】1. 了解独立性检验(只要求22列联表)的基本思想、方法及初步应用.2. 通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.3. 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤.4. 能作出散点图,能求其回归直线方程。5. 会用所学的知识对简单的实际问题进行回归分析。【知识网络】【要点梳理】要点一、分类变量有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。要点诠释:(1)对分类变量的理解。这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种
2、类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。(2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。要点二、22列联表1. 列联表用表格列出的分类变量的频数表,叫做列联表。2. 22列联表对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:事件B事件合计事件Aaba+b事件cdc+d合计a+cb +da+b+c+d这样的表格称为22列联表。要点三:卡方统计量公式为了研究分类变量X与Y的关系,经调查得到一张22列联表,如下表所示 Y1Y2合计X1aba+bX2cd
3、c+d合计a+cb+dn=a+b+c+d统计中有一个有用的(读做“卡方”)统计量,它的表达式是: (为样本容量)。要点四、独立性检验1. 独立性检验通过22列联表,再通过卡方统计量公式计算的值,利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。2. 变量独立性的判断通过对统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:如果3.841时,认为事件A与B是无关的。如果3.841时,有95%的把握说事件A与事件B有关;如果6.635时,有99%的把握说事件A与事件B有关;要点诠释:
4、(1)独立性检验一般是指通过计算统计量的大小对两个事件是否有关进行判断;(2)独立性检验的基本思想类似于反证法。即在H0:事件A与B无关的统计假设下,利用统计量的大小来决定在多大程度上拒绝原来的统计假设H0,即拒绝“事件A与B无关”,从而认为事件A与B有关。独立性检验为假设检验的特例。(3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握程度。3独立性检验的基本步骤及简单应用 独立性检验的步骤:要推断“A与B是否有关”,可按下面步骤进行:(1)提出统计假设H0:事件A与B无关(相互独立);(2)抽取样本(样本容量不要太小,每个数据都要大于5);(3)列出22列联表;
5、(4)根据22列联表,利用公式:,计算出的值;(5)统计推断:当3.841时,有95的把握说事件A与B有关;当6.635时,有99的把握说事件A与B有关;当10.828时,有99.9的把握说事件A与B有关;当3.841时,认为事件A与B是无关的要点诠释: 使用统计量作22列联表的独立性检验时,要求表中的4个数据都要大于5 一定要弄清的表达式中各个量的含义 独立性检验的基本思想类似于反证法要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量应该很小,如果由观测数据计算得到的的观测值很大,则在一定程度上说明假设不合
6、理根据随机变量的含义,由实际计算的6.635,说明假设不合理的程度约为99,即“两个分类变量有关系”这一结论成立的可信程度约为99当3.841时,认为两个分类变量是无关的要点五、变量间的相关关系1. 变量与变量间的两种关系:(1) 函数关系:这是一种确定性的关系,即一个变量能被另一个变量按照某种对应法则唯一确定例如圆的面积S与半径r之间的关系S=r2为函数关系 (2)相关关系:这是一种非确定性关系当一个变量取值一定时,另一个变量的取值带有一定的随机性,这两个变量之间的关系叫做相关关系。例如人的身高不能确定体重,但一般来说“身高者,体重也重”,我们说身高与体重这两个变量具有相关关系 2. 相关关
7、系的分类:(1)在两个变量中,一个变量是可控制变量,另一个变量是随机变量,如施肥量与水稻产量;(2)两个变量均为随机变量,如某学生的语文成绩与化学成绩 3. 散点图:将两个变量的各对数据在直角坐标系中描点而得到的图形叫做散点图它直观地描述了两个变量之间有没有相关关系这是我们判断的一种依据4. 回归分析:与函数关系不同,相关关系是一种非确定性关系,对具有相关关系的两个变量进行统计分析的方法叫做回归分析。要点六、线性回归方程: 1回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。2回归直线方程对于一组具有线性相关关系的数据,其回
8、归直线的截距和斜率的最小二乘法估计公式分别为:,其中表示数据xi(i=1,2,n)的均值,表示数据yi(i=1,2,n)的均值,表示数据xiyi(i=1,2,n)的均值 、的意义是:以为基数,x每增加一个单位,y相应地平均变化个单位要点诠释:回归系数,也可以表示为,这样更便于实际计算。;。称为样本中心点,回归直线必经过样本中心点。回归直线方程中的表示x增加1个单位时的变化量,而表示不随x的变化而变化的量。3求回归直线方程的一般步骤:作出散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系,若存在线性相关关系,进行第二步。求回归系数、计算,利用公式求出,再由求出的值; 写出回归直线方程;
9、利用回归直线方程预报在x取某一个值时y的估计值。要点诠释:一般地,我们可以利用回归直线方程进行预测,但这里所得到的值是预报值,而不是精确值,它带有很大的随机性,可能对于某一次的实际值而言会有很大的出入,这是因为:(1)回归直线的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差。(2)即使截距和斜率的估计没有误差,也不可能保证对应于x的预报值能够与实际值y很接近。我们不能保证点(x,y)落在回归直线上,甚至不能保证它落在回归直线的附近,事实上,这里是随机变量,预报值与实际值y的接近程度由随机变量决定。尽管我们利用回归直线方程所得到的值仅是一个预报值,它具有随机性,但
10、它是我们根据统计规律所得到的结论,因而结论正确的概率很大。故我们可以放心地利用回归直线方程进行预测。要点七、相关性检验(1)相关系数r的定义对于变量x与y随机抽取到的n对数据,称为x与y的样本相关系数。(2)相关系数r的作用样本相关系数r用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱:越接近1,表明两个变量之间的线性相关程度越强;越接近0,表明两个变量之间的线性相关程度越弱。当r0时,表明两个变量正相关, 即x增加,y随之相应地增加,若x减少,y随之相应地减少当r0时,表明两个变量负相关, 即x增加,y随之相应地减少;若x减少,y随之相应地增加若r=0,则称x与y不相关。当,
11、认为x与y之间具有很强的线性相关关系。当大于时,表明有95%的把握认为x与y之间具有线性相关关系,这时求回归直线方程有必要也有意义,当时,寻找回归直线方程就没有意义。(3)利用相关系数r检验的一般步骤:法一:作统计假设:x与y不具有线性相关关系。根据样本相关系数计算公式算出r的值。比较与0.75的大小关系,得出统计结论。如果,认为x与y之间具有很强的线性相关关系。法二:作统计假设:x与y不具有线性相关关系。根据样本相关系数计算公式算出r的值。根据小概率0.05与n-2在相关性检验的临界值表中查出r的一个临界值(n未数据的对数)。比较与,作统计推断,如果,表明有95%的把握认为x与y之间具有线性
12、相关关系。如果,我们没有理由拒绝原来的假设,即不认为x与y之间具有线性相关关系。这时寻找回归直线方程是毫无意义的。要点八、线性回归分析与非线性回归分析1线性回归分析 对于回归分析问题,在解题时应首先利用散点图或相关性检验判断x与y是否具有线性相关关系,如果线性相关,才能求解后面的问题否则求线性回归方程没有实际意义,它不能反映变量x与y,之间的变化规律只有在x与y之间具有相关关系时,求线性回归方程才有实际意义 相关性检验的依据:主要利用检验统计量 (其中化简式容易记也好用)求出检验统计量的样本相关系数,再利用r的性质确定x和y是否具有线性相关关系,r具有的性质为:|r|1且|r|越接近于1,线性
13、相关程度越强;|r|越接近于0,线性相关程度越弱2. 线性回归分析的一般步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)判断两变量是否具有线性相关关系作散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系。求相关系数r当,认为x与y之间具有很强的线性相关关系。(3)若两变量存在线性相关关系,设所求的线性回归方程为,求回归系数、。(4)写出回归直线方程;(5)利用回归直线方程预报在x取某一个值时y的估计值。 3非线性回归分析 (1)对于非线性回归分析问题,如果给出了经验公式可直接利用换元,使新元与y具有线性相关关系,进一步求出,对新元的线性回归方程,换回x即可得
14、y对x的回归曲线方程(2)非线性回归问题有时并不给出经验公式,这时按以下步骤求回归方程:画出已知数据的散点图,看是否是线性回归分析问题,如果不是,把它与必修数学中学过的函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,采用适当的变量置换,把非线性回归分析问题化为线性回归分析问题作相关性检验,即判断寻找线性回归方程是否有意义当寻找线性回归方程有意义时,计算系数,得到线性回归方程代回x得y对x的回归曲线方程【典型例题】类型一、独立性检验及应用例1.(2016 张掖校级模拟)某校通过随机询问100名性别不同的学生是否能做到“光盘”行动,得到所示联表:附: A在犯错误
展开阅读全文