《独立性检验》教学讲解课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《独立性检验》教学讲解课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 独立性检验 独立性 检验 教学 讲解 课件
- 资源描述:
-
1、118 118 独立性检验独立性检验 一、有关概念一、有关概念:二、二、独立性检验的简介独立性检验的简介:三、三、检验独立性的方法检验独立性的方法:1 1.定性变量与定量变量定性变量与定量变量:2.22.22 2 列联表:列联表:.频率法:频率法:.等高条形图法:等高条形图法:.卡方检验:卡方检验:1.1.卡方检验简述:卡方检验简述:3.3.书写格式:书写格式:2.2.操作步骤及三个细节:操作步骤及三个细节:(教学讲解课件)(教学讲解课件)概率与统计简述概率与统计简述 总总 体体样样 本本抽样抽样估计估计推断推断回 归 分 析回 归 分 析相 关 分 析相 关 分 析分布列及期望分布列及期望概
2、率概率计数计数估计估计特征值估计特征值估计 表,式及其他估计表,式及其他估计 图估计图估计 均值均值,方差方差,中数中数 直方图直方图,茎叶图茎叶图频数表频数表,频率表频率表 估计简述估计简述 (教学讲解课件)(教学讲解课件)方差方差是各个数据与平均数之差的平方的和的平均数是各个数据与平均数之差的平方的和的平均数 标准差标准差是方差的算术平方根是方差的算术平方根 nxxnii12)(nxxxxxxxxn2232221)()()()(2S 2211niixxn22221)()()(1xxxxxxnSn定义法:定义法:特征值的求法特征值的求法 (教学讲解课件)(教学讲解课件)特征值的求法特征值的求
3、法 公式法:公式法:定义法:定义法:.数据数据x,x,x,x的平均值为的平均值为x,方差为方差为O Oakxakxakxakxn,321axk nxxxx,321x22kS2S.若数据若数据 的平均值为的平均值为 ,方差为方差为则数据则数据 的的 平均值为平均值为 ,方差为方差为nxxxx,321x2S.若数据若数据 的平均值为的平均值为 ,方差为方差为2222123,nx x xx2x数据数据 的平均值为的平均值为 则则2S 22xx(教学讲解课件)(教学讲解课件)公式法:公式法:定义法:定义法:图表法:图表法:注注1 1:在频率分布直方图中在频率分布直方图中 众数:最高矩形的中点的横坐标众
4、数:最高矩形的中点的横坐标中位数:左右两边直方图的面积和中位数:左右两边直方图的面积和 各为各为0.50.5的点的横坐标的点的横坐标 平均数:每个小矩形面积乘以小矩形平均数:每个小矩形面积乘以小矩形 底边中点的横坐标之和底边中点的横坐标之和 特征值的求法特征值的求法 公式法:公式法:定义法:定义法:图表法:图表法:注注2 2:在茎叶图中如何看数据的稳定性在茎叶图中如何看数据的稳定性 单峰的稳定性大于多峰的稳定性单峰的稳定性大于多峰的稳定性 越对称稳定性越好越对称稳定性越好 峰越瘦越尖,数据更集中,更稳定峰越瘦越尖,数据更集中,更稳定 峰越矮越胖,数据越分散,不稳定峰越矮越胖,数据越分散,不稳定
5、 特征值的求法特征值的求法 (教学讲解课件)(教学讲解课件)特征值估计特征值估计 中中位位数数众众数数频频数数频频率率均均值值标标准准差差极极差差方方差差作作用用特特征征值值对对半半水水平平 个个体体位位置置百百分分比比平平均均水水平平稳稳定定性性稳稳定定性性稳稳定定性性平平均均水水平平聚中聚中(稳定稳定)性特征值性特征值:离散离散(波动波动)性特征值性特征值:结构性特征值结构性特征值:众数众数,平均数平均数中位数中位数,方方 差差,极差极差,标准差标准差频率频率,3 3原则原则(教学讲解课件)(教学讲解课件)特征值估计特征值估计 聚中聚中(稳定稳定)性特征值性特征值:离散离散(波动波动)性特
6、征值性特征值:众数众数,平均数平均数中位数中位数,方方 差差,极差极差,标准差标准差乙甲XX 22乙甲SS 注:注:常见的三类估计问题:常见的三类估计问题:乙甲XX 22乙甲SS,如何估计,如何估计 乙甲XX 22乙甲SS 已知已知 ,已知已知 ,如何估计,如何估计 已知已知 ,如何估计,如何估计 (教学讲解课件)(教学讲解课件)结构性特征值的作用结构性特征值的作用频率:频率:3 3原则:原则:参参选修选修2-32-3P P:79798080数据数据Y Yi i的的取值几乎全部集中在取值几乎全部集中在区间区间(-3-3,+3)内内数值数值Y Yi i分布在区间(分布在区间(-,+)内的概率为内
7、的概率为0.68260.6826数值数值Y Yi i分布在区间分布在区间(-2-2,+2)内的概率为内的概率为0.9544 0.9544 数值数值Y Yi i分布在区间分布在区间(-3-3,+3)内的概率为内的概率为0.9974 0.9974 即在即在正常状态下,正常状态下,可以认为:可以认为:而落在该而落在该区间区间之外的之外的可能性不到可能性不到33已知某组数据已知某组数据Y Y1 1,Y Y2 2,Y,Y3 3,的平均值为的平均值为,标准差为标准差为则在则在正常状态下,正常状态下,可以认为:可以认为:(教学讲解课件)(教学讲解课件)图图 估估 计计 1.1.条形图:条形图:2.2.直方图
8、:直方图:3.3.频率频率折线图:折线图:4.4.密度曲线:密度曲线:5.5.茎叶图:茎叶图:6.6.扇形图:扇形图:频率条形图中,纵坐标是频率频率条形图中,纵坐标是频率频率直方图中,面积是频率频率直方图中,面积是频率 7.7.雷达图雷达图 (教学讲解课件)(教学讲解课件)概率与统计简述概率与统计简述 总总 体体样样 本本抽样抽样估计估计推断推断回 归 分 析回 归 分 析相 关 分 析相 关 分 析分布列及期望分布列及期望概率概率计数计数简言之:回归分析就是简言之:回归分析就是确定关系确定关系相关关系相关关系近似近似(虚拟虚拟)成成(教学讲解课件)(教学讲解课件)回归分析的三大任务回归分析的
9、三大任务(步骤步骤)1.1.是否相关的判定:是否相关的判定:法法2 2:散点图法:散点图法 法法1 1:经验法:经验法 法法3 3:相关系数:相关系数 r 法法 法法5 5:数表法:数表法:法法4 4:关系式法:关系式法:(教学讲解课件)(教学讲解课件)相关系数相关系数 r 衡量变量之间相关程度的指标衡量变量之间相关程度的指标(1)(1)计算公式:计算公式:(2)(2)性质:性质:不不相相关关弱相关弱相关一般相关一般相关强相关强相关完完全全相相关关?!?!|r|1|1 0.2500.300.751|r|正相关正相关 r0 0 增函数增函数负相关负相关 r0 0 减函数减函数r 12211()(
10、)()()niiinniiiixx yyxxyy回归分析的三大任务回归分析的三大任务(步骤步骤)1.1.是否相关的判定:是否相关的判定:2.2.求回归方程及预报:求回归方程及预报:法法2 2:散点图法:散点图法 法法1 1:经验法:经验法 法法3 3:相关系数:相关系数 r 法法 法法5 5:数表法:数表法:法法4 4:关系式法:关系式法:线性回归线性回归 换元法换元法非线性回归非线性回归 axby,xyniix12,niiiyx1S2S2:故:故 ,b xbya 求求线性线性回归方程的书写格式回归方程的书写格式 S3S3:即所求回归方程为:即所求回归方程为 S1S1:由题意得:由题意得 S4
11、S4:利用回归方程做出预报:利用回归方程做出预报画图求数定相关画图求数定相关 二求方程三预报二求方程三预报直线必过中心点直线必过中心点 先算中心再斜率先算中心再斜率 代入求得纵截距代入求得纵截距 小题形法可估算小题形法可估算回归分析的三大任务回归分析的三大任务(步骤步骤)1.1.是否相关的判定:是否相关的判定:2.2.求回归方程及预报:求回归方程及预报:3.3.拟合效果的判定:拟合效果的判定:法法2 2:散点图法:散点图法 法法1 1:经验法:经验法 法法3 3:相关系数:相关系数 r 法法 法法5 5:数表法:数表法:法法4 4:关系式法:关系式法:线性回归线性回归 换元法换元法非线性回归非
12、线性回归 法法1 1:散点图法:散点图法:法法2 2:残差残差法:法:残差图法残差图法:残差平方和法:残差平方和法:法法3 3:相关指数:相关指数R R2 2法:法:误差误差 e(Error)随机随机(整体整体)误差误差 点点(个体个体)误差误差 残差残差 偏差偏差 回归差回归差 真实值预报值真实值预报值 预报值均值预报值均值 真实值均值真实值均值 yyiiiyyyyi以残差为纵坐标以残差为纵坐标 以其他指定的量为横坐标的散点图以其他指定的量为横坐标的散点图 若残差点比较均匀地落在水平的若残差点比较均匀地落在水平的 带状区域中、说明选用的模型计较合适带状区域中、说明选用的模型计较合适 若个别样
13、本点的残差比较大若个别样本点的残差比较大 即有异常点存在即有异常点存在 需确认是否数据的采集有错误需确认是否数据的采集有错误 残差图法残差图法 这样的带状区域的宽度越窄这样的带状区域的宽度越窄 说明模型拟合精度越高说明模型拟合精度越高 回归方程的预报精度越高回归方程的预报精度越高(教学讲解课件)(教学讲解课件)几种常见的残差分布示意图几种常见的残差分布示意图 图说明具有较好的线性关系图说明具有较好的线性关系 图说明具有相关关系,但模型有待改进图说明具有相关关系,但模型有待改进 图说明具有相关关系,需加入平方项图说明具有相关关系,需加入平方项 图说明具有相关关系,需引入变量图说明具有相关关系,需
14、引入变量 (教学讲解课件)(教学讲解课件)回归模型拟合效果的评判回归模型拟合效果的评判残差残差法法 残差图法残差图法:残差平方和法:残差平方和法:残差平方和越小,说明拟合效果越好残差平方和越小,说明拟合效果越好 21()niiiyy 称为残差平方和称为残差平方和 相关指数相关指数(样本决定系数或判定系数样本决定系数或判定系数)R R2 2法:法:计算公式:计算公式:作用:作用:R2 1,说明回归方程拟合的越好,说明回归方程拟合的越好 R20,说明回归方程拟合的越差,说明回归方程拟合的越差22121()11()niiiniiyyRyy残 差 平 方 和。总 偏 差 平 方 和在线性回归中恰好有:
15、相关指数在线性回归中恰好有:相关指数R R2 2相关系数相关系数r2 2 R R2 20,1 0,1 解释变量对预报变量的贡献率解释变量对预报变量的贡献率 118 118 独立性检验独立性检验 一、有关概念一、有关概念:二、二、独立性检验的简介独立性检验的简介:三、三、检验独立性的方法检验独立性的方法:1 1.定性变量与定量变量定性变量与定量变量:2.22.22 2 列联表:列联表:.频率法:频率法:.等高条形图法:等高条形图法:.卡方检验:卡方检验:1.1.卡方检验简述:卡方检验简述:3.3.书写格式:书写格式:2.2.操作步骤及三个细节:操作步骤及三个细节:概率与统计简述概率与统计简述 总
16、总 体体样样 本本抽样抽样估计估计推断推断回 归 分 析回 归 分 析相 关 分 析相 关 分 析分布列及期望分布列及期望概率概率计数计数回归分析回归分析重在分析两变量是否具有重在分析两变量是否具有因果关系因果关系 相关分析相关分析重在分析两变量是否重在分析两变量是否相互影响相互影响 (独立性检验独立性检验)(独立性检验独立性检验)定性变量:定性变量:定量变量:定量变量:定性变量的取值一定是实数,取值的大小定性变量的取值一定是实数,取值的大小 有特定的含义。不同取值之间的运算也有特定的含义有特定的含义。不同取值之间的运算也有特定的含义 又名分类变量、属性变量。它们的取值又名分类变量、属性变量。
17、它们的取值 一定是离散的。不同的取值,表示了个体所属的类别一定是离散的。不同的取值,表示了个体所属的类别 定量变量定量变量:如长度、重量、速度、温度如长度、重量、速度、温度定性变量定性变量:如某种产品分为一等品、二等品、三等品;如某种产品分为一等品、二等品、三等品;身份证的编号身份证的编号定量变量定量变量分类分类(定性,属性定性,属性)变量变量变量的分类变量的分类 解释变量解释变量 预报预报(响应响应)变量变量 一、有关概念一、有关概念:1 1.定性变量与定量变量定性变量与定量变量:2.22.22 2 列联表:列联表:若有两个分类变量若有两个分类变量X X和和Y Y,它们的可能取值分别为,它们
18、的可能取值分别为 x1,x2 和和 y1,y2,则称其样本频数列联表为,则称其样本频数列联表为2 22 2列联表列联表x1 x2y2y1总计总计总计总计abdcabcdcdabbdac注注1 1:顾名思义是顾名思义是两个两个分类变量的分类变量的频数表的并列与联合频数表的并列与联合将列联表逆时针旋将列联表逆时针旋90转成坐标系转成坐标系 注注2 2:是是回归分析的弱化,尽量选用:回归分析的弱化,尽量选用:x与与y注注3 3:要明确:要明确:a,b,c,d的位置,尤其是的位置,尤其是b,c的位置的位置二、二、独立性检验的简介独立性检验的简介:2.2.简言之,独立性检验是:简言之,独立性检验是:1.
19、1.详参:详参:检验两个分类变量是否具有关系的一种统计方法检验两个分类变量是否具有关系的一种统计方法统计学中统计学中“假设检验假设检验”的特例的特例选修选修2-32-3P P:90909797的内容的内容 4.4.回归分析与独立性检验的区别:回归分析与独立性检验的区别:回归分析重在分析两变量是否具有因果关系回归分析重在分析两变量是否具有因果关系 独立性检验重在分析两变量是否相互影响独立性检验重在分析两变量是否相互影响 与反证法很类似与反证法很类似S1S1:先假设两个变量之间:先假设两个变量之间独立独立(没有关系没有关系):):S2S2:然后根据小概率事件原理:然后根据小概率事件原理检验检验“假
展开阅读全文