书签 分享 收藏 举报 版权申诉 / 31
上传文档赚钱

类型统计学课件-列联分析.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2761788
  • 上传时间:2022-05-24
  • 格式:PPT
  • 页数:31
  • 大小:542.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《统计学课件-列联分析.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    统计学 课件 分析
    资源描述:

    1、列联分析列联分析列联表中的卡方检验列联表中的卡方检验列联表中的相关性测量列联表中的相关性测量 某集团公司打算进行一项改革,但此项改革涉及到各分公司的某集团公司打算进行一项改革,但此项改革涉及到各分公司的利益。今采用抽样方法分别从下设的四个分公司中共抽取利益。今采用抽样方法分别从下设的四个分公司中共抽取420名职名职工了解对此项改革的看法。如果四个分公司对改革的看法一致,则工了解对此项改革的看法。如果四个分公司对改革的看法一致,则决定实施这项改革。调查结果如下表所示:决定实施这项改革。调查结果如下表所示:公司1公司2公司3公司4合计赞成68755779279反对32453331141合计1001

    2、2090110420关于改革方案调查结果的样本数据关于改革方案调查结果的样本数据列联表列联表是描述两个分类变量的频数分布表。是描述两个分类变量的频数分布表。列联表中的卡方检验 C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT4nRC列联表取值多的变量表示为列变量取值少的变量表示为行变量列变量单元频数的合计行变量单元频数的合计样本容量单元观察频数ijf列联表的一般结构列联表的一般结构列联表中的卡方检验公司公司1公司公司2公司公司3公司公司4合计合计赞成赞成频数频数68755779279比率比率%6

    3、8.062.563.371.866.4反对反对频数频数32453331141比率比率%32.037.536.728.233.6合计合计频数频数10012090110420比率比率%100100100100100赞成或反对的比率的样本数据赞成或反对的比率的样本数据从样本数据上看,各公司的赞成(反对)比率存在差异。从样本数据上看,各公司的赞成(反对)比率存在差异。:0H从样本到总体的外推可通过假设从样本到总体的外推可通过假设检验完成。检验完成。赞成的比率一致。赞成的比率一致。赞成的比率不一致。赞成的比率不一致。:1H列联表中的卡方检验如果 为真,则总比率对各公司都适用。于是可根据总比率得出各单元的

    4、期望频数。公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420公司1公司2公司3公司4合计赞成66806073279反对34403037141合计10012090110420 观察频数(观察频数(observed frequency 简写简写f0) 期望频数(期望频数(expected frequency 简写简写fe )%4 .66%1004202791nRT总赞成比率:总赞成比率:总反对比率:总反对比率:%6 .33%1004201412nRTnRCnRCfTTTTeefTRTCn0H该单元的期望频数该单元的期望频数该单元所在行总

    5、频数该单元所在行总频数该单元所在列总频数该单元所在列总频数样本容量样本容量列联表中的卡方检验2204260.000.050.100.150.250.208100.302eefff202观察频数与期望频差异的观察频数与期望频差异的大小以大小以 统计量衡量。统计量衡量。 11CR 统计量服从自由度为 的分布。自由度为3 的分布2自由度为1 的分布2自由度为10 的分布2自由度为20 的分布2列联表中的卡方检验寻找自由度 自由度是可以自由取值的数据个数。列联自由度是可以自由取值的数据个数。列联表中的行与列的总和是固定的。总有一行和一列表中的行与列的总和是固定的。总有一行和一列的取值不是自由的。自由度

    6、的取值不是自由的。自由度=(R-1)()(C-1)=(2-1)()(2-1)。)。C1C2合计R1f11f12RT1R2f21f22RT2合计CT1CT2n列联表中的卡方检验公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420 关于改革方案调查结果样本数据列联表的自由度关于改革方案调查结果样本数据列联表的自由度自由度自由度= 3141211CR列联表中的卡方检验自由度用以衡量列联表的大小。自由度用以衡量列联表的大小。C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT

    7、3合计CT1CT2CT3CT434列联表26列联表列联表6141311CR自由度5161211CR自由度C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT4C1C2C3C4C5C6合计R1f11f12f13f14f15f16RT1R2f21f22f23f24f25f26RT2合计CT1CT2CT3CT4CT5CT6列联表中的卡方检验687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11

    8、760.62500.30000.97303.0319eefff202eeofff22eoff eoff efof列联表中的卡方检验26.2513.0319拒绝域拒绝域接受域接受域1 . 01 . 031412 251. 6321 . 0251. 60319. 3202eefff结论:结论: 接受接受“赞成的比率一致赞成的比率一致”的原假设。即的原假设。即集团公司所属四个分公司的全体职工一致赞集团公司所属四个分公司的全体职工一致赞成此项改革。样本数据中赞成比率的差异由成此项改革。样本数据中赞成比率的差异由抽样的随机性所造成。抽样的随机性所造成。自由度为3的 分布经计算经计算查表得临界值查表得临界

    9、值已已知知自由度=20列联表中的卡方检验 某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上有人提出男性与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将有人提出男性与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将针对不同的目标市场采取不同的推销策略;若相同,公司将发起对所有针对不同的目标市场采取不同的推销策略;若相同,公司将发起对所有啤酒的广告运动。啤酒的广告运动。淡啤普啤 黑啤合计男性20402080女性30301070合计507030150男性与女性饮者啤酒偏好的样本数据男性与女性饮者啤酒偏好的样本数据列联表中的卡方检验

    10、从样本数据上看,男性与女性的啤酒偏好比率存在差异。从样本数据上看,男性与女性的啤酒偏好比率存在差异。淡啤普啤 黑啤合计频数比率%频数比率%频数比率%频数比率%男性2025.04050.02025.080100女性3042.93042.91014.270100合计5033.37046.73020.0150100 从样本到总体的外推应通从样本到总体的外推应通过假设检验完成。过假设检验完成。不同性别饮酒偏好比率的样本数据不同性别饮酒偏好比率的样本数据:10HH男性与女性啤酒偏好相同男性与女性啤酒偏好相同男性与女性啤酒偏好不同男性与女性啤酒偏好不同列联表中的卡方检验 如果如果H0为真,则代表饮酒偏好的

    11、总比为真,则代表饮酒偏好的总比率对男性和女性饮酒者都适用,于是可根率对男性和女性饮酒者都适用,于是可根据总比率得出各单元的期望频数。据总比率得出各单元的期望频数。淡啤普啤 黑啤合计男性26.6737.3316.0080女性23.3332.6714.0070合计507030150观察频数(观察频数(observed frequency 简写简写f0)期望频数(期望频数(expected frequency 简写简写fe )%3.33%10015050总比率:总比率:%7.46%10015070%0 .20%10015030淡淡啤啤普普啤啤黑黑啤啤nCRfTTeefTRTCn淡啤普啤 黑啤合计男性

    12、20402080女性30301070合计507030150式中:式中:该单元的期望频数该单元的期望频数该单元所在行总频数该单元所在行总频数该单元所在列总频数该单元所在列总频数样本容量样本容量期望频数:期望频数:列联表中的卡方检验注意:注意: 用用 进行假设检验时,每一单元的期望频数至少为进行假设检验时,每一单元的期望频数至少为5。当某一单。当某一单元的期望频数小于元的期望频数小于5时,通常将相邻的类合并以使每一单元的期望频数时,通常将相邻的类合并以使每一单元的期望频数大于或等于大于或等于5。eefff20222服从自由度为(服从自由度为(R-1)()(C-1)的)的 分布。分布。列联表中的卡方

    13、检验性别性别偏好偏好男男男男男男女女女女女女淡啤淡啤普啤普啤黑啤黑啤淡啤淡啤普啤普啤黑啤黑啤20402030301026.6737.3316.0023.3332.6714.00-6.672.674.006.67-2.67-4.0044.497.1316.0044.497.1316.001.670.191.001.910.221.146.13eefff202eeofff22eoff eoff efof判定饮酒偏好是否与饮酒者性别有关所需判定饮酒偏好是否与饮酒者性别有关所需检验统计量的计算检验统计量的计算列联表中的卡方检验05. 021312 99.5205.099. 513. 6202eefff

    14、结论:结论: 拒绝拒绝 “男性与女性啤酒偏好相同男性与女性啤酒偏好相同”的原假设并接受的原假设并接受“男性与女性啤酒偏好不同男性与女性啤酒偏好不同”的备择假设。即啤酒的偏好的备择假设。即啤酒的偏好与性别是有关联的。与性别是有关联的。已知:已知:自由度自由度=查表得临界值:查表得临界值:经计算:经计算:列联表中的卡方检验相关系数相关系数C相关系数相关系数V相关系数相关系数列联表中的相关性测量dbcadcbabcad相关系数计算公式相关系数计算公式10适用于适用于2 2列联表列联表03 . 007 . 03 . 017 . 0C1C2合计合计R1aba+bR2cdc+d合计合计a+cb+dn22列

    15、联表列联表无相关无相关完全相关完全相关弱相关弱相关中度相关中度相关高度相关高度相关1相关系数dbbcaaRbcad 0bcaddacadcbabcaddbcadcbabcad10bcadC1C2合计R1aba+bR2cdc+d合计a+cb+dn22列联表列联表化简得:可充当测量相关性的尺度。可充当测量相关性的尺度。即:即:因为因为于是得:于是得:变量变量 与变量与变量 不相关时,有不相关时,有C因此,因此,相关系数22列联表列联表 12bcbcbcbcdbcadcbabcad完全相关的两种情况完全相关的两种情况C1C2合计R1a0a+bR20dc+d合计a+cb+dn22列联表列联表C1C2合

    16、计R10ba+bR2c0c+d合计a+cb+dn相关系数 相关系数与相关系数与 统计量的关系统计量的关系ndbbafe12ncabafe11ndccafe21ndcdbfe2222nn22或或相关系数22列联表列联表C1C2合计R1aba+bR2cdc+d合计a+cb+dn222222222122112212112112ndbcadcbabcadndbcadcbabcadnffdffcffbffaeeeeeeee 丹麦人与法国人以同样的眼光看丹麦人与法国人以同样的眼光看待陌生人吗?一次抽样调查中就待陌生人吗?一次抽样调查中就“你认为大多数人都可信赖呢?还你认为大多数人都可信赖呢?还是认为与人相

    17、处要处处小心?是认为与人相处要处处小心?”这这一问题,获得数据如下表。一问题,获得数据如下表。 要求:判定要求:判定“国籍国籍”与与“态度态度”两变量间的相关性。两变量间的相关性。丹麦法国合计信任625206831怀疑3607631123合计985969195422列联表列联表43. 09699851123831763525dbcadcbabcad相关系数比较适用于相关系数比较适用于22列联表。列联表的行数和列数大于列联表。列联表的行数和列数大于2时,时, 相关相关系数会出现大于是系数会出现大于是1情况。情况。相关系数nC2210C适用于大于适用于大于2 2列联表列联表0CC列联表223344

    18、C的最大值0.70710.81650.87的最大值依赖于列联表的行列数的最大值依赖于列联表的行列数无相关无相关C相关系数(列联系数)计算公式相关系数(列联系数)计算公式C相关系数 一种原料来自三个不同的地区,原料质量被分成三一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取个不同等级。从这批原料中随机抽取500件进行检验,件进行检验,得样本数据如下表所示:得样本数据如下表所示:一级二级三级合计地区1526424140地区2605952171地区3506574189合计162188150500原料抽样数据原料抽样数据要求:检验地区与原料质量之间有无依赖关系。要求:检验地

    19、区与原料质量之间有无依赖关系。C相关系数性别偏差11122233312312312352642460595250657445.3652.6442.0055.4064.3051.3061.2471.0656.706.6411.36-18.004.60 5.300. 70-11.24 -6.0617.3044.09129.05324.0021.1628. 090.49126.3436.72299.290.972.457.710.380.440.012.060.525.28合计19.82eeofff22eoff eoff efof为判定地区是否与原料质量相关所需为判定地区是否与原料质量相关所需 统计量的计算统计量的计算2C相关系数82.19202eefff195.050082.1982.1922nC199. 050082.192n12LnV10 V适用于大于适用于大于2 2列联表列联表VL时2141.01350082.1912LnV计算结果表明:计算结果表明:“地区地区”与与“原料质量原料质量”之间低度相关。之间低度相关。L列联表行数和列数列联表行数和列数中较小者。中较小者。V相关系数计算公式相关系数计算公式V相关系数解决了相关系数无上界和C相关系数小于1的情况。两个变量无相关时V=0;两个变量完全相关时V=1。V相关系数结 束

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:统计学课件-列联分析.ppt
    链接地址:https://www.163wenku.com/p-2761788.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库