卡方检验ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《卡方检验ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验 ppt 课件
- 资源描述:
-
1、心理统计黄华.Ch17:卡方分析date200909.17卡方分析卡方分析n品质品质数据数据及其整及其整理:理:列联表列联表n单因素单因素 检检验验:配合配合度检度检验验n双因素双因素 检检验验:一致一致性和性和独立独立性性n相关相关样本样本的的 检检验验n 检检验验SPSSSPSS操作操作.Review:品质变量和数量变量(:品质变量和数量变量(ch02)变量变量定定量的量的(Quantitative)(Quantitative)离散离散的的(Discrete)(Discrete)连续连续的的(Continuous)(Continuous)定定性的性的(Qualitative)(Qualit
2、ative)有序有序的的(Ordinal)(Ordinal)分分类类的的(Categorical)(Categorical).品质数据品质数据品质变量的结果表现为类别,各类别用符号或数字代码来测度品质变量的结果表现为类别,各类别用符号或数字代码来测度 例如例如:性:性别别 ( (男男, , 女女) )用用1 1跟跟2 2来表示来表示使用定类或定序尺度使用定类或定序尺度 你吸烟吗你吸烟吗? ? 1.1.是;是;2.2.否否 你赞成还是反你赞成还是反对对这一改革方案这一改革方案? ? 1.1.赞成;赞成;2.2.反反对对对品质数据的描述和分析通常使用列联表对品质数据的描述和分析通常使用列联表.列联
3、表列联表由两个以上的变量进行交叉分类的频数分布表由两个以上的变量进行交叉分类的频数分布表行行变量的变量的类别类别用用 r r 表示,表示, r ri i 表示第表示第 i i 个类别个类别列列变量的变量的类别类别用用 c c 表示,表示, c cj j 表示第表示第 j j 个类别个类别每种每种组组合合的的观察频观察频数用数用 f fijij 表示表示一个一个 r r 行行 c c 列列的的列联表称为列联表称为 r r c c 列联表列联表nf12+ f22f11+ f21合合计计f21+ f22f22f21i =2f11+ f12合合计计f12j =1j =1f11i =1列列( cj )行
4、行(ri) 列列.列联表:案例列联表:案例你在一个集团公司担任你在一个集团公司担任HRHR助助理理,本公司在四个不同,本公司在四个不同的的地区设有地区设有分分公司,公司,现现HRHR部门欲进行一项改革,此项改革可能涉及到各部门欲进行一项改革,此项改革可能涉及到各分分公司公司的的利益,故利益,故采采用用抽样调查方式,从四个抽样调查方式,从四个分分公司共抽取公司共抽取420420个样本单个样本单位位( (人人) ),了解,了解职工职工对对此项改革此项改革的的看法,调查结果如下表。问看法,调查结果如下表。问:不同不同的分的分公司公司的的员工员工对对方案方案的的态态度度有差有差异异吗?吗?一一分分公司
5、公司二二分分公司公司三三分分公司公司四四分分公司公司合合计计赞成赞成68755779279反反对对32753331141合合计计10012090110420.观察值的分布观察值的分布边缘分布边缘分布行边缘分布行边缘分布 行观察值的合计数的分布行观察值的合计数的分布 例如,赞成改革方案的共有例如,赞成改革方案的共有279279人,反对改革方案的人,反对改革方案的141141人人列边缘分布列边缘分布 列观察值的合计数的分布列观察值的合计数的分布 例如,四个分公司接受调查的人数分别为例如,四个分公司接受调查的人数分别为100100人人110110人人条件分布与条件频数条件分布与条件频数变量变量X X
6、条件下变量条件下变量Y Y的分布,或变量的分布,或变量Y Y条件下变量条件下变量X X的分布。的分布。每个具体的观察值称为条件频数每个具体的观察值称为条件频数.观察值的分布观察值的分布一一分分公司公司二二分分公司公司三三分分公司公司四四分分公司公司合合计计赞成赞成68755779279反反对对32753331141合合计计10012090110420列边缘分布列边缘分布行边缘分布行边缘分布条件频数条件频数.期望频数期望频数假定行假定行变量和变量和列列变量变量是独立是独立的的一个实际频一个实际频数数f fijij的期的期望频望频数数e eijij ,是总频,是总频数数n n乘以该实际频乘以该实际
7、频数数f fijij落入落入第第i i行行和和第第j j列列的的概率,即概率,即例如,第例如,第1 1行行和和第第1 1列列的的实际频实际频数数为为f f1111, ,它落在第它落在第1 1行行的的概率估概率估计值计值为该行为该行的的频频数数之之和和r r1 1除以总频除以总频数的数的个个数数n n,即,即r r1 1/ /n n;它落在第;它落在第1 1列列的的概率概率的的估估计值计值为该列为该列的的频频数数之之和和c c1 1除以总频除以总频数的数的个个数数n n ,即,即c c1 1/ /n n。根根据据概率乘法公式,该频概率乘法公式,该频数数落在第落在第1 1行行和和第第1 1列列的的
8、概率应为概率应为本案例中本案例中:ncrncnrnejiiiij ncnr116643.66420100279111111 ncrncnrne.期望频数的分布期望频数的分布根根据据上述公式上述公式计计算算的的前例前例的期的期望频望频数数一一分分公司公司二二分分公司公司三三分分公司公司四四分分公司公司赞成赞成实际频实际频数数68755779期期望频望频数数66806073反反对对实际频实际频数数32753331期期望频望频数数34403037.列联表的分析:列联表的分析: 检验检验用用于于检检验列联表中验列联表中变量变量之之间间是否存在显著是否存在显著性性差差异异,或者,或者用用于于检检验验变变
9、量量之之间间是否独立。是否独立。计计算公式为算公式为ijijijeef22)(列类别的期望频数行第列联表中第列类别的实际频数行第列联表中第式中:其自由度为jiijejiijfcr) 1)(1(.17卡方分析卡方分析n品质品质数据数据及其整及其整理:理:列联表列联表n单因素单因素 检检验验:配合配合度检度检验验n双因素双因素 检检验验:一致一致性和性和独立独立性性n相关相关样本样本的的 检检验验n 检检验验SPSSSPSS操作操作.单因素单因素 检验:配合度检验检验:配合度检验卡方配适(配合)度检定卡方配适(配合)度检定( (TheThe Chi-SqaureChi-Sqaure Goodnes
10、s-of-FitGoodness-of-Fit TestTest) ) 检检定资料定资料的的次次数分数分布是否合乎某种特定布是否合乎某种特定的分的分布布;我们经常想要知道样本在某些性质上的比例分布是否与总体相同,例如肇庆我们经常想要知道样本在某些性质上的比例分布是否与总体相同,例如肇庆市居民的年龄分布是否与全广东的人口年龄分布相同市居民的年龄分布是否与全广东的人口年龄分布相同?民意测验调查的样本民意测验调查的样本中,受访者的教育程度分布是否能正确反映广东人口的教育分布?中,受访者的教育程度分布是否能正确反映广东人口的教育分布?此类问题此类问题涉及到单因素的配合度的检验。涉及到单因素的配合度的检
11、验。 H H0 0:总体总体在某在某性性质上呈现某种比例质上呈现某种比例分分布布 H H1 1:总体总体不为某种比例不为某种比例分分布布.案例案例美国商业司以收入来将家户美国商业司以收入来将家户分分类。人口类。人口统计数据统计数据显示美国显示美国的的家庭收家庭收入有下列入有下列的分的分布布:JolietJoliet市市的的市长想要知道该市市长想要知道该市的的收入收入分分布是否与全美国布是否与全美国的的情况情况相相当当:在在JolietJoliet市中抽取市中抽取200200户人家来验证上述假设,并算出每层级收入户人家来验证上述假设,并算出每层级收入中,实际上观察到中,实际上观察到的的次次数分数
12、分布布(observed(observed frequencies)frequencies)分分别为别为5555, , 6565, , 7272, , 8 8。问问:该市该市的的收入收入分分布是否与全美国布是否与全美国的的情况情况相相当当.解答思路解答思路H H0 0: :p p1 1=.2,=.2, p p2 2=.3,=.3, p p3 3=.4,=.4, p p4 4=.1=.1H H1 1:H0H0中至少有一个比例不正确中至少有一个比例不正确;如果我们如果我们的的虚拟假设为真,则虚拟假设为真,则200200户预户预期的分期的分布为下表布为下表:将实际上观察到将实际上观察到的的次次数分数
13、分布与预布与预期的分期的分布作比较,如果布作比较,如果两两个次个次数数十十分分接近,则虚拟假设为真接近,则虚拟假设为真的的机率很大,但如果机率很大,但如果两两者差距很大,则我们虚者差距很大,则我们虚拟假设为真拟假设为真的的机率不高。机率不高。.解答思路解答思路cont.cont.如何知道如何知道两组数两组数字字的的差距是否够大?差距是否够大? 为了为了检检验验两两者者的的差距是否很大,差距是否很大,我们以一个简要我们以一个简要的的指标来衡指标来衡量量,即即 统计量统计量。42443233222212112)()()()(eeoeeoeeoeeo自由度显著水平) 1()(,122keeokikk
14、k.解答思路解答思路cont.cont.042.142 . 7800.417.625. 5)(122kikkkeeo)(2f201.34.1104.14 H3,01.20rejectCriticalCritical valuevalue = = 11.3411.34.配合度检验:总结配合度检验:总结由上述的讨论可知,卡方配合度由上述的讨论可知,卡方配合度检验检验的步骤为:的步骤为: (1)(1)对对于总于总体的分体的分布作了一些假设布作了一些假设; (2)(2)然后找出在假设为真然后找出在假设为真的的前提下,我们预前提下,我们预期期得到得到的的样本样本分分布;布; (3)(3)比较实际观察到比
展开阅读全文