社会统计学(卢淑华版)PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《社会统计学(卢淑华版)PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会 统计学 卢淑华版 PPT 课件
- 资源描述:
-
1、第八章类别变量与尺度变量关系的假设检验方差分析 8.1方差分析的原理 8.2一元方差分析 8.3二元方差分析2022-5-151第一节 方差分析的原理 一、方差分析及其有关术语一、方差分析及其有关术语 1 1、什么是方差分析、什么是方差分析 方差分析通过分析数据的误差判断各总体均值是否相等来检验多个总体均值是否相等,从而研究分类型自变量对数值型因变量的影响。 根据自变量的多少,方差分析可分分为单因素方差、双因素方差分析和多因素方差分析。 2 2、因素或因子、因素或因子 因素或因子是指所要检验的对象。 3 3、水平或处理、水平或处理 水平或处理是指因子的不同表现。2022-5-152第一节 方差
2、分析的原理 4 4、观察值、观察值 观察值是指在每个因素水平下得到的样本数据。 二、方差分析的基本思想和原理方差分析的基本思想和原理 1 1、基本思想、基本思想 方差分析通过对数据误差来源的分析判断不同总体的均值是否相等。 2 2、基本原理、基本原理 两类误差 随机误差 因素的同一水平(总体)下,由随机因素的影响造成的样本各观察值之间的差异称为随机误差。2022-5-153第一节 方差分析的原理 系统误差 因素的不同水平(不同总体)下由系统性因素造成的样本各观察值之间观察值的差异称为系统误差。 误差平方和SS 数据的误差用平方和(sum of squares)表示,分为组内平方和和组间平方和。
3、 组内平方和 组内平方和是指因素的同一水平下数据误差的平方和,组内平方和只包括随机误差。 组间平方和 组间平方和是指因素的不同水平之间数据误差的平方和,组间平方和既包括随机误差,也包括系统误差。2022-5-154第一节 方差分析的原理 均方MS 均方是指平方和除以相应的自由度。 基本原理 若原假设(自变量对因变量没有影响)成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近1;若原假设不成立,组间均方会大于组内均方,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,即自变量对因变量有影响。 三、方差分析的基本假定三、方差分析的基本假定 1 1、
4、每个总体都应服从正态分布、每个总体都应服从正态分布自变量对因变量没有影响,则没有系统性误差,组间平方和中只有随机误差。2022-5-155第一节 方差分析的原理 对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。 2 2、各个总体的方差必须相同、各个总体的方差必须相同 各组观察数据是从具有相同方差的总体中抽取的。 3 3、观察值是独立的、观察值是独立的 四、问题的一般提法四、问题的一般提法 1、设因素有m个水平,每个水平的均值分别用 1 , , 2,, , m表示 2、要检验m个水平(总体)的均值是否相等,需要提出如下假设: H0 : 1 2 m H1 : 1 , 2 , ,
5、m 不全相等2022-5-156第二节:单因素方差分析/一元方差分析 一、数据结构一、数据结构 2022-5-157第二节:单因素方差分析/一元方差分析 二、分析步骤二、分析步骤 1 1、提出假设、提出假设H0 :1 = 2 = m 自变量对因变量没有显著影响 H1 :1 ,2 , ,k不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 2 2、构造检验的统计量、构造检验的统计量 水平的均值2022-5-158第二节:单因素方差分析/一元方差分析 假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的
6、全部观察值总和除以观察值的个数。计算公式:),2 ,1(1kinxxinjijii式中: ni为第 i 个总体的样本观察值个数,xij 为第 i 个总体的第 j 个观察值。计算全部观察值的总均值用全部观察值的总和除以观察值的总个数,计算公式:mmiiiminjijnnnnnxnnxxi21111 式中:2022-5-159第二节:单因素方差分析/一元方差分析 计算总误差平方和TSS 总误差平方和 TSS是全部观察值 与总平均值 的离差平方和,反映全部观察值的离散状况,其计算公式为:xminjijixxTSS112计算组间平方和BSSixx组间平方和是各组平均值组间平方和是各组平均值 与总平均值
7、 的离差平方和,反映各总体的样本均值之间的差异程度,计算公式为:kiiiminjixxnxxBSSi121122022-5-1510第二节:单因素方差分析/一元方差分析 计算组内平方和RSS 组内平方和是每个水平或组的各样本数据与其组平均值的离差平方和,该平方和反映的是随机误差的大小,计算公式为:minjiijixxRSS112三个平方和的关系TSS = BSS + RSS2022-5-1511第二节:单因素方差分析/一元方差分析 计算均方MS 各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方均方,也称为方差。均方由误差平方和除以相应的自由
8、度求得,三个平方和对应的自由度分别是:TSS 的自由度为n-1,其中n为全部观察值的个数BSS的自由度为m-1,其中m为因素水平(总体)的个数RSS 的自由度为n-m组间方差MSB:1mBSSMSB组内方差MSR:mnRSSMSR2022-5-1512第二节:单因素方差分析/一元方差分析3 3、计算检验统计量、计算检验统计量 F F), 1(/1/mnmFMSRMSBmnMSRmBSSF4、统计决策统计决策将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策。例(参见教材例(参见教材376376页例页例1 1、383383页例页例2 2)为了研究职业对家庭赡养人数的影响,
9、研究者抽查了某企业41名员工的家庭赡养人数(如下表),试判断职业对家庭赡养人数是否有影响。家庭赡养人数职业管理人员35 054 423132 3 3 2 4 2 6 1工人13 446 234352 4技术员64 223 0531212022-5-1513第二节:单因素方差分析 变量间关系的强度用自变量平方和(BSS) 占总平方和(TSS)的比例大小来反映,自变量平方和占总平方和的比例记为R2 ,即:)()(2总平方和组间平方和TSSBSSR 其平方根R就可以用来测量两个变量之间的关系强度。三、关系强度的测量三、关系强度的测量拒绝原假设表明因素(自变量)与观测值之间有显著关系,组间平方和(BS
10、S)度量了自变量(行业)对因变量(投诉次数)的影响效应。只要组间平方和BSS不等于0,就表明两个变量之间有关系(只是是否显著的问题) 。当组间平方和比组内平方和(SSE)大,而且大到一定程度时,就意味着两个变量之间的关系显著,大得越多,表明它们之间的关系就越强。反之,就意味着两个变量之间的关系不显著,小得越多,表明它们之间的关系就越弱。 2022-5-1514第三节第三节 双因素方差分析双因素方差分析/ /二元方差分析二元方差分析 一、二元方差分析的数学模型一、二元方差分析的数学模型 二元方差又称双因素方差分析,用来分析两个因素(行因素Row和列因素Column)对试验结果的影响。 设两个自变
11、量A和B作用于总体,其中自变量A有a种取值:A1,A2,Aa,自变量B有b种取值:B1,B2,Bb。变量A的取值为Ai 、变量B的取值为Bj 时因变量y的取值为yij 无交互作用的二元方差分析模型无交互作用的二元方差分析模型 如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的二元方差分析称为无交互作用的二元方差分析或无重复二元方差分析(Two-factor without replication) 。2022-5-1515 因变量y与自变量A、B之间的关系可以表达为以下模型:ijjiijyij相互独立,并且服务正态分布:2, 0Nij都是未知参数,且有:及
12、、2ji01aii01bjj有交互作用的二元方差分析模型如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析或可重复双因素方差分析 (Two-factor with replication )。2022-5-1516 因变量y与自变量A、B之间的关系可以表达为以下模型:ijkijjiijkyijk相互独立,并且服务正态分布:2, 0Nijk都是未知参数,且有:及、2ijji01aii01bjjK=1,2,r r为自变量A和B每种搭配的重复数01bjj01aii2022-5-1517 二、无交互作用的二元方差分
展开阅读全文