多层统计分析模型课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多层统计分析模型课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多层 统计分析 模型 课件
- 资源描述:
-
1、多层统计分析模型陶庄中国CDC卫生统计研究室绪论青蛙与池塘(“Frog-pond theory”)n青蛙学生个体;n池塘学校环境;n学生的成绩好坏不仅受到个体本身的影响,也受到学校环境的影响!多层数据n低一层(低水平)单位(个体)低一层(低水平)单位(个体)的数据的数据嵌嵌套(套(nested)于于高一层(高水平)的单位高一层(高水平)的单位(组群)(组群)之中。之中。n结局变量,个体解释变量,结局变量,个体解释变量,场景变量场景变量(contextual variables)组内观察相关(within-group observation dependence)n同一组内的个体,较不同组的个体
2、而言,在观念、行为等很多方面更为接近或相似;即便不是刻意分组,也是如此。n组内同质(within-group homogeneity),组间异质(between-group heterogeneity)n很小的相关将导致很大的I类错误。多层数据的常见来源n复杂抽样;n多中心临床试验;n纵向研究(longitudinal studies)与重复测量(repeated measures);n“高低搭配”;nMeta分析;n多层统计模型的研究内容n哪些个体解释变量会影响结局变量;n哪些场景变量会影响结局变量;n个体解释变量对结局变量的影响是否会受到场景变量的影响。多层统计模型出现前对多层数据进行分析
3、的探索探索(1)分别估计n在个体水平和组群水平分别进行分析;n试图用单一的个体水平模型的分析结果来推论另一水平的统计结果。jjjijijijxylevelxylevel1010:2:1探索(2)传统回归n用传统的固定效应回归模型中一般的交互项理解多层数据中的跨层(cross-level)交互作用。ijjijjijijzxzxy3210探索(3)两步模型(two-stage model)n第一步模型,对各组分别进行同一回归模型估计,获得一系列的系数;n对这些系数的恒定性进行检验;n如果不恒定,则进行第二步模型,以组变量为因变量,系数为自变量进行回归。探索(3)两步模型的问题n无论哪一步均使用OL
4、S,并不适用;n当组群过多,则十分麻烦;n某些组内样本量很少时,进行回归不稳定;n将每个组群认为是不相关的,忽略了其为从一大样本中抽取的事实。多层统计模型的出现n研究的学者很多;n系统的主要为两;n研究的理论没有根本上的分歧;n双方研究成果的发布时间基本相同(上世纪80年代末90年代初);n分别有各自分析的成熟的软件;n目前,大家基本上接受两组人分别独立开发出同一模型的结果。S.Raudenbush与A.Brykn模型称为:hierarchical linear model;n软件为:HLMH.Goldsteinn模型称为:multilevel models;n软件为:MLwiN(早期版本称M
5、L3,MLn)多层统计模型的名称nmultilevel modelsnhierarchical linear modelnrandom-effect modelnrandom coefficient modelnvarious component modelnmixed-effect modelnempirical Bayes model多层统计模型的优点n同时分析组效应和个体效应;n不需有独立性假设;n对稀疏(sparse)数据,即每组样本很少的数据,特别有效;n特别适合对发展模型(GM)的分析。多层统计模型的局限性(1)n模型复杂,不够简约;n需较大样本以保证稳定性;n组群数量较少,会出现
6、偏倚;n高水平单位并非严格抽样获得;n某些场景变量通常是各组个体的聚集性测量,而不是总体内个体的聚集性测量;多层统计模型的局限性(2)n研究对象一般具有流动性,即受到群组影响的程度不同,虽可用出入时间进行控制,但此信息一般不可知;n依然存在自变量带有测量误差的问题,必需借助于结构方程模型(SEM);n完全嵌套假设,即每一个低水平单位嵌套、且仅嵌套于一个高水平单位。用于多层统计模型的软件n专门软件:HLM;MLwiN;SuperMIX;aML;EGRET;LISREL;Mplus等。n通用统计学软件:SAS;SPSS;stata;S-plus/R等。线性多层统计模型基础知识组内相关系数(Intr
7、a-Class Correlation Coefficient,ICC)222bwbICCn组间方差占总方差的比例。n可使用对“空模型”的拟合获得;n值域在0到1之间,越接近1,说明相关越明显;n对ICC的检验是是否选择多层模型的依据。两水平模型的公式表达空模型(又称截距模型)ijjijjjijjijeuytotaluleveleylevel00000000:2:1两个水平1自变量、一个水平2自变量ijijjjijjijijjijjjjjjjijijjijjijezuuzwzxwytotaluwuwlevelezxylevel1101111110111010011111010101000111
8、10:2:1一般模型ijqjQqqijjqijQqMmmjqmQqqijqPppijpMmmjmijQjMmmjQmQQjjMmmjmjjMmmjmjijQqqijqjPppijpjijeuzuzwzxwytotaluwuwuwlevelezxylevel1011101100010111101010000110:2:1SAS中的公式表达eZXY模型假设0,0,00,0102120120120102jijjijuuuujjijueCovueCovNuuNe模型假设SAS的表达IRNGRGeuVareuEuuuuuuuuu2222122022122120120220120000000固定和随机回归
9、系数Level 2 vari ati onLevel 2 vari ati onI ntake achi evem entI ntake achi evem entExamExamScoreScore0 01 12 23 34 45 56 60 00.50.51 1模型估计方法最大似然法(ML)n包括普通最大似然法(ML)和限制性最大似然法(REML);n两者用于估计的残差基础不同,后者的残差包括所有的随机变异;nREML是SAS的MIXED过程和HLM的默认算法;nREML通常用于组数量较少的模型;nML可以用于模型比较,而REML不行;nREML估计较优,而ML较快。最小二乘法(LS)n包
展开阅读全文