缺失值多重插补原理及软件实现-PPT精品课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《缺失值多重插补原理及软件实现-PPT精品课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 缺失 多重 原理 软件 实现 PPT 精品 课件
- 资源描述:
-
1、 缺失值多重插补原理及软件实现01缺失值多重插补的基础知识02缺失值多重插补的软件操作目 录CONTENTS04缺失值多重插补的SCISCI论文写作要点03缺失值多重插补的注意事项缺失值多重插补的基础知识PART 01前言临床研究面临的情况非常复杂,资料收集困难重重。在临床研究中,即使质量控制很好,也会出现或多或少的资料记录不完整,即数据缺失。在人口学资料、暴露或干预测量指标、结局指标等各方面的数据中,都会遇到缺失数据,有些关键数据的缺失会导致整条病例资料不可使用。数据缺失的类型MCAR项目一完全随机缺失(MCAR):是指数据是否缺失与存在缺失的变量无关,与其他变量也无关,就是一个偶然发生的随
2、机事件。随机缺失(MAR):是相对更为常见的一类缺失形式,此时缺失数据可能和其他变量相关,但与存在缺失的变量本身无关。非随机缺失(MNAR):是指数据的缺失与否只与存在缺失的变量本身有关。MARMANR缺失数据处理的几种不靠谱方法删除数据学术造假闭口不提缺失数据处理的神技:多重插补学术造假闭口不提 多重插补法由Rubin在1978年提出的一种缺失数据估算方法,它能够减少由缺失数据带来的不确定性,增加了估计的效率。 多重填充法适用于MCAR 和MAR数据缺失的机制,并且要求数据满足多元正态分布。缺失数据处理的神技:多重插补删除数据学术造假闭口不提多重插补的思路把来自于各个数据集的统计结果进行综合
3、, 得到总体参数的估计值。用标准的统计分析过程对多次替换后产生的若干个数据集进行分析。多重插补技术用一系列可能的值来替换每一个缺失值, 以反映被替换的缺失数据的不确定性。多重插补SCI论文发表情况删除数据学术造假闭口不提多重插补,是缺失值处理中应用最为普遍和成熟的方法之一,已经在众多的SCI文章中使用,以“multiple imputation”Title/Abstract为检索式在pumbed数据库的标题和摘要字段进行检索后发现:截止到2017年6月15日,有1842篇文章中用到此方法。多重插补SCI论文发表情况删除数据学术造假闭口不提各年发表的多重插补相关论文分布情况如下图所示:缺失值多重
4、插补的软件操作PART 02实例介绍前列腺癌细胞是否扩散到邻近的淋巴结,是选择治疗方案的重要依据。为了了解淋巴组织中有无癌转移,通常的做法是对病人实施腹术探查,并在显微镜下检查淋巴组织。为了不手术而又能弄清淋巴结的转移情况,Brown教授在术前检查了53例前列腺癌的患者,分别记录了年龄(AGE)、酸性磷酸酯酶(ACID) ,射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤位置(STAGE),以及手术探查结果变量(NODES)。 射线淋巴结转移实例介绍年龄(AGE)、酸性磷酸酯酶(ACID)为连续性变量,射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤位置
5、(STAGE)为分类变量。按0,1赋值,其值1表示阳性或较严重情况,0表示阴性或较轻情况,还有手术探查结果变量NODES,1表示有淋巴结转移,0表示无淋巴结转移。实例介绍原始研究的EXCEL表格中没有缺失值的完整数据,将其另存为“文本文件(制表符分隔)”并命名为:P,放在一个同样名为的新建文件夹中。实例介绍将原始的完整EXCEL表格文件,随便删除一些变量数据(研究编号(o)、射线(X_RAY) 、手术探查结果变量NODES不删除)。实例介绍将其另存为“文本文件(制表符分隔)”并命名为:Pqueshi,放在一个同样名为queshi的新建文件夹中。软件准备 采用的软件是易侕统计软件,该软件由美国&
6、solutions公司研究的一套全新设计的数据分析软件。该软件后台程序以软件为平台,受国际认可。于2013年底面向中国科研人员开发了中文版本。软件准备下面介绍软件的下载、安装和登陆方法。百度“易侕统计”进入第一条网页软件准备登陆网站下载 “易侕统计”到电脑上并安装软件准备进入软件登陆界面,点击右上角“注册新账号”,只要填写一个电子邮箱即可免费使用本软件一个月软件准备 该软件不同到传统的SPSS软件、SAS软件,可以在网上找到所谓的破解版,而是采用于在线登陆方式访问,下载并安装软件后,每次登陆时都需要在联网的情况下输入用户名和密码才能访问。软件操作步骤研究方法多重插补的软件操作:仅需五个步骤研究
7、方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果首先导入数据。打开“易侕软件”,点击菜单“分析项目”“创建新项目”,读入刚刚保存的文本文件(制表符分隔)Paqueshi.txt,再点击下方“读取数据文件”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果数据导入成功研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来,统计一下数据集中的变量缺失情况。点击菜单“数据操作”“变量取值(缺失)组合” 。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果 进入“变量取值(缺失)组合”界面后,在将缺失变量(下图右方蓝色部分)用鼠标拖入“选择变量
8、”框中,其他设置不变,再点击下方的“查看结果”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果软件显示出该数据集的数据缺失情况:每个变量缺失的情况;多个变量缺失组合情况。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来,我们来使用“多重插补”补全缺失数据。点击菜单“数据操作”“多重插补缺失生成新数据” 。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果 进入“多重插补缺失生成新数据”界面后,在将缺失变量(下图右方蓝色部分)用鼠标拖入“选择变量”框中,填写生成两组新数据,同时勾选输出数据包括原始数据,再点击保存和查看结果。研究方法合并多套结
9、果导入数据统计缺失情况估算缺失数据检查插补效果软件自动运行大约一段时间后(视数据的多少而定)。将显示结果研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果在软件左侧“多重插补缺失生成新数据”分支树里的Paqueshi_2_tbl1.txt处单击右键,选择图中第一个Paqueshi_2_tbl1.mi.xls”中表格再单击,在弹出的对话框中选择“是”,软件将会自动打开EXCEL表格。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果打开EXCEL表格后,软件生成的3套数据,第一套是原始缺失数据,第二套和第三套是插补的新数据,并新生成了一个变量”mi.iter”研究方法
展开阅读全文