复杂疾病的遗传学研究-研究设计与统计分析方法课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《复杂疾病的遗传学研究-研究设计与统计分析方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 复杂 疾病 遗传学 研究 设计 统计分析 方法 课件
- 资源描述:
-
1、复杂疾病的遗传学研究复杂疾病的遗传学研究研究设计与统计分析方法研究设计与统计分析方法北京大学公共卫生学院北京大学公共卫生学院流行病学与卫生统计学系流行病学与卫生统计学系陈大方陈大方 教授教授 内内 容容 一一概述概述二二研究设计方法研究设计方法三三统计分析方法统计分析方法四四分析实例分析实例 一一概概 述述疾病的分类疾病的分类 随着人类基因组计划的完成和后基因组计划的开展,人们对于疾病的认识也越来越深入。已有的研究结果发现人类疾病都与基因受损有关,因此提出了基因病-人类疾病的新概念。由此提出将人类疾病分为三种类型。 第一类是单基因病。仅由单个基因DNA序列某个碱基对的改变就造成疾病,并且可以把
2、这样的改变传递给后代。如血友病A、白化病等。 第二类是多基因病(复杂性疾病)。这类疾病的发生涉及两个以上基因的结构或表达调控的改变,主要指慢性非传染性疾病,如肿瘤、高血压、冠心病、糖尿病、哮喘病、骨质疏松症、神经性疾病、原发性癫痫等。 第三类为获得性基因病。主要是传染病由病原微生物通过感染将其基因入侵到宿主基因引起。如HIV。复杂性疾病的特征复杂性疾病的特征Genetic HeterogeneityGenetic Heterogeneity(遗传异质性)(遗传异质性)Gene-Gene and Gene-Environment Gene-Gene and Gene-Environment In
3、teractionInteraction(基因基因,基因环境的交互作用(基因基因,基因环境的交互作用) )Incomplete PenetranceIncomplete Penetrance(不完全外显性)(不完全外显性)PhenocopyPhenocopy(拟表型)(拟表型)PleiotropyPleiotropy(多效性)(多效性)二二研究设计方法研究设计方法患病家系成员设计患病家系成员设计 优点: 具有明显的孟德尔遗传特点。 遗传方式确定(常显、常隐或X连锁)。 缺点: 如果指定的遗传方式不正确,可能导致错误的结论。 难以收集到家系全部人员。患病家系成员设计患病家系成员设计 患病同胞对设
4、计患病同胞对患病同胞对表型不一表型不一致同胞对致同胞对 患病同胞对设计患病同胞对设计 优点:可以进行非参数统计分析。研究对象相对容易收集。 缺点:检验效能相对较低样本量要求较大患病先证者核心家系设计患病先证者核心家系设计 优点:可以进行非参数统计分析。研究对象相对容易收集。 缺点:统计分析时仅仅杂合子的双亲可以有效利用。对于迟发性疾病难以收集到双亲资料。患病先证者核心家系设计患病先证者核心家系设计 双生子研究设计双生子研究设计 通过比较在相似或不同环境中成长起来的同卵双生子及异卵双生子某一疾病或性状发生的一致性,来判断遗传与环境因素的作用。 养子研究设计养子研究设计 通过比较、分析养子与其同胞
5、及生身父母某疾病或性状的相似性和与其寄养同胞或养父母的相似性,研究在某种疾病或性状发生中遗传因素与环境因素相对作用的大小。家系研究中其它研究设计方法家系研究中其它研究设计方法 半同胞研究设计半同胞研究设计 是指同父异母或同母异父的兄弟姐妹。根据半同胞中所研究疾病的患病情况,可分析疾病或遗传性状来自父方或母方。病例对照研究设计病例对照研究设计 优点:相对容易收集到资料。 投入少,产出高。 缺点:由于存在连锁不平衡和种群分层, 容易导致假阳性或假阴性。病例对照研究设计病例对照研究设计背背 景景19941994年年PiegorsehPiegorseh、BegsBegs等提出等提出 遗传与环境的关系遗
6、传与环境的关系 交互作用交互作用单纯病例研究单纯病例研究 应用前提条件应用前提条件 在正常人群中基因型与环境暴露各自独立发生,在正常人群中基因型与环境暴露各自独立发生, 所研究疾病为罕见病。所研究疾病为罕见病。衍生的研究设计方法衍生的研究设计方法 研究示意图研究示意图单纯病例研究单纯病例研究环境暴露环境暴露基因型基因型病人病人+ +- -+ +- -+ +- -三三统计分析方法统计分析方法 表型与基因型常规统计分析病例-父母三结构资料的TDT分析同胞数据SDT分析以家系为基础的关联分析 (FBAT)交互作用分析连锁分析单体型分析 全基因组关联分析 统计分析方法统计分析方法 分析基因型与表型的关
7、系,也就是比较不同基因分析基因型与表型的关系,也就是比较不同基因型的研究对象的表型是否存在差异,如基因型不同,型的研究对象的表型是否存在差异,如基因型不同,表型也显著不同,则表示两者有关。表型也显著不同,则表示两者有关。 表型为连续型变量的基因型之间比较可用表型为连续型变量的基因型之间比较可用t- t-检验、检验、方差分析、方差分析、 GEE GEE等统计方法。等统计方法。 表型为分类型变量的基因型之间比较可用卡方检表型为分类型变量的基因型之间比较可用卡方检验、验、GEEGEE等统计方法。等统计方法。 表型与基因型常规统计分析交互作用的统计方法包括参数法和非参数法。参数法线性回归和Logist
8、ic回归模型。 非参数法(主要是数据挖掘方法)。(1)降维法;多因子降维法。(2)基于树的方法;分类回归树和随机森林法。(3)模式识别法;包括神经网络、支持向量机。(4)贝叶斯法:贝叶斯上位效应关联图谱。 参数法和非参数法分析交互作用时各有优缺点; 低维数据的分析可采用参数法和非参数法, 高维数据的分析则主要采用非参数法, 以吸烟与饮酒两个两分类变量为例,它们有四种可能的组合(如下表):不饮酒不饮酒饮酒饮酒不吸烟不吸烟 0 0 0 0+ + a a吸烟吸烟 0 0+s s 0 0+a a+s s+sa sa 我们可以形成一个四分类的变量,再用四个二分类变量X00、X01、X10、X11指示这四
9、组,形成回归方程: 方程I:f(Y)= 0+1X10+2X01+3X11 1是吸烟不饮酒组与不吸烟不饮酒组的差,2是不吸烟但饮酒组与不吸烟不饮酒组的差,3是吸烟又饮酒组与不吸烟不饮酒组的差。 方程II:f(Y)=0+aalcohol+ssmoke+sasmoke*alcohol 回归系数的s不能简单地解释为吸烟的作用,而应确切地说是对不饮酒者吸烟的作用(等于方程I的1)。a不能简单地解释为饮酒的作用,而应确切地说是对不吸烟者饮酒的作用(等于方程I的2),因为s、a、0 三者间有相互依赖的关系。 方程I与方程II是等同的,方程I中的3 等于方程II中的a+s+sa 。方程I和II都有3个自变量(
展开阅读全文