多因素分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多因素分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因素 分析 课件
- 资源描述:
-
1、多因素分析多元线性回归Logistic回归生存分析.第一部分 多元线性回归 简单线性回归只考虑一个X对Y的影响;多元线性回归(multiple linear regression)考虑多个自变量X对Y的影响 此时要考虑:1.Y是否满足LINE 2.所建回归方程是否有意义:AVOVA 3.回归方程中的每个自变量是否都有意义:t检验 4.如何获得变量最少,解释Y变异又较多的方程?筛选变量方法330名糖尿病患者脂联素ADI(Y,ng/ml)与体重指数BMI(x1,kg/m2)、病程(x2,year)、瘦素LEP(x3,ng/ml)、空腹血糖FPG(x4,mmol/L)关系分析4根据样本得到的回归方程
2、 偏回归系数 partial regression coefficient 表示在其他自变量固定条件下,某自变量每增减一个单位对y的平均效应影响。标准化偏回归系数(standardized),表示在其他自变量固定条件下,某自变量每增减一个标准单位,y改变的平均标准单位数。其大小反映了该自变量的重要性 多因素的分析更加切合实际;提高回归方程的估计精度;从多个可能的因素中选择真正有意义的因素kkxbXbxbbY 22110 偏回归系数的计算:最小二乘原理 假设检验:偏回归系数检验-t检验 模型整体检验-方差分析 前提条件:线性、独立性、正态性、方 差相等,LINE SPSS操作步骤 分析回归线性因
3、变量:Y;自变量:x1-x4 ok4321579.0811.0131.0030.1199.58XXXXY 体重指数 病程 瘦素 空腹血糖-1.030意思为在x2、x3、x4为给定值的情况下,体重指数每增加一个单位,脂联素平均减少1.030(ng/ml)For a given x2,x3,x4,each 1kg/m2 increase in x1 is associated with an average decrease in Y of 1.030ng/ml.方程的假设检验整个模型的假设检验:方差分析法(ANOVA)043210:HF=17.000,P0.001,拒绝H0,以下模型是有意义的.
4、4321579.0811.0131.0030.1199.58XXXXY是不是每个自变量的偏回归系数均有统计学意义呢?t检验)1(knbiitsbtiN为个体数,k为自变量个数并不是每个自变量都有意义!,在alpha=0.05,x1 x2 x4三个变量没有统计学意义自变量筛选常用方法All possible subsets selection 最优子集回归,全局择优法Stepwise selection include 逐步回归法 forward selection 前向选择 backward elimination 后向选择 stepwise regression 逐步选择9.由于变量之间是有
5、关联的,因此并不是简单地将三个变量从方程中去除!10一 最优子集法 最优子集法是对自变量各种不同的组合所建立的回归方程进行比较,从而选出一个“最优”的回归方程。11评价指标:TETRSSSSSSSSR121 残差平方和与决定系数残差平方和越小越好,R2越大越好122 残差均方与调整确定系数1pnSSMSEE1)1(222pnRpRRa考虑了引入变量的个数p133 Cp统计量(Cp statistic)由Mallows CL.提出。1p11)()()(allppMSMSpnC残残当p个自变量拟合的方程理论上“最优”时,Cp的期望值为p+1,因此应选择Cp越接近于p+1的回归方程为“最优”方程。1
6、4SAS运行结果运行结果二、逐步回归法向后法(删)向前法(进)逐步法方程方程方程规定进入,保留(删)的P值,且要求P进=25)的优势 odds1=(1656/2987)/(1331/2987)=1.2442非病人有超重或肥胖史史的优势 Odds0=2492/5461=0.4563OR=odds1/Odds0=1.2442/0.4563=2.727 高血压1非病人0合计超重或肥胖11656 a2492 b4148正常01331 c5461 d6792合计298779531094027对照中非暴露的比例对照中暴露的比例病例中非暴露的比例病例中暴露的比例OR727.22492*13315461*16
7、56bcadOR28因素保护1因素危险1有关1疾病与暴露无关1OROR若y=1为disease,y=0为non-disease,有29高血压1非病人0合计超重或肥胖11656 a2492 b4148正常01331 c5461 d6792合计298779531094030回归系数的解释 logistic回归中的系数,与OR的关系:ln(OR)/()ln()ln/()lnln ()()=PPO RPPPPPP11000110111110设P1 为X=1的得病概率,P0 为X=0的得病概率11010)0()1(mmxxxP22110 logit31模型检验与偏回归系数检验似然比检验(likeliho
8、od test)似然比检验是通过比较两个相嵌套模型的对数似然函数统计量G(又称Deviance)来进行的,其统计量为:G GG GP PG GK K 2ln(2ln(L LP P)+2ln()+2ln(L LK K)G服从自由度为K-P的2分布。所以似然比检验既可对模型进行整体检验,又可以对每个(引进/剔除)的变量进行检验 32似然比检验 检验变量X1是否有统计学意义:模型1:不考虑,-2lnL1=12827.236模型2:考虑X,-2lnL2=12301.503 G=-2lnL1-(-2lnL2)L为对数似然函数值 G G 12301.503-12827.236174.267174.267,
9、=1=1,P0.001 P0.001 说明回归系数说明回归系数具有统计学意义。具有统计学意义。3334(偏)回归系数wald检验)(2/bSZbe22)()(0 SESEzSPSS软件操作 分析回归二元logistic回归因变量:C协变量:r 选项确定36 多分类变量:哑变量(dummy variable)x1时:x10,x20,x30 表示A型血x2时:x11,x20,x30 表示B型血x3时:x10,x21,x30 表示AB型血x4时:x10,x20,x31 表示O型血exp(1)表示B与A比之OR;exp(2)表示AB与A比之OR;exp(3)表示O与A比之OR。3322110logit
展开阅读全文