书签 分享 收藏 举报 版权申诉 / 95
上传文档赚钱

类型统计方法在医学研究中的正确使用课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:5144387
  • 上传时间:2023-02-14
  • 格式:PPTX
  • 页数:95
  • 大小:4.30MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《统计方法在医学研究中的正确使用课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    统计 方法 医学 研究 中的 正确 使用 课件
    资源描述:

    1、统计方法统计方法在医学研究中的正确使用在医学研究中的正确使用大学大学华西公共卫生学院流行病与卫生统计学华西公共卫生学院流行病与卫生统计学系系2 四川大学华西公共卫生学院流四川大学华西公共卫生学院流行病与卫生统计学系行病与卫生统计学系 讲师讲师张张 韬,医学博士韬,医学博士 四川省卫生信息学会公共卫生四川省卫生信息学会公共卫生信息专业委员会信息专业委员会 副主任委员副主任委员 研究方向:统计学方法在流行研究方向:统计学方法在流行病学研究中的应用病学研究中的应用3欢迎大家批评、指正欢迎大家批评、指正451.Yin,F.,Ma,Y.,Zhao,X.,Lv,Q.,Liu,Y.,&Zhang,T.(co

    2、rresponding author),et al.The association between diurnal temperature range and childhood hand,foot,and mouth disease:a distributed lag non-linear analysis.Epidemiology&Infection,2017,145(15):3264-3267.2.Zhou T,Zhang,T.(corresponding author),Liu Y,et al.Temporal Study of Human Brucellosis in China f

    3、rom 1978 to 2015J.American Journal of Infection Control,2017,45:S151-S152.3.Zhang,T.,Zhou T,Zhang X,et al.Dynamic Relationship between Human Brucellosis and Economic Growth in ChinaJ.American Journal of Infection Control,2017,45(6):S148.4.Zhang T,Yin F,Zhou T,et al.Multivariate time series analysis

    4、on the dynamic relationship between Class B notifiable diseases and gross domestic product(GDP)in ChinaJ.Scientific Reports,2016,6(1):29.5.Yin F,Zhang T(equally contributed),Liu L,et al.The Association between Ambient Temperature and Childhood Hand,Foot,and Mouth Disease in Chengdu,China:A Distribut

    5、ed Lag Non-linear AnalysisJ.Scientific Reports,2016,6:27305.6.Ma Y,Zhang T(equally contributed),Liu L,et al.Spatio-Temporal Pattern and Socio-Economic Factors of Bacillary Dysentery at County Level in Sichuan Province,China.J.Scientific Reports,2015,5:15264.7.Zhang T,Zhang X,Liu Y,et al.The analysis

    6、 of infectious disease surveillance data based on fuzzy time series methodJ.International Journal of Infectious Diseases,2016,45:309-310.8.Zhang T,Yang M,Xiao X,et al.Spectral analysis based on fast Fourier transformation(FFT)of surveillance data:the case of scarlet fever in ChinaJ.Epidemiology and

    7、Infection,2013:1-10.9.Zhang T,Zhang X,Ma Y,et al.Bayesian Spatio-temporal Random Coefficient Time Series(BaST-RCTS)model of infectious disease J.Mathematical Biosciences,2014.Accepted manuscript,in press.10.Zhang X,Zhang T,Jiao P,et al.Time Series Modelling of Syphilis Incidence in China from 2005 t

    8、o 2012J.Plos One,2016,11(2):e0149401.11.Zhang X,Hou F,Li X,Zhou,L.,Liu,Y.,Zhang,T.(corresponding author).Study of surveillance data for class B notifiable disease in China from 2005 to 2014J.International Journal of Infectious Diseases Ijid Official Publication of the International Society for Infec

    9、tious Diseases,2016,48(C):7-13.12.Zhang,X.,Hou,F.,Qiao,Z.,Li,X.,Zhou,L.,Liu,Y.,Zhang,T.(corresponding author).Temporal and long-term trend analysis of class C notifiable diseases in China from 2009 to 2014J.BMJ Open,2016,6(10):e011038.613.Yin,F.,Ma,Y.,Zhao,X.,Lv,Q.,Liu,Y.,&Zhang,T.(corresponding aut

    10、hor),et al.(2017).The association between diurnal temperature range and childhood hand,foot,and mouth disease:a distributed lag non-linear analysis.Epidemiology&Infection,1-10.14.Zhang X,Zhang T(equally contributed),Young A A,et al.Applications and Comparisons of Four Time Series Models in Epidemiol

    11、ogical Surveillance DataJ.PloS one,2014,9(2):e88075.15.Zhang J,Yin F,Zhang T,et al.Spatial analysis on human brucellosis incidence in mainland China:20042010J.BMJ open,2014,4(4):e004470.16.Zhang X,Liu Y,Yang M,Zhang T,et al.Comparative Study of Four Time Series Methods in Forecasting Typhoid Fever I

    12、ncidence in ChinaJ.PloS one,2013,8(5):e63116.17.Zhao,X.,Zhou,X.H.,Feng,Z.,Guo,P.,He,H.,Zhang,T.,Lei Duan,Li,X.(2013).A Scan Statistic for Binary Outcome Based on Hypergeometric Probability Model,with an Application to Detecting Spatial Clusters of Japanese Encephalitis.PloS one,8(6),e65419.18.王橙,许沛尧

    13、,马爱军,张韬张韬(通讯作者通讯作者).基于ARIMA模型对传染病监测数据异常点的探测研究J.现代预防医学,2018(4):577-581.19.许欢,张韬(通讯作者).2006-2016年四川省猩红热空间分布特征分析.现代预防医学(录用待刊).20.罗艺,张韬张韬,李晓松.基于模糊C均值聚类算法的模糊时间序列分析在戊肝发病率预测中的应用初探J.四川大学学报(医学版),2016,47(3):406-410.21.张韬张韬,冯子健,杨维中,李晓松,赵星,郭鹏飞,何红燕.模糊时间序列分析在肾综合征出血热发病率预测的应用初探.中国卫生统计,2011,28(2):146-150.22.张韬张韬,张兴裕

    14、,刘元元,李晓松.基于 ARIMA 模型的 Kalman 滤波算法在淋病发病率预测的应用初探J.现代预防医学,2013,40(016):2958-2961.23.张兴裕,张韬张韬,刘元元,李晓松.小波神经网络在肾综合征出血热出血热发病率预测中的应用.中国卫生统计.第29卷,第6期.864-870页,2012.24.郭鹏飞,何红燕,张韬张韬,赵星,任钦,李晓松.扫描统计量模型在地方病流行病学中的应用初探.现代预防医学.第38卷,第2期.215-218页,2011.25.任钦,曾海燕,解合川,张韬张韬,张兴裕,李晓松.传染病动力学在手足口病预测及防控上的应用初探J.现代预防医学,2013,40(0

    15、20):3721-3725.26.肖雄,杨长虹,谭柯,何红燕,张韬张韬,李晓松.地理加权回归模型在传染病空间分析中的应用J.中国卫生统计,2013,30(6):833-836.对统计学的一知半解常常造成不必要的上当受骗;对统计学的一概排斥往往造成不必要的愚昧无知。C.R.劳7世界上最长的路是什么?下面的时间序列数据有规律吗?下面的时间序列数据有规律吗?802468101214161813579111315171921232527293133353739414345474951535557596163656769717375777981838587899193959799101时间 前图是中国福

    16、利彩票双色球最近100期的蓝球数字。9彩票就是向不懂统计学的人征的税基本步骤基本步骤统计要点统计要点 统计设计 数据收集整理 数据分析 结果的正确解释&表达1.重视统计设计2.数据是整个统计分析的基础3.合理选择统计分析方法4.结合专业对结果进行解释,并规范灵活地呈现分析结果统计思维的建立统计思维的建立1011 统计设计统计设计 12社区干预试验社区干预试验(community intervention trial)统计设计统计设计1314正确选择统计方法的正确选择统计方法的基本思路和原则基本思路和原则就是根据:就是根据:数据特征样本含量研究目的对比组数设计类型资料类型 综合判断数据收集整理、

    17、分析数据收集整理、分析15 1.研究研究目的目的 研究目的不明确,所做的分析很可能是错误的或没有意义的。数据收集整理、分析数据收集整理、分析组别组别有效有效无效无效合计合计甲药甲药271845乙药乙药40545合计合计672390甲、乙两药治疗小儿上消化道出血的效果甲、乙两药治疗小儿上消化道出血的效果 数据收集整理、分析数据收集整理、分析 例如,一个四格表资料可以进行的统计分析或计算的统计量至少有差别性检验和独立性检验、列联系数、kappa系数、OR值、RR值、灵敏度、特异度等。1718“挂羊头卖狗肉挂羊头卖狗肉”收集这样的资料,却把它说成是那样一回事收集这样的资料,却把它说成是那样一回事 将

    18、看上去极像、而完全不同的两件事混淆在一起将看上去极像、而完全不同的两件事混淆在一起19“抗菌药秘方抗菌药秘方”在试管内有效是否在试管内有效是否一定对人体有效?一定对人体有效?人体安全性如何?人体安全性如何?杀死了哪些细菌?杀死了哪些细菌?20“垮掉的一代垮掉的一代”?2.设计设计类型类型 从实验研究设计实验研究设计来看,常见的设计类型为 完全随机设计完全随机设计(成组设计成组设计)配对或配伍设计配对或配伍设计(随机区组设计随机区组设计)从观察研究设计观察研究设计来看,在统计方法的选择上,通常将其等同于完全随机设计完全随机设计的数据。数据收集整理、分析数据收集整理、分析2120182018年高考

    19、全国卷年高考全国卷II II作文作文“二战”期间,为了加强对战机的防护,英美军方调查了作战后幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里,然而统计学家沃德力排众议,指出更应该注意弹痕少的部位,因为这些部位受到重创的战机,很难有机会返航,而这部分数据被忽略了。事实证明,沃德是正确的。3.对于定量变量定量变量,选择它所对应的那些统计方法 如:t检验、方差分析或秩和检验等。对于定性变量定性变量,则选择它所对应的统计方法 如:二项分布或Poisson分布的Z检验、检验等。其中等级资料等级资料一般采用秩和检验进行分析2数据收集整理、分析数据收集整理、分析23 学生:老师,我已经连续得了4次“差”,想在

    20、您这里兑换一个“优”,可以吗?老师:此话怎讲?学生:因为1+1+1+1=4 老师:24“分数兑换分数兑换”4.数据数据特征特征 对于同一设计类型同一设计类型和同一资料类型同一资料类型,仍然有许多方法可以选择。数据收集整理、分析数据收集整理、分析25u什么时候用t检验或方差分析?u什么时候用秩和检验?t检验和方差分析属参数检验参数检验方法,对数据要求较高,通常要求数据服从正态分布正态分布和方差齐性方差齐性。如果服从该条件或经变量变换后服从条件,则采用参数检验方法,否则采用秩和检验这类非参数检验非参数检验方法。数据收集整理、分析数据收集整理、分析26收入收入“被统计被统计”27 在数据真实可靠的情

    21、况下,为什么收入在数据真实可靠的情况下,为什么收入“被统计被统计”?0.50.941.41010X1.1 1.21.152M5.对比组数对比组数F对于单组问题(样本与总体比较),即一个样本均数或率与总体均数或率的比较,可分别采用:样本与总体均数比较的样本与总体均数比较的t检验检验二项分布和正态分布原理进行分析二项分布和正态分布原理进行分析数据收集整理、分析数据收集整理、分析29F多组均数的比较、多组等级资料的比较,可分别采用:方差分析方差分析Kruskal-Wallis秩和检验秩和检验Friedman秩和检验秩和检验F多组率或构成比的比较,可采用 表 检验。F注意,多组比较在差别有统计学意义的

    22、情况下需再进行两两比较。RC2数据收集整理、分析数据收集整理、分析30 在美西战争期间,美国海军的死亡率是9,而同时期纽约市居民的死亡率是19.后来海军征兵人员就用这些数据来证明参军更安全。假定这些数据是正确的,你是否能够找到产生这些数据的原因?以及为什么海军征兵人员得出的结论是不正确的?31美军征兵的宣传套路美军征兵的宣传套路6.样本含量样本含量F在样本较小时:u如果是一个样本率与总体率的比较,可采用直接计算概率的方法如基于二项分布的确切概率法。u如果是四格表资料则采用Fisher确切概率法或校正 检验。u对于均数比较问题,一般情况下采用t检验。F在大样本时可考虑Z检验作近似。2数据收集整理

    23、、分析数据收集整理、分析32“江湖游医江湖游医”的最爱的最爱33广告中另有小字提示:被测试的用户仅由广告中另有小字提示:被测试的用户仅由12 12人组成人组成自从使用了自从使用了“牙尖牙尖”牌牙膏,我的牌牙膏,我的蛀牙减少了蛀牙减少了23%23%自从使用了自从使用了“牙尖牙尖”牌牙膏,我牌牙膏,我的牙齿已经全部掉光了,因此,的牙齿已经全部掉光了,因此,我还是把嘴巴闭起不要开腔我还是把嘴巴闭起不要开腔在方法选择时,还有一些问题需加以说明:F当分析目的是分析变量之间是否存在某种联系时,这就涉及到双变量的分析方法,即相关关系或回归关系的分析。F需注意相关分析和回归分析的区别与联系:前者是分析两变量的

    24、关联性;后者是分析两变量的数量依存关系。数据收集整理、分析数据收集整理、分析34表表1 1 单变量资料差异比较的分析方法小结单变量资料差异比较的分析方法小结t2RC22RR2 数据收集整理、分析数据收集整理、分析35表表2 2 双变量双变量(多变量多变量)资料的关联性分析方法小结资料的关联性分析方法小结R C 数据收集整理、分析数据收集整理、分析36可比性可比性分析分析(基线分析基线分析)描述性分析描述性分析数据数据清理、逻辑查错清理、逻辑查错研究设计、数据研究设计、数据收集收集统计推断统计推断 数据收集整理、分析数据收集整理、分析统计分析思路:统计分析思路:3738一般包括统计描述和统计推断

    25、两方面内容几点注意事项注意事项:1.发病率、患病率等按惯例选择比例基数2.统计表一般用三线表3.统计的字母符号需用斜体4.不使用“显著”或“不显著”的说法 结果的正确解释、表达结果的正确解释、表达论文中的论文中的“结果结果”部分:部分:3940卖家卖家秀和买家秀秀和买家秀 现在就来买年货,你将节省100%41一入套路深似海一入套路深似海 50%折扣再打20%折扣 相对于打折后的价格降价100%实际是只有60%,因为后面的20%折扣是在五折基础上算的 按1:1搭配的土豆烧牛肉 1斤土豆配1两牛肉结果的正确解释、表达结果的正确解释、表达统计图类型及适用条件统计图类型及适用条件4243图表的魔术图表

    26、的魔术00.20.40.60.811.21234567891011120.40.50.60.70.80.911.1123456789101112 下面两幅图的变化水平是否一样?统计表中的常见问题统计表中的常见问题44 编制统计表的目的是简单明了地表达统计分析结果,因此只要能够清晰地、有条理地展示数据,让读者清楚分析结果,就达到目的了。制表过程中最常见的问题是受发表文章的篇幅所限,作者希望尽可能用较少的表格表达尽可能多的内容,导致统计表过繁,条理不清楚。统计表中的常见问题统计表中的常见问题45危险因素心理分值P值1(252人)2(253人)3(252人)4(253人)百分比(%)百分比(%)百分

    27、比(%)百分比(%)年龄(岁)35.26.5 36.56.8 37.06.3 37.86.5 0.5体力活动1.90.2 2.10.1 2.10.2 2.30.3 0.08体重指数23.13.2 24.03.5 24.83.1 25.83.1 0.01空腹血糖(mmol/L)6.111.49 6.221.62 6.351.24 6.851.65 0.41吸烟量(支/天)81 102 152 152 0.13饮酒量(g/d)60.17.5 78.28.5 79.36.8 106.810.2 0.37慢性疾患数构成(%)0 81.6 79.3 77.5 73.90.181 15.1 16.2 16

    28、.5 15.00.432 3.3 4.5 6.0 11.10.05SX SX SX SX 不同心理分值的冠心病危险因素水平比较46将太多内容放在一个表里,特别是将两种不同类型资料的统计量放在一个表里。由于互不相容,分别占了不同的列,造成表中有许多空格,不符合制表原则和要求。该表将主语放在表的右侧作为纵标目,宾语放在表的左侧作为横标目,也不符合制表原则。由于表的内容较多,层次复杂,表格中数据罗列无条理,较难读懂。应该将该表资料分别制成两个统计表。该表存在哪些问题?47心理分值例数年龄(岁)收缩压(mmHg)舒张压(mmHg)体力活动体重指数空 腹 血 糖(mmol/L)吸烟量(支/天)饮酒量(g

    29、/d)125235.26.5119.713.478.810.21.90.223.13.26.111.498160.17.5225336.56.8121.213.277.910.52.10.124.03.56.221.6210278.28.5325237.06.3121.113.278.211.02.10.224.83.16.351.2415279.36.8425337.86.5120.412.878.410.62.30.325.83.16.851.65152106.810.2P值 0.500.390.080.010.050.0010.41 0.13 0.37 0.18 0.43 0.05某年某

    30、地居民不同心理分值的冠心病危险因素水平比较某年某地居民不同心理分值的冠心病危险因素水平比较关联和因果的解释关联和因果的解释48 关联的结论意味着可能有因果联系,也可能没有,需要进行更深入地研究。49整体框架整体框架传染病数据微观传播规律传播动力学宏观流行规律时间维度空间维度时空维度时空交互效应50传染病的传播规律与流行规律传染病的传播规律与流行规律 微观角度:传播规律微观角度:传播规律传染病在传染病在某个种群某个种群中中的的发生、传播发生、传播规律及相关因素,又称传染病传规律及相关因素,又称传染病传播动力学研究。播动力学研究。宏观角度:流行规律宏观角度:流行规律传染病在传染病在时间、空间、时间

    31、、空间、人群人群中的分布模式以及与之有关的因素。中的分布模式以及与之有关的因素。51p 传播规律研究传播规律研究52传播规律研究传播规律研究传播动力学传播动力学 根据种群生长特性,疾病发生及传播规律及与根据种群生长特性,疾病发生及传播规律及与之相关的生物、环境社会因素,建立一个合理之相关的生物、环境社会因素,建立一个合理的的数学模型数学模型,通过对模型动力学性态的定性、,通过对模型动力学性态的定性、定量分析和数据模拟,显示疾病的定量分析和数据模拟,显示疾病的发生、传播发生、传播过程过程,主要研究传染病的传播,主要研究传染病的传播方向方向、传播、传播概率概率、基本再生数基本再生数。仓室模型反应扩

    32、散模型元胞自动机自主体模型复杂网络建模传播动力学研究模型53传播规律研究传播规律研究传播动力学传播动力学 研究模型:研究模型:仓室模型:仓室模型:将群体分为易感者、潜伏者、感染易感者、潜伏者、感染者、移出者者、移出者几个仓室,计算模型中传播概率传播概率等参数,预测基本再生数基本再生数R0。54传播规律研究传播规律研究传播动力学传播动力学反应扩散模型:反应扩散模型:基于化学物质浓度随时间空间的变化过程,模拟病原体在人群中的扩散,通过阈值阈值动力学和动力学和渐进传播速度渐进传播速度刻画引入传染源后传染病的传播过程传播过程(方向和速度方向和速度)。基于元胞自动机、自主体模型的建模方法:基于元胞自动机

    33、、自主体模型的建模方法:将人群中的个体视为由有限的状态和行为规则集合组成的元胞或者自主体,通过个体对病原体对病原体的响应的响应、在空间的移动在空间的移动及个体之间相互作用个体之间相互作用等规则,模拟病因、宿主和环境病因、宿主和环境构成的复杂传染病系统的演化过程。55传播规律研究传播规律研究传播动力学传播动力学复杂网络建模:复杂网络建模:网络上一个节点表示一个单元(个体或地区),节点之间的连边表示两个节点有接触,一个节点的连边数量即为这个节点的度,传染病通过连边接触连边接触传染逐渐波及整个网络逐渐波及整个网络。56仓室(仓室(SIR)模型在流感预测中的应用)模型在流感预测中的应用 Estimat

    34、ing transmission probability in schools for the 2009 H1N1 influenza pandemic in Italy 研究研究对象:意大利两学校的学生群体。对象:意大利两学校的学生群体。数据收集:问卷调查,以家庭为单位,调查各数据收集:问卷调查,以家庭为单位,调查各家庭中流感样症状家庭中流感样症状发生例数及发生时间发生例数及发生时间。57仓室(仓室(SIR)模型在流感预测中的应用)模型在流感预测中的应用 模型依据:模型依据:1、将学生分为易感者S,感染者I(根据感染天数 I1和 I2)和恢复者R。2、文献学习:、文献学习:流感潜伏期平均为2

    35、天(13天);出现流感样症状的学生当天在校概率为,根据本国风俗规定:出现症状学生均会在第二日就请假在家。3、假设传播过程:、假设传播过程:学生 t 天在学校被传染;t+1天未出现症状、继续在校且具传染性;t+2天出现症状,当天以概率 继续在校,之后该感染学生将在家休养直至恢复,不再参与校内传播过程。58仓室(仓室(SIR)模型在)模型在流感预测中的应用流感预测中的应用 参数选择及计算过程:参数选择及计算过程:感染率计算根据来源分为根据来源分为:同班感染率 qc、同级异班感染率 qg、同校异级感染率 qs和家庭社区感染率。为不被感染的概率,为下一时刻的感染率。t+1天的感染人数为:参数估计采用M

    36、CMC Metropolis-Hastings方法。59仓室(仓室(SIR)模型在)模型在流感预测中的应用流感预测中的应用l变量及参数:l估计结果:60仓室(仓室(SIR)模型在)模型在流感预测中的应用流感预测中的应用 基本再生数定义及结果:基本再生数定义及结果:R0 定义为每一个感染者平均传染学生数平均传染学生数(只考虑校内传播情形)ns 为学校年级数(意大利为5),每一校有 ng 班级,班级有 n 个学生。根据传播方式概率的分析:61传播规律研究方法总结传播规律研究方法总结模型为数学模型数学模型,模型建立依据为传染病的传传播动力学特性播动力学特性,通过考虑病原体病原体生化特性、环环境境影响

    37、、宿主宿主社会学行为等信息,分析并模拟病原体的传播过程。仅靠传染病监测数据难以建立科学的传播动力学模型,需结合能反映传染病传播动力学特性需结合能反映传染病传播动力学特性的信息:如病原体潜伏期、致病力、传播途径,传染源分布流动、与易感者接触情况等。对部分传播动力学特性尚不清楚的传染病难以建立科学的模型。62p 流行规律研究流行规律研究63宏观宏观:流行规律流行规律时间、空间、人群分布时间、空间、人群分布 概念:研究传染病概念:研究传染病时间、空间、人群时间、空间、人群分布模式及变分布模式及变化和影响因素,把握三间分布模式的分布变异规律,化和影响因素,把握三间分布模式的分布变异规律,实现实现聚集性

    38、探测、预警、预测聚集性探测、预警、预测。基本方法:基本方法:时间维度:时间维度:时间趋势传染病发病(感染)数、发病(感染)率、死亡率或危险度的时间变化趋势,常见时间序列图。空间维度:空间维度:空间分布传染病发病(感染)数、发病(感染)率、死亡率或危险度的空间变异,常见热图、疾病分布地图等。人群维度:人群维度:人群分布传染病发病(感染)数、发病(感染)率、死亡率或危险度的人群变异。64p 时间维度上规律的探索时间维度上规律的探索65时间维度上规律的探索时间维度上规律的探索 常见现象:常见现象:短期波动:短期波动:短时间内的波动,如短时间内发病率突然增高。长期趋势:长期趋势:在相当长的时间内发病率

    39、等明显的递增、递减趋势。季节性:季节性:和季节相关的稳定波动,如发病率等的季节性升高。周期性:周期性:每经一个相当规律时间间隔,发病率等呈现的规律性波动。序列值之间相关性:序列值之间相关性:不同时间点上序列值的相关性。不同序列之间趋势相关性:不同序列之间趋势相关性:不同时间序列趋势的相关性。时间聚集性:时间聚集性:当前时间(时点或时段)病例数等的异常增加。66时间维度上规律的探索时间维度上规律的探索 对应的统计学方法:对应的统计学方法:时间序列分析:时间序列分析:通过挖掘时间序列前后数据的前后数据的相关性相关性,找到变量的时间变化规律并预测未来发展趋势。常见ARMA、ARIMA、VARIMA、

    40、GARCH等时间序列模型。67时间维度上规律的探索时间维度上规律的探索时间趋势检验:时间趋势检验:检验不同时间序列的趋势是否具有相关性或一致,常见秩和检验、Spearman相关性、间断时间序列分析等。短期波动、长期趋势、季节性、周期性分析:短期波动、长期趋势、季节性、周期性分析:可通过时间序列分析中非平稳时间序列确定性非平稳时间序列确定性因素分析因素分析方法。另通过傅里叶分析、集中度、圆形分布法等也可确定周期性或季节性。时间聚集性分析:时间聚集性分析:常用统计过程控制(SPC)法,包括指数加权平均法、休哈特控制图、累计和方法。68时间序列分析在流感预测中的应用时间序列分析在流感预测中的应用Ti

    41、me series analysis of influenza incidence in Chinese provinces from 2004 to 2011 研究对象:全国各省、自治区研究对象:全国各省、自治区流感月发病率流感月发病率 数据来源:国家人口健康数据共享平台各省、自治区数据来源:国家人口健康数据共享平台各省、自治区的流感月发病率的流感月发病率69时间序列分析在流感预测中的应用时间序列分析在流感预测中的应用 模型建立(以河北省为例):模型建立(以河北省为例):1、Fig2中可见全国流感数据峰值大数在3月或12月,此外根据认知流感高峰常发生在夏、冬季,因此可假定流感呈现明显的季节性

    42、。2、采用带有X-12-ARIMA过程的季节性模型SARIMA(p,d,q)(P,D,Q)s拟合河北省流感数据。p 为自回归阶数,d 为差分度,q 移动平均阶数;P 为季节性自回归阶数,D 为季节单整,Q 为季节性移动平均阶数,s 为季节性时间长度。70时间序列分析在流感预测中的应用时间序列分析在流感预测中的应用3、根据X-12-ARIMA过程得到的不同非季节和季节性差分模型残差的ACF和PACF选择模型阶数,结合给出的BIC指数最小指数最小的模型和非季节性、季节性移动平均项阶数假设检验结果移动平均项阶数假设检验结果选择最优模型。71时间序列分析在流感预测中的应用时间序列分析在流感预测中的应用

    43、4、由图可见当diff=1、sdiff=1时,ACF、PACF 稳定,PACF趋近为0,可初步拟合模型SARIMA(0,1,1)(0,1,1)12,给出BIC最小的模型亦为此,该模型尚不拒绝移动平均阶数为0的假设检验。该模型RMSE=0.0625,R2=0.9425,用于预测也取得了较好效果。72p 空间维度上规律的探索空间维度上规律的探索73空间维度上规律的探索空间维度上规律的探索 常见现象:常见现象:空间自相关:空间自相关:指某一空间区域内某一事物或属性与相邻空间区域该事物或属性随空间位置变随空间位置变化的相关程度化的相关程度。空间异质性:空间异质性:每一空间位置上的事物或属性区别于其他位

    44、置上的事物或属性的特点,体现为变量、参数、误差项方差会随空间位置的变化随空间位置的变化而变化而变化。空间聚集性:空间聚集性:一定空间区域内病例等的异常增异常增加加。74空间维度上规律的探索空间维度上规律的探索 对应统计学方法:对应统计学方法:空间自相关空间自相关分析:分析:分析在某一空间范围内某属性是否具有自相关性是否具有自相关性,根据空间范围程度可分为全局空间自相关分析和局部空间自相关分析,常用Morans I、Gearys C、G统计量等。空间聚集性探测空间聚集性探测:用空间自相关统计量如Anselins local Moran(LISA)统计量可识别病例异常增加的高发集群,另有Knox方

    45、法、Rogerson空间模式监测法、Turnbull方法、Besag-Newell、空间扫描统计量等。75空间维度上规律的探索空间维度上规律的探索 回归模型:回归模型:经典回归模型如普通线性模型,理论假设需满足观测值间相互独立相互独立且同分布,但大数情况下传染病的空间分布并不是毫无关联的,由于病原体空间范围内的传播以及相似环境条件使得邻近区域疾病发生常具有邻近区域疾病发生常具有相似性相似性,违背了该理论假设。因此我们考虑将空间效应空间效应(空间自相关性、空间异质性)考虑到一般的回归模型中,常见模型应用及发展如下。空间自相关性空间异质性空间自回归模型地理加权平均模型空间回归模型贝叶斯空间模型多水

    46、平空间模型贝叶斯多水平空间模型76空间自回归模型空间自回归模型 模型主要考虑变量间的空间自相关性空间自相关性,分析空间数据的变量之间的关系。基本模型包括联立自回归SAR、条件自回归CAR、移动平均MA模型等。模型与时间序列分析模型建立思想相似,即通过挖掘变量不同区域间不同区域间(在时间序列分析中为不同时间点)的相相关性关性,用模型表示出来,把握变量的空间变化规律,从而预测未知空间变量的分布状况。模型一般形式如下:77空间自回归模型空间自回归模型 y为研究区域因变量矩阵,X 是自变量矩阵,u为空间模型残差,是随机误差,W1和W2表示因变量 y与残差u对应的空间权重矩阵。模型在一般线性模型y=X+

    47、基础上,引入空间自空间自回归项回归项W1 y和空间移动平均项空间移动平均项 W2u来表示其他区域的因变量及自变量的空间效应空间效应。该模型将空间自相关看做固定效应固定效应,设其不随时间空间变化,是固定效应模型固定效应模型。当疾病分布数据相关性效应随时间空间变化时其分离空间变异能力有限,另尚难以将不同区域影响因变量因素同时纳入。此外,由于空间异质性空间异质性的存在,不同空间区域上的自变量和因变量之间的关系可能不同,因此该模型未能考虑空间异质性。78地理加权平均模型地理加权平均模型该模型考虑变量的空间异质性空间异质性,是普通线性回归模型的扩展。该模型考虑特定区域 i 的回归系数不再是利用全局信息估

    48、计的统一单值,而是会随空间位置随空间位置(ui,vi)而变化)而变化的可变系数。系数估计不适用最小二乘法,采用局部加权最局部加权最小二乘法小二乘法。同空间自回归模型类似,该模型对于空间效应的反映并不准确,难以分别具体体现空间自相关性和空间异质性。79空间回归模型空间回归模型 研究研究传染病病例等的传染病病例等的空间分布空间分布与与自自变量(环境、社会变量(环境、社会等等)的关系。的关系。随机效应模型:随机效应模型:根据发病率发病率确定地区 i 发病数 Yi 服从泊松或二项分布泊松或二项分布,据此分别选择模型:模型中 ei 反映代表空间相关性空间相关性的空间结构效应空间结构效应,ui反映代表空间

    49、异质性空间异质性的空间非结构效应空间非结构效应,这里均是随机效应随机效应。可用最大似然法求解,也可用贝叶斯贝叶斯空间模型空间模型分析,后者由于可以同时考虑自变量的影响和空间格局效应,所以更为合理。参数求解过程涉及高维积分使计算困难甚至无解,MCMC可解决这一困难。80空间自回归模型应用于流感预测空间自回归模型应用于流感预测A spatial analysis of the determinants of pneumonia and influenza hospitalizations in Ontario(19922001)研究对象:加拿大研究对象:加拿大Ontario各县肺炎及流感住院病例各

    50、县肺炎及流感住院病例数据来源:各县肺炎及流感病例数据来源于数据来源:各县肺炎及流感病例数据来源于CIHI 出院小结数据库,出院小结数据库,自变量数据来源于自变量数据来源于OHS数据库,人口社会学信息来源于数据库,人口社会学信息来源于1996人口人口普查普查。81空间自回归模型应用于流感预测空间自回归模型应用于流感预测 模型建立:模型建立:1、空间自相关性检验:、空间自相关性检验:检验各县病例数据是否存在空间自相关性,是建立空间自回归模型的条件建立空间自回归模型的条件,结果:全人群Morans I=0.162,p=0.043,女性群体Morans I=0.176,p=0.027,男性群体 Mor

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:统计方法在医学研究中的正确使用课件.pptx
    链接地址:https://www.163wenku.com/p-5144387.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库