医学统计学第十章线性相关课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学统计学第十章线性相关课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 第十 线性 相关 课件
- 资源描述:
-
1、 Linear correlation 第十章第十章 线性相关线性相关例:某医院欲研究儿童的体重与体表面积的关系,测量了10名3岁男童体重与体表面积,数据见下表编号X(X,kg)Y(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合计133.457.266内容n相关关系与确定性关系n定量资料的相关n定性资料的相关n等级资料的相关n相关分析的正确应用10.1 相关关系与确定性关系n确定性关系:两变量间的函数关系 圆的周长与半径
2、的关系:C2R 速度、时间与路程的关系:LST X与Y的函数关系:Ya+bX n非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄的关系;年龄与血脂的关系;身高与体重的关系;体重与体表面积的关系;药物浓度与反应率的关系;相关关系与确定性关系(2)n当对事物的规律了解加深时,相关关系可以转变为确定性关系。n父亲患白化病X,(X=是,否);n子女患白化病Y,(Y=是,否);nX与Y的关系不确定。n当母亲患白化病时,X与Y的关系确定:X=是,则Y=是;X=否,则Y=否。(父亲为异常基因的携带者出外。)相关关系(correlation)n当一个变量增大,另一个也随
3、之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。n相关关系不一定是因果关系。10.2 定量资料的相关n反映两定量指标间的相关关系用 Pearson 相关系数。(Pearson correlation coefficient)例10.1 10名3岁男童体重与体表面积的关系 编号 体重(X,kg)体表面积(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.075 1016.06.411 合计133
4、.457.266分析步骤n散点图n相关系数计算n相关系数的假设检验10名3岁男童体重与体表面积散点图1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)Pearson相关系数的计算YYXXXYlllYYXXYYXXr222XXlXX2YYlYYX 的离均差平方和:Y 的离均差平方和:X与Y 间的离均差积和:YYXXlXY离均差平方和、离均差积和的展开:nXXXXlXX222nYYYYlYY222nYXXYYYXXlXY相关系数的性质n总体相关系数总体相关系数 n-1 r 1nr0为正相关为正相关nr0为负相关为负相关nr0为零相关或无相关为零相关或无相关r
5、=0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r0(c)r 0(e)r 0(g)零相关正相关负相关完全正相关完全负相关零相关零相关零相关相关关系示意图相关系数的含义 符号符号:相关系数小于相关系数小于0 0为负相关;大于为负相关;大于0 0为正相关;为正相关;等于等于0 0为零相关。为零相关。数值数值:相关系数的绝对值越大,表示两变量间的相相关系数的绝对值越大,表示两变量间的相关程度越密切;相关系数越接近于关程度越密切;相关系数越接近于0 0,表示相关越不密,表示相关越不密切。切。表达两变量间线性相关的程度和方向的一个统计指标 例10.1资料相关系数的计算9396.5 5439.
6、1 9040.247266.5 44.13XYYYXXlllY X9579.05439.19040.249396.5r10.2.2 相关系数的假设检验H 0:0,体重与体表面积无相关关系;H 1:0,体重与体表面积有相关关系。=0.05t t 服从自由度为n-2的 t t 分布。2102nrrsrtr例10.1资料相关系数的假设检验4369.92109579.019579.02122nrrt自由度102,P0.001拒绝H0,接受H1。可以认为3岁男童体重与体表面积之间有正相关关系。10.2.3 总体相关系数的区间估计n相关系数 分布q相关系数=0 n样本相关系数的分布是对称的,当样本含量较大
7、时,近样本相关系数的分布是对称的,当样本含量较大时,近似正态分布似正态分布 q相关系数不等于0 n样本相关系数的分布是偏态样本相关系数的分布是偏态 -0.8-0.6-0.4-0.20.00100200300-1.000.51.01.52.0050100150200-2-1012050100150200 01234050100150200250 00.20.40.60.81.00100200300=0 =-0.8 =0.8(e)z(d)z(f)zz变换(双曲正切变换)nR.A.Fisher(1921)提出的rrz11ln211122zzeer其反变换其反变换 的区间估计 nz值 的分布q变换值z
8、近似服从均数为q标准差为 的正态分布n将相关系数r变换为z值,并按正态分布原理估计z的 100(1-)%的可信限)1/()1(ln21rr3/1n31nuzsuzz然后再进行反变换,求出的可信区间以例10.1数据为例,试计算总体相关系数 的95%及99%可信区间 nz的95%可信区间:1.91981.960.3780=(1.1789,2.6607)nz的99%可信区间:1.91982.580.3780=(0.9446,2.8950)1122zzeer的95%可信区间:0.82710.9903;的99%可信区间:0.73730.9939 10.2.4 两样本相关系数的比较n例10.3 某医院分别
展开阅读全文