医用SAS统计分析医学知识培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医用SAS统计分析医学知识培训课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医用 SAS 统计分析 医学知识 培训 课件
- 资源描述:
-
1、医用医用SASSAS统计分析统计分析()()医医学知识学知识一、单变量的统计描述一、单变量的统计描述q统计分析内容回顾 v统计描述:集中趋势、离散趋势v统计推断:l参数估计:总体参数估计(可信区间)l假设检验q资料类型v计量资料-数值变量v计数资料-分类变量 q资料的分布 正态分布和偏态分布 10/13/20222医用SAS统计分析()医学知识一般统计描述一般统计描述-MEANS 过程过程qMEANSMEANS过程除了能对数值型变量进行一般的统计描述之外,还可以作配过程除了能对数值型变量进行一般的统计描述之外,还可以作配对设计资料的对设计资料的t t检验。检验。q语句格式语句格式:Proc m
2、eans Proc means 操作选项操作选项统计量列表统计量列表;VAR VAR;/*指定分析的变量名列,缺省为所有数值变量*/BY BY;/*按变量名列分组统计,要求已按变量名列排序*/CLASS CLASS;/*按变量名列分组统计,不要求排序*/FREQ FREQ;/*表明该变量为分析变量的频数*/OUTPUT OUT=OUTPUT 关键字关键字=;/*指定统计指定统计量的输出数据集名和统计量对应的新变量名量的输出数据集名和统计量对应的新变量名*/Run;Run;10/13/20223医用SAS统计分析()医学知识vProc means Proc means 操作选项:操作选项:dat
3、a=指定要分析的数据集名 maxdec=指定输出结果最大的小数位数,默认为7位 noprint 禁止统计结果在output窗输出 alpha=设定计算可信区间的水平,默认为0.05 注:在proc语句中的选项直接跟在proc名后,以空格分隔,中间不加“/”,其他命令语句的选项需以“/”分隔。统计量列表选项:统计量列表选项:(缺省时只输出(缺省时只输出N N、MEANMEAN、STDSTD、MINMIN、MAXMAX)N样本大小MEAN均数SUM合计MAX最大值MIN最小值STD标准差STDERR标准误CV变异系数RANGE全距(极差)CLM双侧可信区间LCLM单侧可信区间下限UCLM单侧可信区
4、间上限T对=0 的检验的 t 值PRTt 值相应的 p10/13/20224医用SAS统计分析()医学知识例1 书中例3-1例2 某克山病区测得11名克山病患者与13名健康人的血磷值(mmol/L)如下,试求两组的平均血磷值和标准差。data L12;input g x;cards;1 0.84 1 1.05 1 1.20 1 1.20 1 1.39 1 1.531 1.67 1 1.80 1 1.87 1 2.07 1 2.112 0.54 2 0.64 2 0.64 2 0.75 2 0.76 2 0.81 2 1.16 2 1.20 2 1.34 2 1.35 2 1.48 2 1.58
5、 2 1.87;proc means;var x;by g;run;10/13/20225医用SAS统计分析()医学知识 Analysis Variable:X-G=1-N Mean Std Dev Minimum Maximum-11 1.5209091 0.4217927 0.8400000 2.1100000-G=2-N Mean Std Dev Minimum Maximum-13 1.0861538 0.4240585 0.5400000 1.8700000-10/13/20226医用SAS统计分析()医学知识例3 书中例3-3:几何均数的计算,SAS程序没有直接计算几何均数的模块。
6、data logmean;input x f;y=log10(x);cards;20 2 40 3 80 6 160 1 320 1;proc means;var y;freq f;proc print data=outmean;data geomean;set outmean;g=10*logmean;proc print data=geomean;var g;run;output out=outmean mean=logmean;10/13/20227医用SAS统计分析()医学知识 The SAS System Analysis Variable:Y N Mean Std Dev Mini
7、mum Maximum -13 1.8104654 0.3339628 1.3010300 2.5051500 -The SAS System OBS _TYPE_ _FREQ_ LOGMEAN 1 0 13 1.81047 The SAS System OBS G 1 64.634610/13/20228医用SAS统计分析()医学知识详细统计描述详细统计描述-UNIVARIATE 过程过程 Univariate过程可对数值变量进行详细的统计描述。除了提供means过程所有的统计描述外,还可以给出了变量的峰度、偏度、众数、中位数及四分位数等更详尽的统计描述,同时还可进行正态性检验,以及几个描述
8、分布的图。10/13/20229医用SAS统计分析()医学知识PROC UNIVARIATE PROC UNIVARIATE 操作选项操作选项 ;VAR VAR;指定分析的变量名列表,缺省为所有数值变量 BY BY;按变量名列分组按变量名列分组统计,要求排序 FREQ FREQ;表明该变量为分析变量的频数OUTPUT OUT=OUTPUT 关键字关键字=;/*指定统计指定统计量的输出数据集名和统计量对应的新变量名量的输出数据集名和统计量对应的新变量名*/Run;Run;proc univariate 语句的操作选项;data=指定要分析的数据集名 noprint 禁止统计结果在output窗输
9、出 freq 详细的频数表 normal 进行正态性检验 plot 生成统计图:茎叶图,盒状图,正态概率图 10/13/202210医用SAS统计分析()医学知识例4 程序3-2data unil;input x;cards;3 9 8 6 5 5 7 3 10 8 10 4;proc univariate normal plot;run;10/13/202211医用SAS统计分析()医学知识 Moments N(样本含量)12 Sum Wgts(总权重)12 Mean(均数)6.5 Sum(合计)78 Std Dev(标准差)2.54058 Variance(方差)6.454545 Skew
10、ness(偏度 g1)0 Kurtosis(峰度 g2)-1.39044 USS(平方和)578 CSS(离均差平方和)71 CV(变异系数)39.08584 Std Mean(标准误)0.733402 T:Mean=0(均数是否为0的检验)8.862804 Pr|T|(t值对应的p值)0.0001 Num=0(不等于0的样本数)12 Num 0(大于0的样本数)12 M(Sign)(符号检验)6 Pr=|M|(符号检验的p值)0.0005 Sgn Rank(符号秩和检验)39 Pr=|S|(符号秩和检验的p值).0005 W:Normal(正态性检验W检验)0.932772 PrW(正态性检
11、验的p值)0.384310/13/202212医用SAS统计分析()医学知识 Quantiles(Def=5)100%Max 10 99%10 75%Q3 8.5 95%10 50%Med 6.5 90%10 25%Q1 4.5 10%3 0%Min 3 5%3 1%3 Range 7 Q3-Q1 4 Mode 310/13/202213医用SAS统计分析()医学知识 Extremes Lowest Obs Highest Obs 3(8)8(3)3(1)8(10)4(12)9(2)5(6)10(9)5(5)10(11)Stem Leaf#Boxplot 10 00 2|9 0 1|8 00
12、2 +-+7 0 1|6 0 1 *-+-*5 00 2|4 0 1 +-+3 00 2|-+-+-+-+10/13/202214医用SAS统计分析()医学知识 Normal Probability Plot 10.5+*+*+|*+|*+|*+|*+|*+*+|+*+3.5+*+*+-+-+-+-+-+-+-+-+-+-+-2 -1 0 +1 +210/13/202215医用SAS统计分析()医学知识频数分布表数据的输入例5 程序3-5data uni2;input x f ;cards;65 3 67 5 69 8 71 11 73 25 75 24 77 10 79 7 81 6 83
13、0 85 1 ;proc univariate;var x;freq f;run;10/13/202216医用SAS统计分析()医学知识频数表的编制方法1:语句格式:proc univariate freq;例6 王洁贞主编DATA SG;INFILE d:sassas2psb.txt;INPUT X;PROC MEANS mean std MIN MAX;RUN;DATA FSH;SET SG;IF X164 THEN Y=163;IF X=164 THEN Y=165;IF X=166 THEN Y=167;IF X=168 THEN Y=169;IF X=170 THEN Y=171;I
14、F X=172 THEN Y=173;IF X=174 THEN Y=175;IF X=176 THEN Y=177;IF X=178 THEN Y=179;IF X=180 THEN Y=181;IF X=182 THEN Y=183;PROC UNIVARIATE FREQ;VAR Y;RUN;10/13/202217医用SAS统计分析()医学知识 Analysis Variable:X Mean Std Dev Minimum Maximum -172.6710000 4.0756308 162.9000000 183.5000000 -univariate过程略 Frequency T
15、able Percents Percents Value Count Cell Cum Value Count Cell Cum 163 1 1.0 1.0 175 15 15.0 81.0 165 4 4.0 5.0 177 8 8.0 89.0 167 7 7.0 12.0 179 7 7.0 96.0 169 12 12.0 24.0 181 3 3.0 99.0 171 18 18.0 42.0 183 1 1.0 100.0 173 24 24.0 66.010/13/202218医用SAS统计分析()医学知识方法2:语句格式:proc freq;tables 变量名;说明:该语句是
16、根据定义的变量产生频数分布表。例7:上例资料DATA psb1;INFILE d:sassas2psb.txt;INPUT X;L=162;/*定义第一组的下限值*/i=2;/*定义组距*/z=(x-mod(x-L,i)+(i/2);/*z值就是将原始变量转化成该数据所在组段的组中值*/proc freq;/*根据z值产生频数分布表*/tables z;proc univariate normal plot;var z;RUN;vmod(x,y)为算术函数,求x/y的余数。如mod(10,3)=1,mod(6,2)=010/13/202219医用SAS统计分析()医学知识 Cumulative
17、 Cumulative Z Frequency Percent Frequency Percent -163 1 1.0 1 1.0165 4 4.0 5 5.0167 7 7.0 12 12.0169 12 12.0 24 24.0171 18 18.0 42 42.0173 24 24.0 66 66.0175 15 15.0 81 81.0177 8 8.0 89 89.0179 7 7.0 96 96.0181 3 3.0 99 99.0183 1 1.0 100 100.0 10/13/202220医用SAS统计分析()医学知识 Univariate ProcedureVariabl
18、e=Z Moments Quantiles(Def=5)N 100 Sum Wgts 100 100%Max 183 99%182Mean 172.7 Sum 17270 75%Q3 175 95%179Std Dev 4.013865 Variance 16.11111 50%Med 173 90%179Skewness 0.102995 Kurtosis -0.10056 25%Q1 171 10%167USS 2984124 CSS 1595 0%Min 163 5%166CV 2.324183 Std Mean 0.401386 1%164T:Mean=0 430.2586 Pr|T|
19、0.0001 Range 20Num=0 100 Num 0 100 Q3-Q1 4M(Sign)50 Pr=|M|0.0001 Mode 173Sgn Rank 2525 Pr=|S|0.0001W:Normal 0.9671 Pr|T|-6.8000000 5.2042717 -1.3066189 0.2237 -程序中如无 var d;The SAS System Variable Mean Std Error T Prob|T|-X1 125.9000000 5.1627942 24.3860193 0.0001 X2 132.7000000 3.4158129 38.8487320
20、0.0001 D -6.8000000 5.2042717 -1.3066189 0.2237-10/13/202227医用SAS统计分析()医学知识成组成组t检验检验原理:原理:H0:SAS程序:程序:proc ttest;proc ttest;proc ttest;/*过程名 */class class ;/*分组变量名 */var var;/*分析变量名*/run;run;2121xxsxxt2110/13/202228医用SAS统计分析()医学知识 例9:程序4-3data ttest3;do c=1 to 2;/*c循环开始,循环次数为2*/input n;/*输入n值*/do i=
21、1 to n;/*i循环开始,循环次数为n*/input x;/*输入x 值,注意的合理使用*/output;/*output将x输出,循环语句中必须使用。*/end;/*i循环结束*/end;/*c循环结束*/cards;5 279 334 303 338 198 3 229 274 310 ;proc print;proc ttest;class c;var x;run;10/13/202229医用SAS统计分析()医学知识/*循环的结果*/OBS C N I X 1 1 5 1 279 2 1 5 2 334 3 1 5 3 303 4 1 5 4 338 5 1 5 5 198 6 2
22、 3 1 229 7 2 3 2 274 8 2 3 3 310 TTEST PROCEDURE Variable:XC N Mean Std Dev Std Error-1 5 290.40000000 56.99385932 25.488428752 3 271.00000000 40.58324778 23.43074903 Variances T DF Prob|T|-Unequal 0.5603 5.6 0.5971Equal 0.5099 6.0 0.6284For H0:Variances are equal,F=1.97 DF=(4,2)ProbF=0.7272 10/13/2
23、02230医用SAS统计分析()医学知识两样本含量相等时,可去除input n;例10:data t;do c=1 to 2;do i=1 to 5;input x;output;end;end;cards;279 334 303 338 198 229 274 310 345 344 ;proc print;proc ttest;class c;var x;run;10/13/202231医用SAS统计分析()医学知识OBS C I X 1 1 1 279 2 1 2 334 3 1 3 303 4 1 4 338 5 1 5 198 6 2 1 229 7 2 2 274 8 2 3 31
展开阅读全文