SAS-统计图表Chap6-SAS-统计图表课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SAS-统计图表Chap6-SAS-统计图表课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS_ 统计 图表 Chap6_SAS_ 课件
- 资源描述:
-
1、第6章 统计图表第6章 统计图表6.1 统计表的概念和种类6.2 统计图的基本概念6.3 TABULATE过程6.4 GPLOT过程的6.5 GCHART过程6.6 图形界面的图形制作6.1 统计表的概念和种类表8.1 标题(何时、何地)横 行 总标目纵行总标目子纵标目1 子纵标目n子横标目1子横标目k 数字区域o从构成要素看,统计表由标题、横行栏目(分组标志)、纵行栏目(统计指标)和统计数据四部分组成。o从内容上看,分为主词和宾词两部分。主词是被研究对象的总体及其分组,宾词是指说明总体特征的统计指标。主词栏 宾词栏 统计表的种类按用途分:n调查表n整理表n分析表按主词的分组情况:n简单表:主
2、词未经任何分组n简单分组表:表的主词仅按一个标志分组的统计表n复合表:表的主词按两个或两个以上标志进行分组的统计表6.2 统计图的基本概念统计图是用点、线、面等图形来直观的反映变量分布特征、内部结构、变量间关系及其发展变化的一种常用形式,常见的统计图:o直方图:表示经同级分组后各组的频数分布情况,其条形的高度代表各组的频数或频率。o饼图:反映事物的内部结构,必须用相对数,饼图的每个扇面代表某一部分占总体的比重,各部分之和为1。o柱状图:表示不同总体某一指标的数量特征,一般用于不同时间、地点的某一指标间的对比。o散点图:考察两变量间关系,反映两个连续的变量之间有无关系,是直线关系还是曲线关系等。
3、6.3 TABULATE过程TABULATE过程的功能o 可以对总体进行简单分组汇总o 可以对总体按两个或两个以上标志进行复合分组汇总o 以比较灵活的方式对每组进行合计,还可以计算每个分组单元的百分比。TABULATE过程的一般格式PROC TABULATE;CLASS class-variable-list;VAR analysis-variable-list;TABLErow-expression,col-xpression ;BY variable-list;FREQ variable;WEIGHT variable;FORMAT variable-list-1 format-1;1.P
4、ROC TABULATE语句其一般格式为:PROC TABULATE;该语句中的选择项常用的有:oDATA=SAS-data-set:指定所使用的输入数据集,缺省时使用最新创建的数据集。oFORMAT=format-name(格式名):对每个报表单元规定输出格式,默认值为BEST12.2。此选项对减少报表中输出数值的域宽非常有用。oNOSEPS:要求表中不出现水平分隔线。2.CLASS语句一般格式为:CLASS class-variable-list;该语句规定输出报表中的分组标志。在此后的TABLE语句中出现的任一分组标志必须事先在CLASS语句中定义。这些分组变量一般为字符型的,若是数值型
5、的,其值要求有限,否则应事先通过FORMAT语句处理成几个离散值。3.VAR语句一般格式为:VAR analysis-variable-list;该语句规定报表中的分析变量。所有在TABLE语句中出现的分析变量必须事先在该语句中予以定义。作为分析变量,要求其为数值型。4.FORMAT语句一般格式为:FORMAT variable-list-1 format-1 ;该语句用于对分类变量规定离散水平,特别是当需要按连续变量进行分类时,该语句对数值的离散化尤其有用。5.TABLE语句一般格式为:TABLE row-expression,column-expression ;o语句中的三个维表达式分别
6、表示输出表格的页、行和列的有关规定o当缺少一个表达式时,定义了一个二维表格o缺少两个表达式时,定义一个一维表格,如果只要行表达式部分,可写成:TABLE 行表达式,。维表达式的主要元素包括:o变量类型o操作符TABLE语句的变量类型o分类变量:来自CLASS语句或ALL,ALL是系统提供的仅有一个值的特殊分类变量,不考虑分类变量的水平,用ALL生成子集和及总和。o分析变量:来自VAR语句o统计量:用统计量关键字表示,有N、MIN、MAX、SUM、MEAN和百分数等。当规定了分析变量而没有规定统计量时,默认的统计量为SUM;如果既没有规定分析变量也没有规定统计量,默认的统计量为N,即分类变量值的
7、交叉频数。TABLE语句的操作符o 星号(*):在维内对操作元素进行交叉连接,即复合分组,表示制表项嵌套。o 空格:对操作元素进行并排连接,在列表达式,空格表示横向并排连接,在行表达式,空格表示纵向并排连接。o 圆括号():对操作元素或分组规定先后顺序。o 逗号(,):用于区分表达式部分o 尖括号():规定分母的定义百分数在表格中的输出o子组的观测数与总观测数之比,叫频数百分比,或叫频数的比率,用PCTN表示o分析变量各子组的组内数值之和与总数值之和相比,叫和数百分比,或叫和数比例,用PCTSUM表示o上述两种百分比率不限于子组与总和数之比,还可以考虑子组再分组情况。o百分比制表的格式:PCT
8、N或PCTSUM=标签。标签由用户书写,代替关键字PCTN和PCTSUM输出到表格当中。百分比定义1.行总和百分数:如果列维中的所有分类变量,而且也只有列维中的分类变量出现在百分比定义中,其分母为每行的总和。例如,Table a,b*(n pctn);2.列总和百分数:如果行维中的所有分类变量,而且也只有行维中的分类变量出现在百分比定义中,其分母为每列的总和。例如,Table a,b*(n pctn);3.其他总和的百分比:如果在页维中的所有分类变量,而且也只有页维中的分类变量出现在百分比定义中,则对每个页维交叉计算行、列总和的百分比。例如,Table a,b*(n pctn);B12NPCT
9、NNPCTNA102530751220334067B12NPCTNNPCTNA101030301220204040B12NPCTNNPCTNA103330431220674057TABULATE过程实例1oData student;oinput NAME$AGE SEX$HEIGHT WEIGHT SCORE;oCARDS;oLiPing 23 F 171 57 620oWangHua 18 F 162 56 578oZhangP 24 M 156 45 599oGaoKe 19 F 170 55 603oLiuLiu 21 F 155 48 579oPingPing 18 M 186 65
10、594oHuYi 16 F 156 48 615oQueHong 19 M 178 77 580oQinYin 20 F 167 69 578oShiLei 22 F 154 42 588o;oproc tabulate FORMAT=6.2;oclass sex age;ovar height;otable(sex age)*height*(mean N*F=6.0);orun;TABULATE过程实例2odata sales;oinput region$citisize$pop product$saletype$quantity income;ocards;oes s 25000 a100
11、 r 150 3750 ne s 37000 a100 r 200 5000oso s 48000 a100 r 410 10250 we s 32000 a100 r 180 4500oes m 125000 a100 r 350 8750 ne m 237000 a100 r 600 15000oso m 348000 a100 r 710 17750 we m 432000 a100 r 780 19500oes l 62500 a100 r 750 18750 ne l 837000 a100 r 800 20000oso l 748000 a100 r 760 19000 we l
12、93200 a100 r 880 22000oes s 25000 a100 w 150 3000 ne s 37000 a100 w 200 4000oso s 48000 a100 w 410 8200 we s 32000 a100 w 180 3600oes m 125000 a100 w 350 7000 ne m 237000 a100 w 600 12000oso m 348000 a100 w 710 14200 we m 432000 a100 w 780 15600oes l 62500 a100 w 750 15000 ne l 837000 a100 w 800 160
13、00oso l 748000 a100 w 760 15200 we l 932000 a100 w 880 17600oes s 25000 a200 r 165 4125 ne s 37000 a200 r 215 5375oso s 48000 a200 r 425 10425 we s 32000 a200 r 195 4875oes m 125000 a200 r 365 9125 ne m 237000 a200 r 615 15375o;oproc tabulate noseps;oclass region citisize product saletype;ovar pop q
14、uantity income;otable product,region*citisize,saletype*(quantity income);otable region all,pop quantity income;otable region citisize,product*saletype quantity income;otable region*product all,(saletype all)*(quantity income);orun;TABULATE过程实例3data sales;input region$citysize$pop product$saletype$qu
15、antity amount;cards;es s 25000 a100 r 150 3750 ne s 37000 a100 r 200 5000so s 48000 a100 r 410 10250 we s 32000 a100 r 180 4500es m 125000 a100 r 350 8750 ne m 237000 a100 r 600 15000so m 348000 a100 r 710 17750 we m 432000 a100 r 780 19500es l 62500 a100 r 750 18750 ne l 837000 a100 r 800 20000so l
16、 748000 a100 r 760 19000 we l 93200 a100 r 880 22000es s 25000 a100 w 150 3000 ne s 37000 a100 w 200 4000so s 48000 a100 w 410 8200 we s 32000 a100 w 180 3600es m 125000 a100 w 350 7000 ne m 237000 a100 w 600 12000so m 348000 a100 w 710 14200 we m 432000 a100 w 780 15600es l 62500 a100 w 750 15000 n
17、e l 837000 a100 w 800 16000so l 748000 a100 w 760 15200 we l 932000 a100 w 880 17600es s 25000 a200 r 165 4125 ne s 37000 a200 r 215 5375so s 48000 a200 r 425 10425 we s 32000 a200 r 195 4875es m 125000 a200 r 365 9125 ne m 237000 a200 r 615 15375;TABULATE过程实例3(续)proc format;value$regfmt nc=NORTH ce
18、ntral ne=NORTH EAST so=SOUTH we=WEST;value$sizefmt s=UNDER 50000 m=50000 TO 500000 l=OVER 500000;value$salefmt r=RETAIL w=WHOLESALE;proc format;picture pct low-0=000.00%(prefix=-)0-high=0000.00%;proc tabulate;class region saletype;var amount;format region$regfmt.;format citysize$sizefmt.;format sale
展开阅读全文