书签 分享 收藏 举报 版权申诉 / 339
上传文档赚钱

类型SAS程序设计与应用课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4990117
  • 上传时间:2023-01-31
  • 格式:PPT
  • 页数:339
  • 大小:1.20MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《SAS程序设计与应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    SAS 程序设计 应用 课件
    资源描述:

    1、 SAS程序设计与应用SAS Programming and Application许昌学院数学与统计学院许昌学院数学与统计学院吴亚桢吴亚桢SAS简介n将计算机用于统计计算将计算机用于统计计算,主要通过统计软件实主要通过统计软件实现现,其中最具有代表性和全球用户最多的统计其中最具有代表性和全球用户最多的统计软件是软件是SASSAS软件软件.经过近半个世纪的发展经过近半个世纪的发展,SAS,SAS已已经由一个单一的统计软件发展为大型决策支持经由一个单一的统计软件发展为大型决策支持系统系统,利用利用SASSAS软件进行数据处理和统计分析软件进行数据处理和统计分析,不仅能得到各种检验统计量对应的确切

    2、概率值不仅能得到各种检验统计量对应的确切概率值,而且许多复杂的统计计算通过轻点鼠标就可以而且许多复杂的统计计算通过轻点鼠标就可以完成完成.SAS.SAS以其强大完善的数据处理与统计分析以其强大完善的数据处理与统计分析功能被公认为国际上标准的统计分析软件功能被公认为国际上标准的统计分析软件.SAS简介nSASSAS系统全称为系统全称为Statistics Analysis System,Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究最早由北卡罗来纳大学的两位生物统计学研究生编制生编制,并于并于19761976年成立了年成立了SASSAS软件研究所软

    3、件研究所,正正式推出了式推出了SASSAS软件软件.SAS.SAS是用于决策支持的大型是用于决策支持的大型集成信息系统集成信息系统,但该软件系统最早的功能限于但该软件系统最早的功能限于统计分析统计分析,至今至今,统计分析功能也仍是它的重要统计分析功能也仍是它的重要组成部分和核心功能组成部分和核心功能,同时系统的功能也逐渐同时系统的功能也逐渐扩展到线性与非线性规划、时间序列分析、运扩展到线性与非线性规划、时间序列分析、运筹决策支持、数据仓库和数据挖掘等领域筹决策支持、数据仓库和数据挖掘等领域.在在数据处理和统计分析领域数据处理和统计分析领域,SAS,SAS系统被誉为国际系统被誉为国际上的标准软件

    4、系统上的标准软件系统,堪称统计软件界的巨无霸堪称统计软件界的巨无霸.SAS简介nSASSAS一直为业界著名软件,在数据处理和统计一直为业界著名软件,在数据处理和统计分析领域,被誉为国际上的标准软件和最权威、分析领域,被誉为国际上的标准软件和最权威、最优秀的统计软件包,最优秀的统计软件包,尽管价格不菲,尽管价格不菲,SASSAS已已被广泛应用于政府行政管理、科研、教育、生被广泛应用于政府行政管理、科研、教育、生产和金融等不同领域,发挥着重要的作用。产和金融等不同领域,发挥着重要的作用。n虽然近几年虽然近几年SASSAS才在我国得到广泛应用,但是才在我国得到广泛应用,但是随着计算机应用的普及和信息

    5、事业的不断发展,随着计算机应用的普及和信息事业的不断发展,越来越多的单位采用了越来越多的单位采用了SASSAS软件。软件。SASSAS作为专作为专业统计软件中的巨无霸,目前还没有其它统计业统计软件中的巨无霸,目前还没有其它统计软件包能与之抗衡。该统计软件主要适合于统软件包能与之抗衡。该统计软件主要适合于统计工作者和科研工作者使用。计工作者和科研工作者使用。SAS简介n由于由于SASSAS最初是从大型机上的统计分析系统起家最初是从大型机上的统计分析系统起家,因此因此其核心操作方式一直是程序驱动其核心操作方式一直是程序驱动.虽然近年来虽然近年来SASSAS也提也提供了好几种界面操作模块供不同层次的

    6、用户选择供了好几种界面操作模块供不同层次的用户选择,但这但这并未动摇程序驱动方式的核心地位并未动摇程序驱动方式的核心地位.这是因为这是因为SASSAS是将是将用户群定位在专业统计分析人员上用户群定位在专业统计分析人员上,它必须要为使用者它必须要为使用者提供尽量强大的统计分析功能提供尽量强大的统计分析功能,以满足各种非常专业的以满足各种非常专业的需求需求.另一方面另一方面,由于专业统计分析人员经常需要尝试由于专业统计分析人员经常需要尝试使用各种类型的统计模型使用各种类型的统计模型,这就需要这就需要SASSAS在操作上有尽在操作上有尽量高的灵活性量高的灵活性,允许用户自行编程实现各种新算法允许用户

    7、自行编程实现各种新算法.显显然然,这种要求使用菜单方式几乎是无法实现的这种要求使用菜单方式几乎是无法实现的.因此因此,如如果要真正掌握果要真正掌握SASSAS的使用的使用,我们仍然要抛开其华丽的外我们仍然要抛开其华丽的外表表,从学习它的核心从学习它的核心-SAS-SAS程序开始程序开始.第一章第一章 SASSAS编程入门编程入门SAS语句的基本结构nSASSAS程序由若干个语句组成程序由若干个语句组成,多数语句都多数语句都由特定的关键字开始由特定的关键字开始,语句中可包含变量语句中可包含变量名名,运算符等运算符等,它们之间以空格分隔它们之间以空格分隔.所有所有的语句都以分号的语句都以分号“;”

    8、;”结束结束,SAS,SAS对语句所对语句所占的行数并无限制占的行数并无限制,一个语句可占一行一个语句可占一行,也可占多行也可占多行;反之反之,多个语句也可写在同多个语句也可写在同一行内一行内.下面是一个简单的程序示例下面是一个简单的程序示例:SAS程序ndata a;ninput x;ncards;n1 2 3 4 5 6 7 8 9n;nproc print;nvar x;nrun;nquit;数据步与过程步nSAS程序有着模块化的特点,虽然每一个具体的SAS程序可以非常复杂,但其基本结构一般都是由环境设置语句和数个完成单个动作的程序步构成.n在SAS中只有两种程序步:数据步(Data S

    9、tep)和过程步(Proc Step).前者用来创建和修改用于统计分析的数据集,后者则利用已创建的数据集完成特定的统计分析任务.数据步 n以DATA语句开始,用于创建和处理数据集。其中最常用的语句有:nDATA语句 它的主要功能是:标志数据步的开始。命名将要创建的SAS数据集。DATA语句的一般形式如下:DATA 数据集名;INPUT语句 nINPUT语句 用于向系统表明如何读入每一条记录。它的主要功能有:读入由语句指定的数据列。为相应的数据域定义变量名。确定变量的读入模式。INPUT语句的格式如下:INPUT 变量名 变量类型 起止列数.;方括号表示其中的内容为可选,如果不输入,系统会以默认

    10、值代替。INPUT语句n以下是几个例子ninput x y z;ninput x1-x10;ninput x$y;n其中第2句使用了缩写符号,第3句中的$指明变量x为字符变量,表明数据是连续读入的。CARDS语句 nCARDS语句 用于直接输入数据,标志着数据块的开始,随后紧跟着需要读入的数据。格式如下:CARDS;数据块 ;INFILE语句 nINFILE语句 用于从外部文件读入数据,必须出现在INPUT语句之前。它的主要功能是:确定一个包含原始数据的外部文本文件。INFILE语句的格式如下:INFILE 外部文件的所在位置及名称 选项;数据的两种输入方式 n上面我们学到了INFILE语句和

    11、CARDS语句,它们分别对应了两种数据输入的方式:n【直接输入方式】实际上我们在前面已经用到了直接输入方式 SAS程序ndata temp;命名将要建立的数据集为tempninput x y;要输入的变量为x、y,并且连续输入ncards;直接输入数据,数据块开始n34 56 78 90 35 67 89 10 23 65 77 45 数据块n;数据块结束SAS程序n变量后面的表示数据可以在一行里连续读入,SAS默认按列来分隔变量,可是这里只有两个变量,输成两列数据太长,因此加上两个,SAS见到这个符号,在按变量名依次读取完数据后,不是跳到下一行,而是继续在该行读数据,直至本行结束或到达分号为

    12、止。n如果你对这段叙述无法理解,请去掉两个,重新运行一遍程序,看看视窗中的提示都有些什么变化。【外部文件读入方式】n如果刚才的数据已经事先输好,在硬盘上的“C:USER”文件夹内存为temp.txt文件,该文件内容如下(纯文本):n34 56 78 90 35 67 89 10 23 65 77 45n则我们可以输入程序如下:ndata temp;命名将要建立的数据集为tempnInfile c:usertemp.txt;指定外部数据文本文件名ninput x y;要输入的变量为x、y;数据步结束,以上语句可以执行了.SET语句n此语句的功能是将指定数据集的内容完整地复制到新建的数据集中,当从

    13、头新建SAS数据集时并不需要使用set语句。但如果想在原有数据集基础上进行数据编辑,则set语句将会非常有用。SAS程序的过程步程序的过程步 n通俗的讲,SAS的过程步就是已经编好了的用于实现各种统计分析功能的计算机程序,你只需要按照规定好的格式调用它们就是了。过程步总是用一个PROC语句开始,后面紧跟着过程步名,用以区分不同的过程步。以下是一些常用的过程步的名称及功能。程序步名及功能nSORT 将指定的数据集按指定变量排序nPRINT 将数据集中的数据列表输出nMEANS 对指定的数值变量进行简单的统计描述nIML 矩阵操作与运算nTTEST 对指定的变量做t检验程序步名及功能nANOVA

    14、对指定的变量做方差分析nNPAR1WAY 对指定的变量做非参数检验nREG 对指定的变量做回归分析nCORR 对指定的变量做相关分析nGCHART 绘制统计图形过程步nPROC就是过程(procedure)的缩写,而过程步的名字大都是其功能相对应的单词或词组的缩写。可见SAS的许多功能就是通过过程步来体现的,可如此多的种类也使我们难以总结出一个过程步的通式来。不过仍可大致给出如下结构:PROC 过程名 DATA=数据集名 选项;该过程的专用语句描述;VAR 变量序列;WHERE 条件表达式.;BY 变量序列;Run;过程步n方括号里的语句均可以省略,在这时该过程按最通常的情况来处理,即:n处理

    15、最新建立的SAS数据集。n处理所有的变量(或对一个计算过程来说处理全部数值变量)。n一次处理整个数据集而不是某个子集。n我们在前面用到的PRINT程序步就是采用的这种默认方式。过程步n但有时我们的要求超出了默认方式所提供的范围,这时就要动用方括号里的秘密武器了。nDATA选项 指明所需处理的数据集名,请注意在这里它是一个参数而不是语句。nVAR语句 如果只想分析某一个或几个特定的变量,则可用VAR语句指定它们。例如在数据集中有x、y两个变量,如果只想显示变量x的列表,则PRINT过程如下:程序步nProc print;nVar x;nRun;n如果想显示x和y两个变量,则将VAR语句改为如下形

    16、式即可:nvar x y;n当然,也可以将VAR语句删除,结果相同。第二章第二章 数据管理入门数据管理入门变量的筛选n在数据集建立后,如果需要删除其中的某些变量,则可以使用keep/drop语句来实现,keep/drop语句只能使用其中一个,不能同时出现。其中keep语句指定需要保留的变量,其余变量均被删除,而drop语句则指定需要删除的变量,其余变量均被保留。数据集的排序n将数据集中的观测按照一个或多个变量的数值大小进行排序是常见的操作,该功能在SAS中使用sort过程实现,该过程的语法结构如下:nproc sortnby descending变量名;n其中descending选项用于变量为

    17、降序排列。数据集的纵向连接n数据集的纵向连接指的是几个数据集中的数据纵向相加,组成一个新的数据集,新数据集中的记录数是原来几个数据集中记录数的总和。在SAS中使用set语句实现。数据集的横向合并n横向合并指的是按照记录的次序,或者某个关键变量的数值将不同数据集中的不同变量拼接为一个数据集,新数据集中的变量数是所有原数据集中不重名变量的总和。在SAS中使用mergemerge语句实现。程序举例程序举例n某班有若干名同学,每个同学的信息包某班有若干名同学,每个同学的信息包括学号括学号(num)(num)、姓名、姓名(name)(name)、性别、性别(sex)(sex)、成绩成绩(score)(s

    18、core)等项,每个学生有等项,每个学生有3 3门课程,门课程,请把该班同学的信息输入请把该班同学的信息输入SASSAS数据集并分数据集并分别按总成绩由高到低的顺序进行排序,别按总成绩由高到低的顺序进行排序,给出给出SASSAS程序及运行结果。程序及运行结果。n数据如下:数据如下:n1001 Kate f 97 83 82n1002 Tom m 95 89 84n1003 Jenny f 93 91 83n1004 Alex m 92 90 91n1005 Alice f 90 85 91程序如下:程序如下:ndata score;data score;ninput num name$sex$

    19、s1-s3;input num name$sex$s1-s3;ntotal=sum(of s1-s3);total=sum(of s1-s3);ncards;cards;n1001 Kate f 97 83 821001 Kate f 97 83 82n1002 Tom m 95 89 841002 Tom m 95 89 84n1003 Jenny f 93 91 831003 Jenny f 93 91 83n1004 Alex m 92 90 911004 Alex m 92 90 91n1005 Alice f 90 85 911005 Alice f 90 85 91n;nproc

    20、sort data=score out=cs2;proc sort data=score out=cs2;nby descending total;by descending total;nproc print;proc print;nrun;run;nquit;quit;n如果按总成绩由低到高的顺序进行排序,如果按总成绩由低到高的顺序进行排序,则程序改为:则程序改为:nproc sort data=score out=cs2;proc sort data=score out=cs2;nby total;by total;nproc print;proc print;nrun;run;nqui

    21、t;quit;程序举例程序举例n某班有若干名同学,每个同学的信息包某班有若干名同学,每个同学的信息包括学号括学号(num)(num)、姓名、姓名(name)(name)、性别、性别(sex)(sex)、成绩成绩(score)(score)等项,每个学生有等项,每个学生有3 3门课程,门课程,分别是数学(分别是数学(mathmath)、语文)、语文(chinese)(chinese)、英语英语(english)(english),请把学号、姓名、性别,请把学号、姓名、性别这些信息放在这些信息放在SASSAS数据集数据集studentstudent中,把中,把成绩信息放在成绩信息放在SASSAS数

    22、据集数据集testtest中,并把这中,并把这两个数据集横向及纵向合并,给出两个数据集横向及纵向合并,给出SASSAS程程序。序。数据如下:数据如下:n数据如下:数据如下:n89100 ZHANGLI F 79 96 87 89100 ZHANGLI F 79 96 87 n89101 LIUWEI M 69 78 9289101 LIUWEI M 69 78 92n89102 WANGMING M 68 87 93 89102 WANGMING M 68 87 93 n89103 CHENHONG F 88 93 9089103 CHENHONG F 88 93 90n89104 WANGL

    23、I F 76 89 8889104 WANGLI F 76 89 88程序如下:程序如下:ndata student;data student;ninput num name$sex$;input num name$sex$;ncards;cards;n89100 ZHANGLI F 89100 ZHANGLI F n89101 LIUWEI M 89101 LIUWEI M n89102 WANGMING M 89102 WANGMING M n89103 CHENHONG F 89103 CHENHONG F n89104 WANGLI F 89104 WANGLI F n;nproc p

    24、rint;proc print;ndata test;data test;ninput t1-t3;input t1-t3;ncards;cards;n79 96 8779 96 87n69 78 9269 78 92n68 87 93 68 87 93 n88 93 9088 93 90n76 89 8876 89 88n;nproc print;proc print;ndata studtest;data studtest;nmerge student test;merge student test;nproc print;proc print;ndata c;data c;nset st

    25、udent test;set student test;nproc print;proc print;nrun;run;nquit;quit;n上例中把学号、姓名、性别这些信息放上例中把学号、姓名、性别这些信息放在在SASSAS数据集数据集studentstudent中,把成绩信息放中,把成绩信息放在在SASSAS数据集数据集testtest中,还可以用如下程序中,还可以用如下程序实现。实现。ndata class;data class;ninput num name$sex$t1-t3;input num name$sex$t1-t3;ncards;cards;n89100 ZHANGLI

    26、F 79 96 87 89100 ZHANGLI F 79 96 87 n89101 LIUWEI M 69 78 9289101 LIUWEI M 69 78 92n89102 WANGMING M 68 87 93 89102 WANGMING M 68 87 93 n89103 CHENHONG F 88 93 9089103 CHENHONG F 88 93 90n89104 WANGLI F 76 89 8889104 WANGLI F 76 89 88n;nproc print;proc print;ndata student;data student;nset class;set

    27、 class;nkeep num name sex;keep num name sex;nproc print data=a;proc print data=a;nrun;run;nquit;quit;ndata test;data test;nset class;set class;ndrop num name sex;drop num name sex;nproc print data=a;proc print data=a;nrun;run;nquit;quit;第三章第三章 数据的统计描述数据的统计描述MEANS过程n用来对数据集中的数值变量计算简单的描述性统计量。SUMMARY过程n

    28、和MEANS过程类似,都是用来对数值变量计算单个变量的基本统计量。而且这两个过程使用的语句和选项都相同。它们的区别在于缺省时,SUMMARY不打印输出计算结果,而MEANS总是打印输出计算的统计量。如果使用SUMMARY过程时希望打印输出统计量,必须在PROC SUMMARY语句中规定选项PRINT。UNIVARIATE 过程n该过程除了可以完成类似MEANS 过程的基本统计量的计算外,它还可以计算如n下统计量:n1.描述变量的极端值的情况。n2.计算分位数,如中位数等。UNIVARIATE 过程n3.生成若干个描述变量分布的图(如茎叶图,正态概率图等)。n4.生成频率表。n5.对数据进行正态

    29、性检验和对总体均数是否为零进行假设检验。SAS程序举例n下面为长沙市某大学40名正常成年女子1999年体检资料中的血清甘油三脂的测量结果(mmol/L),请对其进行统计描述.0.91 0.88 1.41 0.96 1.48 1.46 0.91 1.10 1.26 1.69 1.14 1.24 0.98 0.68 0.83 1.77 1.23 1.04 1.08 0.62 1.10 1.33 0.73 0.52 1.01 1.71 1.37 0.51 1.01 1.11 1.09 0.96 1.37 1.20 0.61 1.17 0.71 1.16 0.80 0.73SAS程序举例n按题目要求我

    30、们来计算该指标的均数、中位数、标准差和若干个重要的百分位数以及四分位数.n以univariate过程进行分析n针对本例数据编制如下SAS程序SAS程序举例nfilename x E:吴亚桢教学考试资料SAS课件资料SAS课程序data1.txt;ndata a;ninfile x;ninput x;nproc univariate normal data=a;/*也可采用MEANS过程或SUMMARY过程*/nvar x;nrun;nquit;TABULATE 过程n以表格的形式呈现数据集中部分或全部变量的各种描述性统计量,是常用的报表制作工具之一。SAS程序举例n某班有若干名同学,每个同学的

    31、信息包括学号(num)、姓名(name)、性别(sex)、成绩(score)等项,每个学生有3门课程,分别是数学(math)、语文(chinese)、英语(english),请把这些信息放在SAS数据集score中,并分别输出反映男、女生数学成绩总和的描述性统计报表以及反映男女生数学、语文成绩的平均值、方差的描述性统计报表。数据如下:n num name sex math chinese Englishn 1 Kate f 97 83 82n 2 Tom m 95 87 84n 3 Jenny f 93 90 83n 4 Alex m 92 90 91n 5 Alice f 90 85 91n

    32、 6 Tod m 89 84 84n 7 Chris f 89 84 87n 8 Janet f 86 65 67n 9 Geoge m 86 85 82n 10 Fred m 84 85 89 程序如下:ndata score;ninput num name$sex$math chinese English;ncards;n1 Kate f 97 83 82n2 Tom m 95 87 84n3 Jenny f 93 90 83n4 Alex m 92 90 91程序如下:n 5 Alice f 90 85 91n 6 Tod m 89 84 84n 7 Chris f 89 84 87n

    33、8 Janet f 86 65 67n 9 Geoge m 86 85 82n 10 Fred m 84 85 89n;程序如下:n/*输出报表,反映男、女生数学成绩总和*/nproc tabulate data=score;nclass sex;nvar math;ntable sex,math;nrun;程序如下:n/*输出报表,反映男女生数学、语文成绩的平均值、方差*/nproc tabulate data=score;nclass sex;nvar math chinese;ntable sex,(math chinese)*(mean var);nrun;nquit;GCHART过程

    34、n可以绘制六种类型的统计图形,包括直方图,圆图,条图。GPLOT过程n用于将数据集中两个或两个以上变量的变量值绘制在一组二维坐标系中,坐标系中每一个点的坐标对应于输入数据集中一条观测上两个变量的变量值。绘制的图形的分辨率比PLOT过程高。SAS程序举例n2001年上海市某大学30名正常女子总胆固醇(mmol/L)测定结果如下,请绘制描述性统计图形直方图进行统计描述。n数据如下:n3.18 3.78 3.41 3.75 3.55 3.00 5.26 3.60 3.50 4.25 3.58 3.98 4.17 5.08 3.26 4.48 2.70 2.75 3.57 3.87 5.50 4.80

    35、 3.51 4.06 5.71 2.78 3.98 4.52 4.53 5.13程序如下:ndata a;ninput x;ncards;n3.18 3.78 3.41 3.75 3.55 3.00 5.26 3.60 3.50 4.25 3.58 3.98 4.17 5.08 3.26 4.48 2.70 2.75 3.57 3.87 5.50 4.80 3.51 4.06 5.71 2.78 3.98 4.52 4.53 5.13 n;程序如下:nproc gchart;/*也可采用chart过程*/nvbar x/type=freq space=0 width=6nmidpoints=2

    36、.70 to 5.71 by 0.3;nrun;nquit;SAS程序举例n长沙市某大学40名正常成年女子1999年体检资料中的血清甘油三脂的测量结果(mmol/L)如下,假设甘油三脂水平高于1.5者为异常,将40名女子划分为正常和异常两组。分别计算正常组和异常组占总人数的构成比,并用圆图和百分条图展示其构成情况。数据如下:n0.91 0.88 1.41 0.96 1.48 1.46 0.91 1.10n1.26 1.69 1.14 1.24 0.98 0.68 0.83 1.77n1.23 1.04 1.08 0.62 1.10 1.33 0.73 0.52n1.01 1.71 1.37 0

    37、.51 1.01 1.11 1.09 0.96n1.37 1.20 0.61 1.17 0.71 1.16 0.80 0.73 程序如下:ndata a;ninput x;ncards;n0.91 0.88 1.41 0.96 1.48 1.46 0.91 1.10n1.26 1.69 1.14 1.24 0.98 0.68 0.83 1.77n1.23 1.04 1.08 0.62 1.10 1.33 0.73 0.52n1.01 1.71 1.37 0.51 1.01 1.11 1.09 0.96n1.37 1.20 0.61 1.17 0.71 1.16 0.80 0.73n;程序如下:

    38、ndata b;nset a;ni=1;nif x1.5 then g=1;nproc tabulate;nclass g;ntable g*(n pctn);nproc gchart;npie g/type=freq discrete slice=arrow value=inside;nproc gchart;nhbar i/type=freq discrete subgroup=g width=8;nrun;nquit;SAS程序举例n下表中,列出了下表中,列出了1995年不同地区制造业年不同地区制造业的工资和福利,试用合适的统计图将其的工资和福利,试用合适的统计图将其表达出来。表达出来。

    39、表表 1995年不同地区制造业的工资和福利年不同地区制造业的工资和福利地区地区 制造业的工资和福利(美元制造业的工资和福利(美元/小时)小时)西德西德日本日本美国美国英国英国韩国韩国墨西哥墨西哥印度印度 31.8831.88 23.66 23.66 17.20 17.20 13.77 13.77 5.25 5.25 1.51 1.51 0.71 0.71 程序如下ndata a;data a;ninput area$wage;input area$wage;ncards;cards;n西德西德 31.88 31.88 日本日本 23.66 23.66 美国美国 17.2017.20n英国英国

    40、13.77 13.77 韩国韩国 5.25 5.25 墨西哥墨西哥 1.511.51n印度印度 0.710.71n;ngoptions hsize=6 vsize=4 ftext=宋体;nfootnote 图45-1 1995年不同地区制造业的工资和福利;naxis1 label=(地区)n order=(西德 日本 美国 英国 韩国 墨西哥 印度)n minor=nonen major=nonen offset=(6,6);naxis2 label=(angle=90 制造业的工资和福利(美元/小时)n offset=(0,0);nproc gchart data=a;nvbar area/

    41、sumvar=wagen maxis=axis1n raxis=axis2;nrun;图 1995年不同地区制造业的工资和福利制造业的工资和福利(美元/小时)010203040地区西德日本美国英国韩国墨西哥印度 第四章第四章单组或两组资料均数的比较单组或两组资料均数的比较n此处的单组资料均数的比较是指对观察所得的样本均数与已知的某个总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)进行比较,以判断样本是否来自该已知总体。n两组资料均数的比较是指对观察所得的两个样本的均数进行比较,以判断两者是否来自同一个总体的过程。n对于这一类型的假设检验,采用的统计学方法主要有t检验。n根据研究设计

    42、,又可分为样本均数与总体均数比较的t检验、配对设计资料的t检验和两样本均数比较的t检验三种。t检验的应用条件n(1)独立随机样本。即所检验的样本是从总体中随机抽取,并且样本间相互独立;n(2)资料的正态性。即要求样本来自正态分布的总体,对配对设计资料,要求差数服从正态分布。n(3)方差齐性。在两样本均数比较的t检验中,其相应的两总体方差相等或两样本方差经检验无统计学差异。n在进行两样本均数比较的t检验前,需考察资料是否满足下述两个前提条件:n(1)正态性,即各组数据应独立抽自正态总体;n(2)方差齐性,即两组资料的总体方差应该相等。n下面根据这两个 前提条件的满足情况,给出统计检验方法的选用办

    43、法:前提条件满足情况 可选用的统计检验方法(1)(2)均满足 一般t检验(1)满足(2)不满足 近似t检验;或非参数检验(1)不满足 非参数检验 样本均数与总体均数比较的t检验n某药厂制剂车间用自动装瓶机封装药液,在装瓶机工作正常时,每瓶药液净重500克。某日随机抽取10瓶成品,称重分别为504,498,496,487,509,476,482,510,469,472。问这时的装瓶机工作是否正常?方法方法1 1程序如下:程序如下:ndata a;ninput x;ny=x-500;ncards;n504 498 496 487 509 476 482 510 469 472n;nproc uni

    44、variate normal;n/*也可用proc means t prt;但不能实现正态性检验*/nvar y;nrun;nquit;分析与结论n满足正态性要求,t检验的P值为0.0750,可以认为装瓶机工作正常。方法方法2 2程序如下:程序如下:ndata a;ninput x;ncards;n504 498 496 487 509 476 482 510 469 472n;nproc ttest h0=500 alpha=0.05;nvar x;nrun;nquit;样本均数与总体均数比较的t检验n通过以往大规模调查,已知某地婴儿出生体重均数为3.30kg,今测得35名难产儿出生体重如下

    45、表所示,请问该地难产儿出生体重与一般婴儿出生体重是否不同?n这是一个单组样本均数和已知总体均数比较的t检验问题.样本均数与总体均数比较的t检验n35名难产儿出生体重(kg)3.83 3.28 4.05 3.62 3.49 2.86 3.91 4.24 3.20 4.30 3.39 3.54 4.16 2.79 3.25 3.14 3.44 3.11 3.14 3.16 3.80 3.87 3.29 3.23 3.18 3.63 3.48 3.48 3.87 3.50 3.53 2.95 3.72 3.52 3.36样本均数与总体均数比较的t检验nfilename x E:吴亚桢教学考试资料SA

    46、S课件资料SAS课程序data2.txt;ndata a;ninfile x;ninput x;nproc ttest h0=3.30 alpha=0.05;nvar x;nrun;nquit;样本均数与总体均数比较的t检验nh0=3.30”用来指定要与样本均数比较的已知总体均数,“alpha=0.05”用来指定结果中各种统计量的可信区间的置信水平.n结果中包括均数及其可信区间、标准差及其可信区间、均数的标准误、最大值及最小值等.t检验结果,t值为3.05,对应的P值为0.0044.结论:该地难产儿出生体重与一般婴儿出生体重不同,n难产儿出生体重大于一般婴儿(3.49463.30).n某牌号烟

    47、支重量某牌号烟支重量G G 服从正态分布服从正态分布 ,其中均值,其中均值 的设计值为的设计值为0.8800.880,一卷接机组,一卷接机组进行设备调整后,对均值是否等于进行设备调整后,对均值是否等于0.8800.880进行进行例行检验,以观察生产是否正常进行,某天例行检验,以观察生产是否正常进行,某天从生产线中随机抽取从生产线中随机抽取2020支卷烟,测得烟支重支卷烟,测得烟支重量为量为:X1:X1、X2X2、X20X20,数据如下:,数据如下:0.93193 0.91292 0.92531 0.88683 0.90320 0.89877 0.92836 0.912752,0.022N样本均

    48、数与总体均数比较的t检验 0.89955 0.91583 0.89582 0.908500.89955 0.91583 0.89582 0.90850 0.93281 0.89409 0.89565 0.89432 0.93281 0.89409 0.89565 0.89432 0.92386 0.90719 0.87990 0.92625 0.92386 0.90719 0.87990 0.92625n问当日生产是否正常问当日生产是否正常?ndata a;data a;ndo time=1 to 2000;do time=1 to 2000;nnoise=noise=0.88+0.0260.

    49、88+0.026*rannor(1);output;/rannor(1);output;/*加加outputoutput,随机数相互独立,随机数相互独立,1 1表示种子值,不同的种子值后面都表示种子值,不同的种子值后面都有一系列随机数。有一系列随机数。*/nend;end;nproc print;proc print;nproc gplotproc gplot data=a;data=a;nplot noiseplot noise*time;time;nsymbol1 c=red v=star i=;symbol1 c=red v=star i=;nrun;run;nquit;quit;模拟产

    50、生正态分布随机数程序模拟产生正态分布随机数程序n均值假设检验问题。均值假设检验问题。n结论结论:在在=0.05,=0.05,当日烟支重量与设计值当日烟支重量与设计值0.880.88间存在显著差异间存在显著差异,表明该卷接机生产过程不正表明该卷接机生产过程不正常常,烟支重量存在异常波动烟支重量存在异常波动,因此必须找出引起因此必须找出引起卷烟重量异常波动的异因并加以消除。后建议卷烟重量异常波动的异因并加以消除。后建议生产车间从人员、设备、原材料、工艺方法、生产车间从人员、设备、原材料、工艺方法、环境、测量等环境、测量等6 6个方面查找原因个方面查找原因,发现引起卷烟发现引起卷烟重量异常波动的原因

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:SAS程序设计与应用课件.ppt
    链接地址:https://www.163wenku.com/p-4990117.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库