第一章-R-基础-01-(非参数统计-2015)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第一章-R-基础-01-(非参数统计-2015)课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 基础 01 参数 统计 2015 课件
- 资源描述:
-
1、非参数统计郭广报序言统计是一个面向问题解决的、系统收集数据和基于数据做出回答的过程,其本质是通过在随机现象中寻找分布规律回答现实问题的科学过程。实际问题的复杂性和人类认知的局限性,造成反映实际问题的数据在问题表示的充分性、代表性和分布的单一性等方面,与传统的统计应用要求不相匹配,于是催生了对数据分布假定宽松的非参数统计的兴起与发展。尤其是最近20年来,随着信息技术和网络技术的快速发展,基于大量数据计算探索数据分布特点的数据分析方法层出不穷,成为非参数统计发展的新主题,代表着统计学未来的方向。非参数统计自然成为连接统计学、信息学和计算机科学等交叉研究的桥梁,共同推动数据分析和信息利用整体地向前发
2、展。本书是一本专门讲授非参数统计理论和方法的教科书。内容主要分为两个部分:传统的非参数统计推断和现代非参数统计方法。传统的非参数推断内容由单一样本、两样本及多样本非参数统计估计和假设检验、分类数据的关联分析方法、定量数据的相关和回归等内容构成;现代非参数统计方法部分包含非参数密度估计、非参数回归和数据挖掘与机器学习技术等内容。本书的主要特色是结合R软件讲解非参数统计方法的原理和应用,我们的宗旨是塑造有独立专业思考能力,对所学知识有比较地选择,并能够使用恰当方法解决实际问题的统计专业人才。据此,我们在课程设计中,专门设计了学生在接受知识的过程中对知识的运用和鉴别能力的训练。本书大部分例题都给出R
3、源程序解法示例,各种理论条件的检验、讨论、分析和比较,鼓励学生针对数据的特点,独立编写数据分析程序。为加强与R的结合,书中图形大部分由R生成,我们广泛收集了很多领域数据分析实例和应用编写成本书的例题和习题,以扩展学生的应用领域,提高学生解决实际问题的能力。本书可作为统计、经济、管理、生物等宏、微观专业领域本科三、四年级以上学生以及相关研究人员学习非参数统计方法的教材,也可以用作统计研究或从事数据分析的方法的参考书。本书的先修课程只需具备初等统计学基础。对统计基础略感陌生的读者,可以阅读第2章相关内容作为补充。本书的内容可以安排在一学期54课时内完成,建议安排10课时左右用于学生上机实践。本书备
4、有丰富的习题,兼有理论推导、方法应用和上机实践题目。 第1章 R基础 (P297)R是一种专业统计分析软件,最早于1995年由Auckland大学统计系的RobertGentleman和Ross lhaka等研制开发,l997年开始免费公开发布1.0版本。在短短的10几年时问里,R发展迅速,现己发展到R3.1.3系列版本。据不完全统计,在欧美等发达国家的著名高等学府,R不仅是专业学习统计的流行教学软件,而且已成为从事统计研究的学生和统计研究人员必备的统计计算工具。R的主要特点归纳如下:(1)R是自由免费的专业统计分析软件,拥有强大的面向对象的开发环境,可以在UNIX,Windows和MACIN
5、TOSH等多种操作系统中运行。(2)使用可编程语言是R作为专业软件的基本特点。众所周知,目前流行的许多商业统计分析软件主要是通过单击菜单完成计算和分析组合任务,用户不得不在预定义好的统计过程中选择可能接近的模块进行数据分析,被迫接受预设的程式化输出,许多应有的对数据的观察、体验和分析判断受到很大限制。而R却克服了这些弱点。(3)R的语言与S语言非常相似虽实现方法不同,但兼容性很强。作为面向对象的语言,R集数据的定义、插入、修改和函数计算等功能于一体,语言风格统一,可以独立完成数据分析生命周期的全部活动。作为标准的统计语言,R几乎集中了所有程序编辑语言的优秀特点。用户可以在R中自由地定义各种函数
6、,设计实验,采集数据,分析得出结论。在这个过程中,用户不仅可能延伸R的基本功能,而且还可能自创一些特殊问题的统计过程。R是一种解释性语言,语法与英文的正常语法和其他程序设计语言的语法表述相似,容易学习,编写的程序简练,费时较短。16简 史 R语言是从S统计绘图语言演变而来,可看作S的“方言”。 S语言上世纪70年代诞生于贝尔实验室,由Rick Becker, John Chambers, Allan Wilks开发。 基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,在国外学术界应用很广。 1995年由新西兰Auckland大学统计系的Robert Gentl
7、eman和Ross Ihaka,基于S语言的源代码,编写了一能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。17R的特点多领域的统计资源 目前在R网站上约有2400个程序包包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。跨平台 R可在多种操作系统下运行,如Windows、MacOS、多种Linux和UNIX等。命令行驱动 R即时解释,输入命令,即可获得相应的结果。18丰富的资源丰富的资源 涵盖了多种行业数据分析中几乎所有的方法。良好的扩展性 十分方便得编写函数和程序包,跨平台,可以胜任复杂的数据分析、绘制精美的图形。
8、完备的帮助系统 每个函数都有统一格式的帮助,运行实例。免费、软件本身及程序包的源代码公开。19R与其他统计软件比较SAS: 速度快,有大量统计分析模块,可扩展性稍差,昂贵。SPSS: 复杂的用户图形界面,简单易学,但编程十分困难。Splus: 运行S语言,具有复杂的界面,与R完全兼容,昂贵。 20R的缺点用户需要对命令熟悉 与代码打交道,需要记住常用命令。占用内存运行速度稍慢A.1 R基本概念和操作A.1.1 R环境A.1.2 常量A.1.3 算术运算A.1.4 赋值22A.1.1 R环境(Windows下载和安装R)CRAN: BinariesWindowsbase 下载完成后,双击R-2.
展开阅读全文