《R语言与回归分析》课件分析.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《R语言与回归分析》课件分析.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- R语言与回归分析 语言 回归 分析 课件
- 资源描述:
-
1、R语言与回归分析语言与回归分析 R简介 R语言分析一个简单的线性模型 总结与展望 作业R简介1.S语言与R2.R的安装与运行3. R程序包的安装及使用4. R语言中的几点注意事项S语言与R R是一个有着强大统计分析及作图功能的软件系统 R语言可以看作是贝尔实验室开发的S语言的一种实现或形式 S语言主要内含在S-PLUS软件中,可将R和S-PLUS视为S语言的两种形式 S/S-PLUS方面的文档都可以直接用于RR的安装与运行 R的安装:从网址http:/www.r-project.org/ 下载R的安装程序和R程序包 (R下载地址:http:/cran.r-project.org/bin/win
2、dows/base/) http:/www.r-project.org/,单击download R单击Windows ,在单击base 单击Download R 2.11.1 for Windows R程序包的安装(1)菜单方式:联网条件下,按程序包 安装程序包 选择CRAN镜像服务器 选择程序包(2)命令方式:install.packages(“PKname”)(3)本地安装:下载需要的程序包及与之关联 的程序包,再用“程序包”菜单中的“用本机的zip文件安装程序包”R程序包的使用除R的标准程序包外,新安装的程序包使用前必须载入,两种载入方式:(1)菜单方式: 通过“程序包”菜单中的“载入程
3、序包”,再从已有程序包中选定需要的一个加载;(2) 命令方式: 在命令提示符后键入 libiary(“PKname”) # 或 libiary(PK name) ,libiary(PKname)R语言中的几点注意事项 R语言区分大小写,即A与a不同;正常情况下所有字母和数字都是可用的。 命令由(;)分隔,或另起新行。 基本命令由(和)合并成复合表达式 注释以(#)开始,到行末结束。 命令未结束,R给出提示符(+)。R语言与线性回归 线性回归模型的简单回顾 如何应用R语言进行回归分析线性回归模型的简单回顾 Y通常称为因变量或响应变量,X称为自变量或预报变量。Y值由两部分组成,一部分由X决定是X的
4、函数,记为f(X);另一部分由其他为考虑因素所产生的影响被称为随机误差,记为e。模型记为: Y=f(X)+e 要求 E(e)=0,特别的f(X)取为线性函数。线性回归模型的简单回顾 回归分析的主要目的是探寻因变量与自变量之间的关系。 最常用的函数形式是线性函数,含有p个自变量的一般线性模型: 其中 为常数项, 为第j个解释型变量 的回归系数,它意味着,若 变化一个单位,可以预期 变化多少单位。01122iiipipiyxxx0(1,2, )jjpijxijxiy线性回归模型的简单回顾对此普通线性模型做如下假定:(1)独立性:不同观测值之间相互独立的;残差项同解释性变量之间是独立的。(2)常方差
5、:即残差 的方差不依赖于自变量的取值,为一个常数。(3)正态性:即残差项 是服从正态分布的。ii背景、目标、变量和分析案例背景 目前中国的资本市场逐渐成熟,投资于股市成为众多企业乃至个人的重要理财方式。因此就成为投资人最重要的决策依据。 本案例随机抽取深市和沪市2002年和2003年各500个样本,对上市公司的净资产收益率净资产收益率(return on equity, ROE)进行预测。案例目标与变量 目标:盈利预测 因变量:下一年的净资产收益率(ROE) 自变量:当年的财务信息 样本容量:2002年500;2003年500 自变量 ROEt: 当年净资产收益率当年净资产收益率 ATO: 资
6、产周转率资产周转率(asset turnover ratio) LEV: 债务资本比率债务资本比率(debt to asset ratio)反映公司基本债务状况 PB: 市倍率市倍率(price to book ratio)反映公司预期未来成长率 ARR: 应收账款应收账款/主营业务收入主营业务收入(account receivable over total income)反映公司的收入质量对模型的进一步分析哪个自变量在预测方面最有用?哪个自变量是最重要的?如何使用模型进行预测?获得对数据的整体性认识数据读取(1)使用函数read.table()创建数据框rm(list=ls() #清理当前工
7、作空间aalibrary(RODBC) b-odbcConnectExcel(d:/暑期建模/CH1/roe.xls) a save(a,file=a.RData) load(d:我的文档a.RData)#调用以保存数据 write.table(a, a.txt)#保存为文本文档 write.csv(a, a.csv) a1=aa$year=2002,-1 save(a1,file=a1.RData)显示数据变量的概括性度量 a1=aa$year=2002,-1 #从a中选出year为2002的数据,并删除第1列,然后赋值给a1 Mean=sapply(a1,mean) #计算a1中各列的均值
展开阅读全文