[计算机软件及应用]数据相关分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《[计算机软件及应用]数据相关分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机软件及应用 计算机软件 应用 数据 相关 分析 课件
- 资源描述:
-
1、数据相关分析 Correlations 1 相关分析的概念与相关分析过程返回一、函数关系与相关关系q反映现象之间存在着严格严格的依存关系,即当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,这种关系为确定性的函数关系函数关系。q例如,圆周长L与圆半径r之间存在严格的确定性关系,因而两者为函数关系,即 。rL2q当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系相关关系。q它反映现象之间客观存在的、不严格、不确定的相互依存关系。这种关系不能通过个别现象体现其关系的规律性,必须在
2、大量现象中才能体现出来。q例如,身高与体重的关系。二、相关分析与回归分析 q是研究现象之间相关关系的两种基本方法。q相关分析相关分析是用一个指标来表明现象间相互依存关系的密切程度。q回归分析回归分析是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。相关分析和回归分析有着密切的联系密切的联系q相关分析需要依靠回归分析来表明现象数量相关的具体形式。q回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。但两者在研究目的和方法上有明显区别明显区别q相关分析研究变量之间相关方向和相关程度;回归分
3、析则研究变量之间相互关系的具体形式。q相关分析不必不必确定自变量与因变量,其所涉及的变量可以都是随机变量;而回归分析则必须必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。q在应用这两项方法对客观现象进行研究时,一定要始终注意把定性分析和定量分析定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。三、相关分析的基本方法之一绘制散点图 Graphs scatterplot q在SPSS中提供了四种散点图,分别是:简单散点图(Simple)、重叠散点图(Overlay)、矩阵散点图(Matrix)和三维散点图(3-D)qData08-01、08-03四、相关分析的基本方法之二
4、计算相关系数 analyze correlate bivariate 二元变量相关分析主对话框二元变量相关分析主对话框 返回optionsoptions输出选择项对话框输出选择项对话框 返回1.Pearson简单相关系数简单相关系数q用来度量正态分布的定距变量定距变量间的线性相关关系。2.Spearman相关系数相关系数q是非参测度,即根据数据的秩秩而不是根据实际值计算的,即,先对原始变量的数据排秩,根据各秩使用Spearman相关系数公式进行计算。适用于有序数有序数据或不满足正态分布假设的定距变量据或不满足正态分布假设的定距变量。3.Kendalls tua-b等级相关系数等级相关系数q也是
5、非参测度,即对两个有序变量或两个秩变量有序变量或两个秩变量间的关系程度的测度。有关公式:有关公式:niniiiniiixyyyxxyyxxr11221)()()(Pearson积矩相关积矩相关 Spearman相关系数相关系数 22)()()(SSRRSSRRiiiiRS式中式中Ri是第是第i个个x值的秩,值的秩,Si是第是第i个个y值的秩。值的秩。分别是分别是Ri和和Si的平均值。的平均值。返回有关公式:有关公式:Kendalls tau-b:)()sgn()sgn(2010TTTTyyxxjijiji0 if 1 0 if 0 0 if 1)sgn(zzzz2/)1(2/)1(2)/2-(
6、T 210iiiiuuTttTnn;其中其中 ti(或(或ui)是)是x(或(或y)的第)的第i 组结点组结点x(或(或y)值的数目,)值的数目,n为观测量数。为观测量数。返回有关公式:关于相关系数统计意义的检验有关公式:关于相关系数统计意义的检验 212rrnt式中式中r是相关系数,是相关系数,n是样本观测量数,是样本观测量数,n2是自由度。是自由度。当当tt0.05(n-2)时,时,pt0.05(n-k-2)时,时,p0.05拒绝原假拒绝原假设设 零假设:总体中两个变量间的偏相关系数为零假设:总体中两个变量间的偏相关系数为0偏相关分析的主对话框偏相关分析的主对话框analyze analy
7、ze correlate correlate partialpartial 返回偏相关的选择项对话框偏相关的选择项对话框返回零阶相关矩阵,即pearsom相关矩阵偏相关应用实例输出偏相关应用实例输出data08-03 四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度这四个气候因素哪个因素有关。各变量的描述统计量各变量的描述统计量生长量与各变量间生长量与各变量间PearsonPearson相关分析结果相关分析结果D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s9.4592
8、7.177871298.891734.662621280.25003.360871285.216797.488341215.98337.4991912生长量(cm)月平均日照时数月平均湿度月降雨量(mm)月平均气温(c)MeanStd.DeviationNC Co or rr re el la at ti io on ns s1.983*.709*.704*.374.000.010.011.2321212121212Pearson CorrelationSig.(2-tailed)NVariables生长量(cm)生长量(cm)月平均气温(c)月降雨量(mm)月平均日照时数月平均湿度Corre
展开阅读全文