seminar假设检验与方差分析课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《seminar假设检验与方差分析课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- seminar 假设检验 方差分析 课件
- 资源描述:
-
1、 在开讲之前,我们有必要了解统计学上的一些基在开讲之前,我们有必要了解统计学上的一些基础知识。础知识。总体,样本,统计量,试验,奇异点总体,样本,统计量,试验,奇异点误差:试验指标的试验数据与理论期望值之间的差异。误差:试验指标的试验数据与理论期望值之间的差异。随机误差的统计规律:随机误差的统计规律:对称性:绝对值相等的正负误差出现的机会相等。对称性:绝对值相等的正负误差出现的机会相等。有界性:一定的测度条件下,绝对值不会超过一定范围有界性:一定的测度条件下,绝对值不会超过一定范围。抵偿性:测量次数增加,通过平均可减小误差。抵偿性:测量次数增加,通过平均可减小误差。单峰性:绝对值小的误差出现的
2、机会多单峰性:绝对值小的误差出现的机会多(概率密度大概率密度大)。准备工作准备工作中心趋势统计量中心趋势统计量中心趋势中心趋势是指一组试验数据的中心位置中心趋势是把握是指一组试验数据的中心位置中心趋势是把握随机变量取值规律的重要方面,对具有对称分布的随机随机变量取值规律的重要方面,对具有对称分布的随机变量尤为重要。变量尤为重要。中心趋势统计量中心趋势统计量是刻画一组试验数据中是刻画一组试验数据中心位置的量,它携带了有关试验指标期望值的信息,是心位置的量,它携带了有关试验指标期望值的信息,是由试验数据进行总体均值统计推断的基本统计量。由试验数据进行总体均值统计推断的基本统计量。常见的中心趋势统计
3、量有:常见的中心趋势统计量有:算术平均数算术平均数、几何平均数、几何平均数、调和平均数、调和平均数、中位数中位数等。等。散布统计量散布统计量散布:指一组试验数据聚集状态。散布是把握随机变量散布:指一组试验数据聚集状态。散布是把握随机变量取值规律的重要方面,它反映随机变量的随机性强弱。取值规律的重要方面,它反映随机变量的随机性强弱。准备工作准备工作散布统计量散布统计量:刻画一组试验数据分散还是紧凑的量。它:刻画一组试验数据分散还是紧凑的量。它携带了试验数据中,有关试验指标所有可能取值的聚集携带了试验数据中,有关试验指标所有可能取值的聚集程度信息,是由试验数据进行变异分析的基本统计量。程度信息,是
4、由试验数据进行变异分析的基本统计量。常见的散布统计量有:样本方差、离均差平方和、标准常见的散布统计量有:样本方差、离均差平方和、标准差、极差、变异系数等。差、极差、变异系数等。准备工作准备工作统计模型基本假设检验统计模型基本假设检验任何统计模型都有一定的假设。应用统计模型分析数任何统计模型都有一定的假设。应用统计模型分析数据首先要对数据是否满足模型的基本假设进行验证。据首先要对数据是否满足模型的基本假设进行验证。在统计模型的假设中,在统计模型的假设中,正态性正态性和和方差齐性方差齐性是最基础的是最基础的。提出问题:提出问题:为什么要对试验数据进行正态性检验?为什么要对试验数据进行正态性检验?正
5、态分布正态分布法国数学家拉普拉斯和德国数学家高斯法国数学家拉普拉斯和德国数学家高斯等研究出来的理论分布,又称为高斯分布。等研究出来的理论分布,又称为高斯分布。实际生活中的许多随机变数都服从或近似服从正态分实际生活中的许多随机变数都服从或近似服从正态分布,如,在正常情况下,农作物株高、单位面积产量布,如,在正常情况下,农作物株高、单位面积产量、测量中的测量误差、商场中的日营业额等,它们的、测量中的测量误差、商场中的日营业额等,它们的共同特点就是数据大部分集中在平均数附近,并且在共同特点就是数据大部分集中在平均数附近,并且在统计模型基本假设检验统计模型基本假设检验平均数的两侧成对称分布。平均数的两
6、侧成对称分布。后来数学和统计学家们在正态分布基础上,提出了假后来数学和统计学家们在正态分布基础上,提出了假设检验和方差分析,因此,我们在对试验数据进行假设检验和方差分析,因此,我们在对试验数据进行假设检验和方差分析之前,需要验证数据的正态性。设检验和方差分析之前,需要验证数据的正态性。正态性检验一、图方法一、图方法Histogram of xxDensity-3-11230.00.10.20.30.4-4-2024-4-2024Normal Q-Q PlotTheoretical QuantilesSample Quantiles2. QQ plot1. 直方图直方图正态性检验代码如下:代码如
7、下:par(mfrow=c(1,2)x - rnorm(1000)hist(x,freq=F,col=yellow)curve(dnorm(x),add=T,col=red)qqnorm(x,xlim=c(-4,4),ylim=c(-4,4),col=blue)qqline(x,col=red)二、统计检验法二、统计检验法u KSKS检验(检验(Kolmogorov-Smirnov testingKolmogorov-Smirnov testing)用于检验一组用于检验一组数据是否来自于一个指定概率分布的总体,数据是否来自于一个指定概率分布的总体,适用于大样本容量的数据。适用于大样本容量的数据
8、。u SWSW检验(检验(Shapiro-Shapiro-WilkWilk testing testing)用于检验一组数据是否来用于检验一组数据是否来自于一个正态分布总体,适用于小样本容量的数据。自于一个正态分布总体,适用于小样本容量的数据。正态性检验#代码如下#par(mfrow=c(1,2)x shapiro.test(x) Shapiro-Wilk normality testdata: x W = 0.9941, p-value = 0.9434 ks.test(x,pnorm,5,2) One-sample Kolmogorov-Smirnov testdata: x D = 0.
9、0541, p-value = 0.932alternative hypothesis: two-sided 正态性检验原假设(H0)又称为无效假设或零假设;备则假设(H1)。KS检验,H0:样本抽自分布F(x);H1:样本不抽自分布F(x)。SW检验,H0:样本服从正态分布;H1:样本不服从正态分布。关于P-value:P-value表示对H0假设的支持程度,假如定义显著水平=0.05,那么if(p-value 0.05)接受H0;方差齐性检验概念:多个总体的方差相等称为这些总体方差齐性。常用的方差齐性检验方法常用的方差齐性检验方法两组及两组以上数据的方差齐性检验可以使用以下几个函数两组及两
10、组以上数据的方差齐性检验可以使用以下几个函数# group - as.factor(c(rep(1,length(x),rep(2,length(y) # 水平var.test(c(x,y),group)# 用于检验两个两个总体方差是否相等# var.test(x,y)bartlett.test(c(x,y)group)# 用于多个正态总体方差齐性检验fligner.test(c(x,y)group)leveneTest(c(x,y),group)# 用于多个总体方差齐性检验,不要求数据满足正态性,是一种稳健的检验方法方差齐性检验# R下运行以下代码下运行以下代码 # leveneTest()
11、位于car包,因此需要先安装car包 # install.packages(“car”) #x - rnorm(100,2,3)y - rnorm(100,3,2)group x y group var.test(c(x,y)group) F test to compare two variancesdata: c(x, y) by group F = 2.689, num df = 99, denom df = 99, p-value = 1.479e-06alternative hypothesis: true ratio of variances is not equal to 1 95
12、 percent confidence interval: 1.809283 3.996509 sample estimates:ratio of variances 2.689018 # var.test(x,y)方差齐性检验 leveneTest(c(x,y)group)Levenes Test for Homogeneity of Variance (center = median) Df F value Pr(F) group 1 18.399 2.8e-05 * 198 -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 # leveneT
13、est(c(x,y),group) bartlett.test(c(x,y)group) Bartlett test of homogeneity of variancesdata: c(x, y) by group Bartletts K-squared = 23.1727, df = 1, p-value = 1.481e-06 # bartlett.test(c(x,y),group)方差齐性检验 fligner.test(c(x,y)group) Fligner-Killeen test of homogeneity of variancesdata: c(x, y) by group
14、 Fligner-Killeen:med chi-squared = 15.7243, df = 1, p-value =7.328e-05# fligner.test(c(x,y),group) plot(c(x,y)group,col=c(red,yellow) ,par(bty=l)12-4-202468groupc(x, y)方差分析方差分析的基本思想:方差分析的基本思想:将所有试验指标值的总变异总变异按照其形成来源分解为各控制因素形成条件变差条件变差和无法控制因素或未加控制因素形成的随机误差随机误差,然后将各因素形成的条件变差与随机误差进行比较比较,评价由某种因素某种因素所引起的变异
15、是否具有统计学意义统计学意义。总变异总变异 = = 条件变异条件变异 + + 随机误差随机误差SSSST T = SS = SSA A + + SSSSe e方差分析的基本假定方差分析的基本假定1.可加性:即处理效应与环境效应是可加的可加性:即处理效应与环境效应是可加的2.正态性:试验误差应该是随机的、彼此独立的,正态性:试验误差应该是随机的、彼此独立的,均值为均值为0且服从正态分布且服从正态分布3.同质性:所有试验处理必须具有共同的误差方差同质性:所有试验处理必须具有共同的误差方差方差分析因素A试验指标值总和平均均方A1x x1111x x1212x x1j1jx x1r1rT T1 1A2
展开阅读全文