假设检验-知识管理与数据分析试验室课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《假设检验-知识管理与数据分析试验室课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验 知识 管理 数据 分析 试验室 课件
- 资源描述:
-
1、现代统计分析方法概述现代统计分析方法概述 2023-1-61知识管理与数据分析实验室知识管理与数据分析实验室主要内容2023-1-6知识管理与数据分析实验室知识管理与数据分析实验室2现代统计分析方法介绍常用统计分析方法举例 现代统计分析方法介绍 从高斯(C.F.Gauss)描述天文观测的误差而引进正态分布,并使用最小二乘法作为一种估计方法至今,现代统计的发展已有200多年的历史。统计学在分析数据、探索数据规律性、研究现实问题中已形成许多各具特点的思想方法。从研究问题的角度,可将现代统计分析方法分为四大类:分类分析方法、结构简化方法、相关分析方法、预测决策方法。统计分析方法应用的步骤及其流程 对
2、统计分析方法的应用应从实际问题出发,明确具体问题和目标,然后确定理论以及相应的指标,在收集和整理数据的基础上构造满足需求的模型并进行统计计算,在对模型进行检验的基础上,对模型加以推广应用。常用统计分析方法举例正态分布区间估计和假设检验 回归分析方差分析正态分布 正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。因其曲线呈钟形,因此人们又经常称之为钟形曲线。其数学定义如下:若随机变量X的密度函数为则称X服从正态分布,称X为正态变量,记作()XN。正态
3、分布()N的分布函数为22()21()2txF xedt22()21(),2xp xex 正态分布的历史 正态分布最早是棣莫佛在1734年发表的一篇关于二项分布文章中提出的。拉普拉斯在1812年发表的分析概率论(Theorie Analytique des Probabilites)中对棣莫佛的结论作了扩展。现在这一结论通常被称为棣莫佛拉普拉斯定理。拉普拉斯在误差分析试验中使用了正态分布。勒让德于1805年引入最小二乘法这一重要方法;而高斯则宣称他早在1794年就使用了该方法,并通过假设误差服从正态分布给出了严格的证明。正态分布的应用 正态分布是很多统计方法的理论基础,正态分布在现实中的应用也
4、是最为广泛的,包含自动控制、质量管理、医学管理、经济分析及评价、风险评估等多个方面。正态分布在自动控制、优化设计、包装或加工零件的精度等方面有着广泛的应用。正态分布的均值就是自动控制的设定值,方差就是自动控制的精度;方差越小,精度越高,系统的性能越好 质量控制方面,为了控制实验中的测量(或实验)误差,常以3作为上、下警戒值,以3作为上、下控制值。这样做可以保证正常情况下测量(或实验)误差服从正态分布 医学应用方面,某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,
5、可按正态分布规律处理 经济分析及风险评估方面,正态分布在投入产出、经济分析、风险收益、风险价值度量等诸多方面的应用越来越广泛,为经济分析、经济评价以及风险评估提供了多样的方法选择,使评估结果更加科学 区间估计和假设检验 参数的区间估计和假设检验是两种最重要的统计推断形式,掌握这两种方法对做出正确的统计推断至关重要 区间估计区间估计 1nxx,1()LLnxx,1()UUnxx,LU,LU设是总体的一个参数,是样本,所谓区间估计就是要找两个统计量和,使得,在得到样本观测值之后,就把估计在区间内 假设检验假设检验 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计
6、推断方法。其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断 区间估计置信区间:置信区间:1nxx,(01)1()LLnxx,1()UUnxx,()1LUP,LU1设是总体的一个参数,其参数空间为,是来自该总体的样本,若有两个统计量和若对任意的,有,则称随机区间为 的置信水平的置信区间 对给定的一个为置信水平置信水平1的频率解释:的频率解释:,LU在大量重复使用的置信区间时,每次得到的样本观测值是不同的,从而每次得到的区间估计值也是不一样的,对一次具体的观测值而言,可能在,LU内,也可能不在。平均而言,在这大量的区间估计观测值中,至少有 10
7、0(1)%包含假设检验 假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P0.01或P0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立 假设检验的一般步骤:假设检验的一般步骤:应注意的问题应注意的问题 1、做假设检验之前,应注意资料本身是否有可比性。2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。3、根据资料类型和特点选用正确的假设检验方法。4、根据专业及经验确定是选用单侧检验还是双侧检验。5、当检验结果为拒绝无效假设时,应注意
8、有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。7、报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。参数的区间估计与假设检验的关系 参数的区间估计与假设检验的关系参数的区间估计与参数的假设检验虽然提法不同,但解决问题的途径是相通的,统计推断的思想方法是一样的,都是基于样
9、本信息来推断总体的性质,即用部分来推断总体。它们都是选取一个统计量,然后使这个统计量落在某个已知区间上的概率很小由此得到的结果 1、参数估计解决的是多少(或范围)问题,假设检验则判断结论是否成立。前者解决的是定量问题,后者解决的是定性问题。2、两者的要求各不相同。区间估计确定在一定概率保证程度下给出未知参数的范围。而假设检验确定在一定的置信水平下,未知参数能否接受已给定的值。3、两者对问题的了解程度各不相同。进行区间估计之前不了解未知参数的有关信息,而假设检验对未知参数的信息有所了解,但做出某种判断无确切把握。因而在实际应用中,究竟选择哪种方法进行统计推断,需要根据实际问题的情况确定相应的处理
展开阅读全文