基础统计学-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《基础统计学-课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基础 统计学 课件
- 资源描述:
-
1、1 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only基础统计学基础统计学2 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only内容内容 数据的重要性数据的重要性 数据的种类与获得数据的种类与获得 概率基础概率基础 用图形描述数据用图形描述数据 回归分析回归分析 假设检验假设检验3 2004 2006 Kairos Management.Limited Rights for Areva T&D.Int
2、ernal use only数据对六西格玛很重要数据对六西格玛很重要使用统计学来解决真实的问题使用统计学来解决真实的问题真实的真实的解决方案解决方案统计学统计学解决方案解决方案统计学问题统计学问题真实的问题真实的问题 把问题转换为数字(Y)定义 Y 的规格(可接受范围)理解(xi)与流程输出(Y)的关系Y=f(x1,x2,x3.)影响流程表现的关键因子是什么?找到因子(xi)的水平和操作窗口,保证输出(Y)是在可接受范围内 控制输入(xi)避免输出/缺陷4 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use
3、 only内容内容 数据的重要性数据的重要性 数据的种类与获得数据的种类与获得 概率基础概率基础 用图形描述数据用图形描述数据 回归分析回归分析 假设检验假设检验5 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only数据的种类数据的种类 不间断的 总是可以以更小的单位来测量 经常与测量系统一起出现 不可以以更小的单位来测量 只能选择几个有限的数值连续型的连续型的离散型的离散型的举例 时间,重量,金额,长度举例 二元的:男/女,好/坏,Yes/no 分类的:周一-周日,地点(Paris,London
4、,Orlando,.)计数:一张发票上的错误数目,一个月内发生意外的次数6 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only连续连续离散离散数据的种类数据的种类7 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only数据的获得数据的获得总体和样本总体和样本 总体:总体:根据研究目的确定的一组研究事物(人,事物,活动)。样本:样本:从总体中随即抽取的部分观察单位 在六西格玛研究中,通常将真实问题Y以及可
5、能会影响Y的因素(xi)转化为数字,即是通过在总体中随机抽取样本得到。8 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only抽样方法抽样方法抽样法抽样法简单随机抽样法简单随机抽样法(Simple Random Sampling)分层抽样法分层抽样法(Stratified Sampling)系统抽样法系统抽样法(Systematic Sampling)整群抽样法整群抽样法(Cluster Sampling)9 2004 2006 Kairos Management.Limited Rights fo
6、r Areva T&D.Internal use only简单随机抽样简单随机抽样从总体中抽取样本时,构成总体的每个个体都具有相同的被抽出从总体中抽取样本时,构成总体的每个个体都具有相同的被抽出概率的抽样方法。概率的抽样方法。-.-.最基本的抽样方法最基本的抽样方法-.-.其他抽样法的理论基础其他抽样法的理论基础特特 征征10 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only分层抽样分层抽样把总体分成几个不重复的小集团,并用简单任意抽样法对各把总体分成几个不重复的小集团,并用简单任意抽样法对各小
7、集团进行抽样小集团进行抽样-.-.推定值精度高推定值精度高-.-.能缩小推定值的分散能缩小推定值的分散-.-.能进行层别推定能进行层别推定优点优点调查企业的销售额调查企业的销售额该企业该企业中小企业中小企业大企业大企业样本样本1 1样本样本2 2简单任意抽样简单任意抽样简单任意抽样简单任意抽样11 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only系统抽样系统抽样从总体中抽取样本时,按照一定的间隔抽取样本从总体中抽取样本时,按照一定的间隔抽取样本1 1,2 2,r r,r+kr+k,r+2kr+2
8、k,抽出抽出 抽出抽出 抽出抽出很容易的抽取样本很容易的抽取样本有时比简单任意抽样法精度高有时比简单任意抽样法精度高优点优点12 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only整群抽样整群抽样将群作为抽样单位,任意抽出若干个群,对被抽出的群内将群作为抽样单位,任意抽出若干个群,对被抽出的群内所有对象都进行调查所有对象都进行调查-.抽样作业很方便抽样作业很方便,能节减调查费用能节减调查费用;-.若在各群间是若在各群间是“同质同质”的,而群内是的,而群内是“异质异质”的,这时抽样的效果很好的,这时
9、抽样的效果很好。(在分层抽样时,层间应是在分层抽样时,层间应是“异质异质”的,层内应是的,层内应是“同质同质”的的.)优点优点全部调查全部调查全部调查全部调查初级群抽样初级群抽样 (One-stage Cluster Sampling)(One-stage Cluster Sampling)中级群抽样中级群抽样 (Two-stage Sampling)(Two-stage Sampling)多级群抽样多级群抽样 (Multi-stage Cluster Sampling)(Multi-stage Cluster Sampling)13 2004 2006 Kairos Management.L
10、imited Rights for Areva T&D.Internal use only内容内容 数据的重要性数据的重要性 数据的获得数据的获得 概率基础概率基础 用图形描述数据用图形描述数据 回归分析回归分析 假设检验假设检验14 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only概率基础概率基础 -确定性现象确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其:在一定条件下,一定会发生或一定不会发生的现象。其 表现结果为两种事件:肯定发生某种结果的叫表现结果为两种事件:肯定发生某种结
11、果的叫必然事件必然事件;肯定不发生某种结果的叫肯定不发生某种结果的叫不可能事件不可能事件。-随机现象随机现象:在同样条件下:在同样条件下可能可能会出现两种或多种结果,究竟会发生哪会出现两种或多种结果,究竟会发生哪种种 结果,事先不能确定。其表现结果称为结果,事先不能确定。其表现结果称为随机事件随机事件。随机事件的特征:随机事件的特征:随机性随机性;规律性规律性 每次发生的可能性的大小是确定的。每次发生的可能性的大小是确定的。-概率概率:随机事件发生的可能性大小,用大写的:随机事件发生的可能性大小,用大写的P P 表示;取值表示;取值00,11。15 2004 2006 Kairos Manag
12、ement.Limited Rights for Areva T&D.Internal use only概率基础概率基础小概率事件小概率事件必然事件必然事件 P P=1 =1 不可能事件不可能事件 P P=0 =0 随机事件随机事件 00P P11 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为小概率事件)称为小概率事件(习惯习惯),统计学上认为不大可能发生。,统计学上认为不大可能发生。16 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only常用概率分布常用概率
13、分布超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还)。超几何分布的概率模型:大小为N的总体中,N1中有X1个,N2中有X2个 取出的概率超几何分布的概率密度函数超几何分布的概率密度函数 17 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only二项分布二项分布贝鲁诺实验的条件-例)抛硬币 1)实验的结果一个事件成功(S),别一事件为失败(F)区分为相互排斥的两个事件 2)各个实验中成功出现的概率为 p=P(S),失败出现的概率为 q=P
14、(F)=1-p 因此成功与失败出现的概率和为 p+q=1.3)各个实验是相互独立的,一个实验结果对另外实验结果无任何影响.二项分布是反复进行贝鲁诺实验后显示的分布二项分布是反复进行贝鲁诺实验后显示的分布 二项分布的概率密度函数 P(X=x)=nCxpx(1-p)n-x nCx=18 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only二项分布的形态二项分布的形态19 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal u
15、se only超几何分布与二项分布的比较说明超几何分布与二项分布的比较说明如下图有三个白球如下图有三个白球,七个蓝球的箱子中取出七个蓝球的箱子中取出2 2个球时个球时,取出白球的概率分为非复元取取出白球的概率分为非复元取出和复元取出的情况分析出和复元取出的情况分析.非复元取出的情况非复元取出的情况:1 1次取出时取出白球的概率次取出时取出白球的概率=3/10=3/102 2次取出时取出白球的概率次取出时取出白球的概率=2/9=2/9即即,第第2 2次试验的概率受第次试验的概率受第1 1次试验结果的影响次试验结果的影响.超几何分布复元取出的情况复元取出的情况:1 1次取出时取出白球的概率次取出时
16、取出白球的概率=3/10=3/10 2 2次取出时取出白球的概率次取出时取出白球的概率=3/10=3/10即即,第第1 1次试验的结果并不影响第次试验的结果并不影响第2 2次试验的概率次试验的概率.二项分布二项分布20 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only泊松分布泊松分布 泊松分布定义泊松分布定义:用于定义单位时间或单位空间里特定事件的发生次数用于定义单位时间或单位空间里特定事件的发生次数 例:1)钢板,油漆等的表面有平均m个瑕疵,随机抽取一定单位调查瑕疵时,瑕疵出现x个的 概率遵守
17、泊松分布.2)单位时间内到银行的顾客的数,某一地域内一天交通事故数.泊松分布的特性泊松分布的特性 -.二项分布中 p5时,变成正态分布21 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only正态分布正态分布正态分布是最自然的分布正态分布是最自然的分布,可以取任何一定范围内的所有实数值的概率分布可以取任何一定范围内的所有实数值的概率分布,是连续概率分布中最具代表性的分是连续概率分布中最具代表性的分布布.22 2004 2006 Kairos Management.Limited Rights for
18、 Areva T&D.Internal use only内容内容 数据的重要性数据的重要性 数据的种类数据的种类 用图形描述数据用图形描述数据单组数据分析单组数据分析通常利用直方图以及正态分布检验进行描述分析通常利用直方图以及正态分布检验进行描述分析两组甚至多组数据分析(需要分析相互之间关系)两组甚至多组数据分析(需要分析相互之间关系)通常利用散点图、相关系数以及回归分析通常利用散点图、相关系数以及回归分析 回归分析回归分析 假设检验假设检验23 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only
19、想要解决客户等待时间问题,先将其通过抽样转换为数字想要解决客户等待时间问题,先将其通过抽样转换为数字单组数据分析单组数据分析客户等待时间客户等待时间4.5 3.9 1.4 5.6 3.3 6.0 4.0 4.6 6.7 7.9 5.0 3.6 5.6 3.5 6.8 5.6 6.0 5.4 6.6 6.6 0.0 5.0 3.7 3.6 5.8 4.3 3.0 5.4 5.3 8.5 4.5 4.1 2.5 3.6 4.2 4.2 3.0 4.3 7.0 5.6 3.6 3.9 5.3 4.5 5.7 3.2 4.1 3.9 4.9 7.2 6.8 3.7 3.7 4.9 5.9 3.9 4.
20、2 2.2 3.7 6.7 2.6 3.7 2.2 3.8 2.2 4.6 4.4 6.0 4.5 7.5 4.2 3.8 3.0 4.9 4.7 4.4 8.3 4.9 6.8 7.6 5.7 3.7 3.6 5.6 4.0 4.7 3.9 2.9 5.0 6.8 4.2 5.3 6.5 2.9 3.1 3.2 3.9 5.7 7.6 7.0 例如例如:你是你是 Pizza Hut 的一个门店的经理的一个门店的经理.你要求你的助理随机记录客户的等待时间你要求你的助理随机记录客户的等待时间,今天你今天你已经有了已经有了100个数据个数据.24 2004 2006 Kairos Manageme
21、nt.Limited Rights for Areva T&D.Internal use only单组数据的统计描述单组数据的统计描述 怎样对一组数据进行统计描述?进入minitab,上拦菜单统计统计基本统计量基本统计量描述性统计描述性统计最大值最大值3/43/4分位分位数数中位数中位数1/41/4分位分位数数最小值最小值标准差标准差标准误差标准误差平均值平均值样本数样本数25 2004 2006 Kairos Management.Limited Rights for Areva T&D.Internal use only最常用统计量最常用统计量 通常进行描述统计最常用的统计量为平均数(通常
展开阅读全文