连续随机变量近似服从正态分布课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《连续随机变量近似服从正态分布课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 连续 随机变量 近似 服从 正态分布 课件
- 资源描述:
-
1、 名词:(本章一般考概念较少)总体、样本、随机抽样、抽样检验 统计基本内容理解:概率和随机变量 变异的类型 相关分析 随机抽样和抽样检验 记忆:过程能力评级 计算:过程能力指数 控制图的应用程序及计算 1、数据的类型:a计量数据:带有小数,变量为连续变量 b计数数据:不带小数,变量为离散变量 可分为计件数据和计点数据 长度、合格品数、重量、缺陷数、化学成分、气泡数哪些是计量数据,哪些是计数数据?2、总体和样本 总体:是指在某一次统计分析中研究对象的全体。个体、单位 总体容量N表示 如:研究一批产品的质量 样本:是从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体。样本单位 样本容量n表
2、示 如:从4567四个数中随机抽取两个数。3、概率和随机变量(1)概率:如从4567四个数中随机抽取两个数。重复抽样可能出现:不重复抽样可能出现:可能事件均值可能事件均值可能事件均值可能事件均值4,445,44.56,457,45.54,54.55,556,55.57,564,655,65.56,667,66.54,75.55,766,76.57,77 在一定条件下,不总是出现相同结果的现象称为随机现象 罗列出所有可能发生的基本结果为样本点 所有可能样本点的集合称为样本空间 某些样本点的集合称为随机事件。如:所有均值为5.5的样本点构成一个随机事件。一个随机事件A发生的可能性大小称为概率 用P
3、(A)表示。如均值为5.5的事件发生的概率为4/16=25%因此某零件随机抽取,重复检验了n个,其中k个合格,则合格品的概率是?也可以用fn(A)=k/n(2)随机变量 离散随机变量 特定数值有限个点或可列个点 如均值为5的事件概率,该事件均值是变量,5是变量值 连续随机变量 特定数值无限个,不可列 如电视机寿命不超过10000小时的概率 离散随机变量和连续随机变量是由随机变量所代表的特定数值决定的。3、随机变量的分布 概率分布是指随机变量在总体中(样本空间中)的取值与其发生概率二者关系的数据模型。如:电视机寿命不超过10000小时的概率均值44.555.566.57概率1/161/83/16
4、1/43/161/81/161/43/161/81/16 4 4.5 5 5.5 6 6.5 710000 离散随机变量一般分布:二项分布、泊松分布、超几何分布等。连续随机变量一般分布:均匀分布、正态分布、对数正态分布等 如果样本量足够大,则无论离散、连续随机变量近似服从正态分布。4、正态分布的特点:a正态分布概率密度函数曲线是对称的、单峰的钟形曲线。b任何一个正态分布仅由均值和标准偏差这两个参数完全确定;确定中心位置,称为位置参数,决定分布曲线的形状,称为形状参数;越小,曲线越陡,数据离散程度越小,越大,曲线越扁平,数据离散程度越大。c正态分布曲线下面的面积,是随机变量在相应区间取值的概率,
5、或者说总体中有多大比例的数值落在相应的区间范围内。1/43/161/81/16 4 4.5 5 5.5 6 6.5 7 5、常用统计参数 均值:中位数:大小排序,在最中间的数 如:2、5、7、8、8 中位数7 42、42、43、45、46、46 中位数(43+45)/2=44 标准差:总体:样本:极差R=最大值-最小值niixnx11NXNii12)(1)(12nxxsnii 例:一总体为2、5、7、8、8,计算均值、中位数、标准差和极差?变异是在过程运行中,任何与目标或规范要求不一致的变化,也称波动。如:包装100克1克 某一天后=104克为变异 1、变异的来源:变异来源于过程,过程中变异来
6、源有多种,一般为5M1E:即原材料 工具、机器、操作者、环境、测量 2、变异的类型:休哈特认为:a伴有“不可避免的随机变异”的稳定过程 b伴有“可确定原因引起的变异”的不稳定过程 戴明认为:变异分为一般原因和特殊原因变异(1)一般原因变异:一个过程中始终存在的、非人力可控的而成为过程的固有组成部分的那些变异因素 一般占变异的80-95%一般原因是由系统设计导致的,随机出现的 由一般原因支配过程为受控过程、系统为稳定系统(2)特殊原因变异:除一般原因之外的引起过程变异的那些因素 特殊原因产生于外部,不是随机出现的,可以用统计方法检测并纠正 3、管理者可能会犯的两个根本性错误:a针对所有的实际上是
7、由一般原因引起的瑕疵、抱怨、差错、故障、事故或短缺等质量问题,像特殊原因那样处理。b针对所有的实际上是由特殊原因引起的瑕疵、抱怨、差错、故障、事故或短缺等质量问题原因归因于一般原因。4、统计思想在组织管理中的运用领域:a组织层次:了解系统、找到关键过程、评估绩效、组织改进 b过程层次:使过程标准化、找到变异,分析原因。c单体或个人层次:用数据识别变异、识别指标和改进机会 统计技术和方法分为:描述性统计、统计推测和推测统计(预测)1、描述性统计 描述性统计:是有效的收集、组织和描述数据的统计方法。图示:频数分布图 直方图 指标:集中趋势:均值、中位数、比例 离散趋势:极值、标准差、偏差 2、统计
8、推断:统计推断是一个过程,它根据从总体中抽取的数据、获得关于总体未知特征的结论。包括:参数估计、假设检验和试验设计 a参数估计:即根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。有点估计和区间估计 点估计方法:矩估计法、最大似然估计法、最小二乘法、贝叶斯估计法 区间估计方法:抽样分布、区间估计与假设检验、大样本理论 b假设检验:真实情况为H0成立,而判断H0不成立,犯“以真为假”错误 真实情况为H0不成立,而判断H0成立,犯“以假为真”错误检验方法:最主要的是似然比法 U检验:如果总体服从正态分布、方差已知,检验均值 t检验:总体正态分布,方差未知,检验均值 F检验:两总体正态分布,
9、方差是否相等 检验原则:最大功效准则、无偏性准则、容许检验、同变检验、贝叶斯检验 最小化最大检验 c实验设计:遵循原则:随机化、局部控制、重复 方法:区组设计、析因设计、部分实施法 3、预测性统计 预测性统计:即基于过去的数据来预测未来的统计过程。方法:相关分析:相关系数r(线形),越大越相关 回归分析:一元回归、多元回归、多重回归 1、随机抽样 随机抽样:即从总体中随机抽取一定数目的个体单位作为样本进行观察,使每个个体单位都有一定的概率被选入样本,从而使根据样本所做出的结论对总体具有充分的代表性。随机抽样的方法:a简单随机抽样 b分层随机抽样 先分层,每层等比例抽样 c等距随机抽样 d整群随
10、机抽样 先分群,对群随机抽样 例:某工厂有3个车间,生产产品量甲车间50000件,乙车间30000件、丙车间20000件,现用分层方法抽取1000件判断合格品率,怎样抽?某工人10天分别生产产品40、60、50、45、55、50、60、40、50、50,现用整群抽样随机抽取150个左右的产品检验该工人产品合格品率?抽样误差:误差分为抽样误差和系统误差(非抽样误差)抽样误差一直存在,系统误差可以消除:系统误差来源:偏向、非可比数据、不加鉴别的趋势估计、因果关系、不恰当的抽样 2、抽样检验 抽样检验是指按照一定的方案,从一批产品中随机抽取样本进行检验,根据样本的检验结果判断该批产品是否合格,并由此
展开阅读全文