书签 分享 收藏 举报 版权申诉 / 66
上传文档赚钱

类型统计培训教材22-抽样及样本容量课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4839588
  • 上传时间:2023-01-16
  • 格式:PPT
  • 页数:66
  • 大小:1.45MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《统计培训教材22-抽样及样本容量课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    统计 培训教材 22 抽样 样本 容量 课件
    资源描述:

    1、抽样及样本容量抽样及样本容量(Sampling&Sample Size)专业专业.什么是抽样及为何要进行抽样?什么是抽样及为何要进行抽样?抽样是抽样是 收集收集所有所有数据的一部分。数据的一部分。使用该部分数据得出结论(进行推论)。使用该部分数据得出结论(进行推论)。为什么要进行抽样?因为查看为什么要进行抽样?因为查看所有所有数据可能数据可能 成本太高。成本太高。费时太长。费时太长。造成破坏(例如、品尝测试)。造成破坏(例如、品尝测试)。一般可从比较少量的数据得出可靠的结论。一般可从比较少量的数据得出可靠的结论。专业专业.总体总体 情况:在操作上您可以定义现存的总体的边界、以便可以认出情况:在

    2、操作上您可以定义现存的总体的边界、以便可以认出 总体的每个个体、在理论上还可以进行编号。总体的每个个体、在理论上还可以进行编号。抽样目的:抽样目的:描述该总体的特征。描述该总体的特征。示例:抽样调查(示例:抽样调查(8 月月 31 日以前毕业的)大学校友、以确定日以前毕业的)大学校友、以确定 在今后两年中他们至少将一个小孩送进大学的百分比。在今后两年中他们至少将一个小孩送进大学的百分比。总体和过程总体和过程样本使用样本对总体进行推论:例如。平均值=X、比例=p专业专业.过程过程 情况:过程是动态的且不断变化的;过程中的个体并不是全可以鉴定的、情况:过程是动态的且不断变化的;过程中的个体并不是全

    3、可以鉴定的、因为某些个体尚不存在(如明天制造的那些个体)。因为某些个体尚不存在(如明天制造的那些个体)。目的:了解过程、以便采取行动改进或预测过程未来的行为。目的:了解过程、以便采取行动改进或预测过程未来的行为。示例:我们估计下月发票中有示例:我们估计下月发票中有 5%至至 20%有错误(除非更改该过程)。有错误(除非更改该过程)。总体和过程(续)总体和过程(续)使用样本对过程未来的行为进行推论昨天保存时间顺序!今天明天?20%5%10%15%抽样数据的时间曲线图抽样数据的时间曲线图?以时间顺序排列的过程输出以时间顺序排列的过程输出专业专业.抽样和改进项目抽样和改进项目v 确定过程周期和缺陷比

    4、率的基准性能;确定过程周期和缺陷比率的基准性能;(例如:(例如:在控制图上绘出样本数据在控制图上绘出样本数据)v 估计过程能力;估计过程能力;(例如:(例如:计算一件样本中的缺陷计算一件样本中的缺陷)v 确定造成性能低下或数据变动的因素确定造成性能低下或数据变动的因素(X);(利用样本数据绘制图表、进行假设测试或回归分析利用样本数据绘制图表、进行假设测试或回归分析)v 验证建议的改进工作;验证建议的改进工作;(比较从过程中抽取的新数据与从该过程抽取的旧数据比较从过程中抽取的新数据与从该过程抽取的旧数据)v 监视过程性能、必要时采取补救措施、并预测未来的性能;监视过程性能、必要时采取补救措施、并

    5、预测未来的性能;(在控制图上绘出新过程的样本数据在控制图上绘出新过程的样本数据)改进项目一般是对过程情况进行抽样:改进项目一般是对过程情况进行抽样:专业专业.为什么要区别总体抽样和过程抽样?为什么要区别总体抽样和过程抽样?样本容量公式是为定义明确的静态(而且常常是理论上的)样本容量公式是为定义明确的静态(而且常常是理论上的)总体情况设计的。总体情况设计的。但是大多数抽样应用是针对动态的、尚未知的过程情况。但是大多数抽样应用是针对动态的、尚未知的过程情况。将样本容量公式应用于过程抽样情况可能得出错误的结论、将样本容量公式应用于过程抽样情况可能得出错误的结论、除非满足一定的条件。除非满足一定的条件

    6、。要使推论有效、样本必须真实地代表总体或过程。要使推论有效、样本必须真实地代表总体或过程。总体所需的抽样策略不同于过程所需的抽样策略、总体所需的抽样策略不同于过程所需的抽样策略、以确保样本具有代表性(在下一节中讨论)。以确保样本具有代表性(在下一节中讨论)。专业专业.从稳定的过程中抽样从稳定的过程中抽样如果如果过程是稳定的、样本容量公式可应用于过程情况。过程是稳定的、样本容量公式可应用于过程情况。可获得具有特定精度的可靠估计值。可获得具有特定精度的可靠估计值。当进行比较时、如果存在的差异具有一定功效、便可找出它们。当进行比较时、如果存在的差异具有一定功效、便可找出它们。(稳定的、可预测的过程)

    7、4045505560651357911131517192123252729313335373941专业专业.从不稳定的过程中抽样从不稳定的过程中抽样然而许多过程是不稳定的。然而许多过程是不稳定的。无论如何总要收集数据、并绘制控制图或时间曲线图。无论如何总要收集数据、并绘制控制图或时间曲线图。识别特殊原因并清除之。识别特殊原因并清除之。使用样本容量公式求出的值是您应认为最小的数字;使用样本容量公式求出的值是您应认为最小的数字;可能的话,需要收集更多的数据。可能的话,需要收集更多的数据。存在特殊原因时,需要更大的样本容量,因为长期变动大于短期变异。存在特殊原因时,需要更大的样本容量,因为长期变动大

    8、于短期变异。使用公式时,您必须估计使用公式时,您必须估计s(或或 p););您必须判断特殊原因如何您必须判断特殊原因如何 影响该估计值,并根据您认为过程将会是什么情况来调整它影响该估计值,并根据您认为过程将会是什么情况来调整它。专业专业.从不稳定的过程中抽样(续)从不稳定的过程中抽样(续)当进行组之间的比较时:当进行组之间的比较时:尽量在相同时间内获取每组的样本。尽量在相同时间内获取每组的样本。当作结论或报告结论时、会存在这样一个风险、即这些结论可能当作结论或报告结论时、会存在这样一个风险、即这些结论可能 不适用于将来。不适用于将来。如果过程是不稳定的,可能的话,将一段如果过程是不稳定的,可能

    9、的话,将一段很长的时间里得到的数据的时间里得到的数据 绘制于一张控制图上,并圈出或特别标示您的样本所代表的数据点绘制于一张控制图上,并圈出或特别标示您的样本所代表的数据点 或时间区间。或时间区间。允许您和他人可直接从曲线观察过程的行为。允许您和他人可直接从曲线观察过程的行为。帮助您判断这些结论在未来的可靠性。帮助您判断这些结论在未来的可靠性。专业专业.从过程中抽样从过程中抽样对于过程情况,我们希望确保能够理解过程的行为。因此我们:对于过程情况,我们希望确保能够理解过程的行为。因此我们:在一段时间内进行系统或整群(非随机)抽样。在一段时间内进行系统或整群(非随机)抽样。即使随机抽样能适用于稳定过

    10、程,我们仍采用系统或整群抽样,并保持时间顺序即使随机抽样能适用于稳定过程,我们仍采用系统或整群抽样,并保持时间顺序 以便能更好地表示过程行为。以便能更好地表示过程行为。尽量从足够长的时间段中进行抽样,以便真实地表示过程中的变化源。尽量从足够长的时间段中进行抽样,以便真实地表示过程中的变化源。运用您自己的判断和有关变化源的过程知识来确定多长时间进行一次抽样运用您自己的判断和有关变化源的过程知识来确定多长时间进行一次抽样(每隔(每隔 10 个个体、每隔个个体、每隔 7 个个体、每天、每月等)。个个体、每天、每月等)。一般情况下、更加频繁地收集小样本、可确保随着时间的过去能真实地表示过程行为。一般情

    11、况下、更加频繁地收集小样本、可确保随着时间的过去能真实地表示过程行为。绘制控制图或时间曲线图,以确定该过程是稳定的还是不稳定的(寻找非正常值、偏移、绘制控制图或时间曲线图,以确定该过程是稳定的还是不稳定的(寻找非正常值、偏移、趋势或其它模式)。趋势或其它模式)。专业专业.抽样方法抽样方法专业专业.代表性样本代表性样本要使结论有效,样本必须具有代表性。要使结论有效,样本必须具有代表性。数据应真实地表示总体或过程数据应真实地表示总体或过程 收集的数据与未收集的数据之间不应存在有系统性的差异。收集的数据与未收集的数据之间不应存在有系统性的差异。专业专业.每个单元具有相同被选中的机会每个单元具有相同被

    12、选中的机会从每个组随机抽样一个成比例的数字从每个组随机抽样一个成比例的数字随机随机 抽样抽样分层分层随机随机抽样抽样样本样本总体总体样本样本总体总体AABBBBCDDDAAAABB BBBBBCCD D DD D DB概率抽样概率抽样专业专业.每隔每隔 n 个抽样(如每隔三个抽样)个抽样(如每隔三个抽样)每经过时间每经过时间 t 抽样抽样 n 个单元(例如,个单元(例如,每小时抽样三个单元)每小时抽样三个单元);然后计算每然后计算每个小组的平均值个小组的平均值(比例)(比例)系统系统 抽样抽样整群整群 抽样抽样样本总体或过程保持时间顺序样本过程9:009:3010:3010:00保持时间顺序专

    13、业专业.统计调查的误差(抽样误差):是指调查所得结果与总体真实数值之间的差异。可分 1、登记性误差:指在调查和汇总过程中,由于观察、测量、登记、计算等 方面的差错或被调查者提供虚假资料而造成的误差。(不是抽样调查独有的)尽量避免 2、代表性误差:指用样本指标推断总体指标时,由于样本结构与总体结构 不一致、样本不能完全代表总体而产生的误差。它又分 -2-1、系统误差:指由于非随机因素引起的样本代表性不足而产生的误差,表现为样本估计量的值系统性偏高或偏低,故也称偏差,尽量避免 如抽样框与目标总体不一致、有意多选较好或较差的单位等;-2-2、随机误差:又称偶然性误差,指遵循随机抽样原则,由于随机因素

    14、 (偶然性因素)引起的代表性误差。不可避免,但需加以计算与控制 抽样估计中所谓的抽样误差,就是指这种随机误差,即由于抽样的随机性而产生的样本估计量与总体参数之间的代表性误差。抽样误差抽样误差专业专业.抽样误差的抽样误差的3个概念个概念 1 1、实际抽样误差:、实际抽样误差:-实际上总体参数实际上总体参数是未知数,不可计算是未知数,不可计算 2 2、抽样平均误差:、抽样平均误差:3 3、抽样极限误差:是指在一定的概率下抽样误差的可能范围,、抽样极限误差:是指在一定的概率下抽样误差的可能范围,也称为允许误差。用表示抽样极限误差,即在一定概率下,也称为允许误差。用表示抽样极限误差,即在一定概率下,抽

    15、样误差率抽样误差率=(抽样极限误差(抽样极限误差/估计量)估计量)*100%100%抽样估计精度抽样估计精度=100%-=100%-抽样误差率抽样误差率可能样本个数2如如|xxbar-X|xbar专业专业.抽样总结抽样总结本单元包括:本单元包括:抽样是查看所有数据的一种有效率和效果的方法。抽样是查看所有数据的一种有效率和效果的方法。总体抽样与过程抽样有不同的目的和方法。总体抽样与过程抽样有不同的目的和方法。代表性是抽样最重要的一方面。代表性是抽样最重要的一方面。正确抽样使您对结论有信心。正确抽样使您对结论有信心。总体抽样的样本容量公式可适用于稳定过程。总体抽样的样本容量公式可适用于稳定过程。专

    16、业专业.样本容量样本容量(Sample Size)专业专业.样本容量介绍样本容量介绍人们常问的第一个问题是人们常问的第一个问题是“我需要多少个样本?我需要多少个样本?”该问题的答案由下列四个因素确定:该问题的答案由下列四个因素确定:1.数据类型数据类型 离散数据和连续数据离散数据和连续数据2.您想做什么您想做什么 描述整组的某个特征(平均值或比例)描述整组的某个特征(平均值或比例)在特定的精度内(在特定的精度内(_ 单位)单位)比较组的特征(找出组平均值或比例之间的差异)比较组的特征(找出组平均值或比例之间的差异)以什么功效:希望检测到特定差异的概率以什么功效:希望检测到特定差异的概率3.您估

    17、计的标准偏差(或比例)为多大您估计的标准偏差(或比例)为多大4.您希望的置信度为多高(通常为您希望的置信度为多高(通常为 95%)专业专业.当样本容量太小当样本容量太小 不能检验出差异不能检验出差异n=1n=5 过程过程A过程过程A过程过程 B过程过程 BAxBxfromaway2thanlessisxAxBxfromaway3thanmoreisx专业专业.当样本容量太大当样本容量太大对平均值的漂移过于敏感对平均值的漂移过于敏感 资源浪费资源浪费专业专业.第一步第一步:明确研究过程中的响应变量明确研究过程中的响应变量第二步第二步:选择合适的统计检验选择合适的统计检验第三步第三步:决定可接受的

    18、风险决定可接受的风险 和和 第四步第四步:定出漂移敏感度定出漂移敏感度 第五步第五步:建立或估计当前过程中的参数建立或估计当前过程中的参数 第六步第六步:决定合适的样本容量决定合适的样本容量专业专业.是是 H0 成立成立,但结果却否定它的风险但结果却否定它的风险.1-是是 H0 的置信系数的置信系数.观察值 1专业专业.是是H0不成立不成立,但结果却肯定它的风险但结果却肯定它的风险.(1-)称为检验的称为检验的功效功效,它表示它表示H0 不成立不成立,而结果也否定它的概率而结果也否定它的概率,即当即当H0不成立不成立时时,作出正确结论的概率作出正确结论的概率.观 察 值 1 2漂移 专业专业.

    19、专业专业.H0:无差异无差异 H1:有明显差异有明显差异零假设零假设成立不成立决策决策接受 H0拒绝 H0正确正确1 正确正确1 专业专业.实验之前需要预先指定反映明显差异的量实验之前需要预先指定反映明显差异的量 .与标准差与标准差 之比之比 /称为漂移敏感度称为漂移敏感度(drift sensitivity).专业专业.单样本检验单样本检验(1-Sample Tests)Stat Power and Sample Size 1-Sample ZStat Power and Sample Size 1-Sample t双样本检验双样本检验(2-Sample Tests)Stat Power a

    20、nd Sample Size 2-Sample t专业专业.样本容量公式取决于您的目的样本容量公式取决于您的目的抽样目的抽样目的公式公式*Minitab 命令命令估计平均值估计平均值(例如、确定基准周期)(其中 d=精度:_ 单位)估计比例估计比例(例如、确定缺陷基准百分比)(其中 d=精度:_ 单位)2d2sn p1pd2n2专业专业.精度精度(d)精度是允许某个特征的估计值波动的范围。精度是允许某个特征的估计值波动的范围。估计上下不超过两天的周期。估计上下不超过两天的周期。估计上下不超过估计上下不超过 3%的缺陷百分比。的缺陷百分比。使用符号使用符号 d 表示精度。表示精度。传统的统计学称

    21、它为传统的统计学称它为“delta”、因此以因此以d 表示表示。精度等于置信区间精度等于置信区间(CI)的一半。的一半。周期(单位为天)为周期(单位为天)为 95%时时 CI=(48、52)意味着我们有意味着我们有 95%的的确信平均周期在确信平均周期在 48 天至天至 52 天之间。天之间。CI 的宽度的宽度=4 天。天。精度精度=d=2 天天(=估计值上下不超过估计值上下不超过 2 天)。天)。专业专业.精度精度(d)(续)续)决定您需要多大的精度。决定您需要多大的精度。精度与样本容量的平方根成反比。精度与样本容量的平方根成反比。n1专业专业.精度和样本容量精度和样本容量 要提高精度、必须

    22、增加样本容量(但会增加成本)。要提高精度、必须增加样本容量(但会增加成本)。对于需要多大的精度没有明确的答案;对于需要多大的精度没有明确的答案;该答案取决于使用该估计值对业务产生多大的影响。该答案取决于使用该估计值对业务产生多大的影响。每种情况都是独特的;不要效仿别人的决定。每种情况都是独特的;不要效仿别人的决定。专业专业.估计平均值所需的样本容量估计平均值所需的样本容量95%的置信度*意味着因子为 2 标准偏差的估计您希望的精度2d2sn2222/xznNzznx222/2222/不重复抽样不重复抽样重复抽样重复抽样专业专业.目的:练习使用样本容量公式估计平均值。目的:练习使用样本容量公式估

    23、计平均值。时间:时间:3 分钟。分钟。要求:要求:使用样本容量公式计算平均值,使用样本容量公式计算平均值,以便回答下列问题。以便回答下列问题。1.假设您想估计假设您想估计 呼入电话的平均通话时间呼入电话的平均通话时间 1 分钟。您需要多少样本?分钟。您需要多少样本?(历史数据显示典型的标准偏差历史数据显示典型的标准偏差=3 分钟。)分钟。)2.您需要对多少次呼入抽样、以获得您需要对多少次呼入抽样、以获得 1/8 分钟的精度?分钟的精度?练习练习:估计平均值所需的样本容量:估计平均值所需的样本容量2d2sn专业专业.练习:答案练习:答案问题 1.问题 2.3042848132 n22)(3661

    24、(2)(3)n22专业专业.如何估计标准偏差如何估计标准偏差困难的选择:困难的选择:要估计样本容量,您需要知道标准偏差。要估计样本容量,您需要知道标准偏差。您需对数据的变化量有一定了解,因为数据可变性加大,您需对数据的变化量有一定了解,因为数据可变性加大,需要的样本容量也要相应增加。需要的样本容量也要相应增加。但是,如果您还没有进行抽样,如何知道偏差呢?但是,如果您还没有进行抽样,如何知道偏差呢?专业专业.如何估计标准偏差(续)如何估计标准偏差(续)估计标准偏差的选择估计标准偏差的选择 查找现存的数据并计算查找现存的数据并计算 s。使用类似过程的控制图(针对个体的)。使用类似过程的控制图(针对

    25、个体的)。采集一个小的样本并计算采集一个小的样本并计算 s。根据您对过程的认识和记得的类似数据猜一猜根据您对过程的认识和记得的类似数据猜一猜(大多数人不擅长这样做)。大多数人不擅长这样做)。3AverageUCL s or 6LCLUCL s专业专业.估计比例所需的样本容量估计比例所需的样本容量95%的置信度意味着因子为 2猜 p 的值(样本大小随 P 变动较大、从 P=0.1 到 0.5,变化甚剧)您希望的精度 p1pd2n2专业专业.使用精度调整样本容量使用精度调整样本容量您可使用确定样本容量的公式,来确定是否需要花更多的资金收集更多的您可使用确定样本容量的公式,来确定是否需要花更多的资金

    26、收集更多的样本来得到更高的精度。在收集数据之前这样做可以帮助您决定多少样本样本来得到更高的精度。在收集数据之前这样做可以帮助您决定多少样本可以符合您的项目和预算。可以符合您的项目和预算。1.确定您可以提供多少个样本确定您可以提供多少个样本(n)。2.然后问:然后问:该样本提供多高的精度?该样本提供多高的精度?即、精度的平均值在即、精度的平均值在 d 单位之内单位之内 还是精度的比例在还是精度的比例在 d%之内之内np)(p)(12 dn2s d专业专业.使用精度调整样本容量(续)使用精度调整样本容量(续)3.该精度足够精确吗?该精度足够精确吗?4.如果不够精确:如果不够精确:为各种样本容量绘制

    27、一个精度和成本表,以确定在样本上每为各种样本容量绘制一个精度和成本表,以确定在样本上每花一美元在精度上提高了多少。花一美元在精度上提高了多少。然后选择一个样本容量,再根据所提高的精度或您需要的精然后选择一个样本容量,再根据所提高的精度或您需要的精度来证明这是正确的选择。度来证明这是正确的选择。专业专业.从有限的总体中进行抽样从有限的总体中进行抽样样本容量公式假设样本容量样本容量公式假设样本容量(n)小于总体小于总体(N)。如果如果 .05 您抽取的样本占总体的您抽取的样本占总体的 5%以上以上 您可以使用您可以使用“有限总体有限总体”公式调整样本容量:公式调整样本容量:Nn 1n nfinit

    28、eNn专业专业.使用样本容量公式使用样本容量公式使用样本容量公式:使用样本容量公式:在置信度为在置信度为 95%的情况下,根据给定的期望精度以及的情况下,根据给定的期望精度以及 S 或或 P 的的估计值,估计值,确定估计整组的某个特征(平均值或比例)所需的样本容量。确定估计整组的某个特征(平均值或比例)所需的样本容量。在收集数据在收集数据之前之前,确定各种样本容量其估计值的精度。确定各种样本容量其估计值的精度。确定确定估计值的精度估计值的精度与与增加样本容量的成本增加样本容量的成本之间的得失。之间的得失。在收集数据在收集数据之后之后,确定估计值的精度。确定估计值的精度。专业专业.状态:样本容量

    29、命令和公式状态:样本容量命令和公式抽样目的抽样目的公式公式*/Minitab 命令命令估计平均值估计平均值(例如、确定基准周期)(其中 d=精度:_ 单位)估计比例估计比例(例如、确定缺陷基准百分比)(其中 d=精度:_ 单位)比较两组平均值、找出差异比较两组平均值、找出差异(2 个样本的 t 测试)统计 功效和样本容量 2 个样本的 t比较两个以上的组的平均值、比较两个以上的组的平均值、找出差异找出差异(ANOVA)统计 功效和样本容量 单向 ANOVA比较两个(或更多)组的比比较两个(或更多)组的比例、找出差异例、找出差异(卡方测试)统计 功效和样本容量 2 个比例2d2sn p1pd2n

    30、2专业专业.样本容量大经验法则样本容量大经验法则统计值统计值 或图表或图表 建议应采用的最建议应采用的最小样本容量小样本容量(n)平均值比例频率分布图(直方图)Pareto 排列图散布图控制图505024242d2sn p1pd2n2专业专业.5 5个变量个变量、和和 N N之间的关系可写出下面是公式:之间的关系可写出下面是公式:注意如果我们知道了注意如果我们知道了5 5个变量中的任意个变量中的任意4 4个变量,就可以通过上式个变量,就可以通过上式计算出第计算出第5 5个变量个变量 利用利用Minitab,Minitab,我们现在将说明如何计算样本容量和检验功效:我们现在将说明如何计算样本容量

    31、和检验功效:v样本容量样本容量=N Nv检验功效检验功效=1-=1-)(2222/ZZn计算样本容量计算样本容量专业专业.u一种新型的焊接机已经研制出来,出于对经济价值的考虑,新型一种新型的焊接机已经研制出来,出于对经济价值的考虑,新型焊接机的焊接机的合格率合格率必必须要须要比现有类型的焊接机大比现有类型的焊接机大5 5个百分点,现有个百分点,现有设备的设备的合格率合格率约为约为80%80%u为了比较这两种设备,要使用日常的数据,现有设备的历史日合为了比较这两种设备,要使用日常的数据,现有设备的历史日合格率的标准差为格率的标准差为3%3%,要求新的焊接机有相同的日合格率散布。,要求新的焊接机有

    32、相同的日合格率散布。u我们可接受的我们可接受的风险是风险是0.010.01(指两台设备有差异而实际上并没有指两台设备有差异而实际上并没有差异的机会)差异的机会)u我们可接受的我们可接受的风险是风险是0.200.20(说两台设备合格率相同而实际上并说两台设备合格率相同而实际上并不同的机会不同的机会)例题例题1 1:1-1-样本样本 t-t-检验时检验时的的样本容量的计算样本容量的计算专业专业.零假设零假设(Ho):新设备的合格率新设备的合格率并不比并不比现有的设备现有的设备好好 备择假设备择假设(Ha):新设备的日合格率新设备的日合格率比比现有的设备现有的设备高高 焊接机焊接机:假设假设专业专业

    33、.v 在在这两个假设之间需要选择多大的样本容量呢?这两个假设之间需要选择多大的样本容量呢?v 从所给的信息,我们得到从所给的信息,我们得到 显著水平显著水平,=0.01 检验功效检验功效=1 =0.80.平均值间的差异平均值间的差异,=85 80=5.标准差标准差,=3备择假设备择假设(Ha)为新设备的日合格率比现有的设备高为新设备的日合格率比现有的设备高 焊接机焊接机:需要的样本容量需要的样本容量 专业专业.选择选择 Stat Power and Sample Size 1-Sample t.5.输入 alpha,2.输入检验功效,1 1.输入delta,4.选择备择假设 3.输入 sigm

    34、a,填选项1-3;然后点“Options”再填选项4 和 5;最后,在所有打开的窗口中点 OK 焊接机焊接机:利用利用Minitab专业专业.Minitab 告诉我们,至少要抽取7个样本,才能保证在我们的检验功效为0.80的情况下,把新焊接机是否比现有的设备高5个百分点准确检测出来(注:N=7时,实际的检验功效为 0.8512)焊接机焊接机:Minitab 输出输出Power and Sample Size 1-Sample t TestTesting mean=null(versus null)Calculating power for mean=null+differenceAlpha=0

    35、.01 Assumed standard deviation=3 Sample TargetDifference Size Power Actual Power 5 7 0.8 0.851212专业专业.F某工程师想通过实施一个全阶乘某工程师想通过实施一个全阶乘DOE(3DOE(3因子,因子,8 8运行运行),来研究恒,来研究恒温箱对温度、流体密度和液罐变化的动作灵敏度;温箱对温度、流体密度和液罐变化的动作灵敏度;F0.0010.001英寸的动作就影响功能表现。设计队想探测这样或更高幅英寸的动作就影响功能表现。设计队想探测这样或更高幅度的影响;度的影响;F必须考虑恒温箱动作中的工程散布,必须考

    36、虑恒温箱动作中的工程散布,SPCSPC数据显示标准偏差约为数据显示标准偏差约为0.0010.001英寸;英寸;F可以接受的可以接受的风险(说一个因子的两个水平不同,而实际上相同风险(说一个因子的两个水平不同,而实际上相同的风险)是的风险)是0.030.03;F由于时间的限制,只能作两次再现(共由于时间的限制,只能作两次再现(共1616次运行),次运行),有关该有关该DOEDOE计划的报告必须上报给工程主管。计划的报告必须上报给工程主管。例题例题2-检验功效计算:恒温箱检验功效计算:恒温箱 DOE706080D A Y&NI GH T专业专业.零假设零假设(Ho):实验因子对恒温箱动作实验因子对

    37、恒温箱动作没有影响没有影响 备择假设备择假设(Ha):实验因子对恒温箱动作实验因子对恒温箱动作有影响有影响 恒温箱恒温箱 DOE:假设假设专业专业.观察到观察到0.001英寸尺度影响(当此影响存在时)的概率是多少?英寸尺度影响(当此影响存在时)的概率是多少?(即此计划完的(即此计划完的DOE 的检验功效是多少?)的检验功效是多少?)从所给的信息,我们知道从所给的信息,我们知道 显著水平显著水平,=0.03再现数再现数=2.影响差异影响差异,=0.001 英寸英寸标准偏差标准偏差,=0.001 英寸英寸备择假设备择假设(Ha)是,因子对恒温箱的动作有影响是,因子对恒温箱的动作有影响 恒温箱恒温箱

    38、 DOE:检验功效检验功效 专业专业.选择选择 Stat Power and Sample Size 2 Level Factorial Design6.输入alpha,2.输入循环数 填写选项1-5。然后点“Options”并填选项6。最后,在所有打开的窗口中点 OK 1.输入因子数4.输入影响尺度,5.输入 sigma,3.输入再现数恒温箱恒温箱 DOE:利用利用 Minitab专业专业.Minitab 告诉我们,两次再现时的检验功效只有 0.3234,这意味着我们很可能不能看到0.001英寸尺度的影响,显然需要更多的再现数.恒温箱恒温箱 DOE:Minitab 输出输出Power and

    39、 Sample Size 2-Level Factorial DesignAlpha=0.03 Assumed standard deviation=0.001Factors:3 Base Design:3,8Blocks:noneCenter TotalPoints Effect Reps Runs Power 0 0.001 2 16 0.323375专业专业.i某公司正在考虑决定是否变更供应商;某公司正在考虑决定是否变更供应商;i供应商供应商X X是当前的供应商,其不良率约为是当前的供应商,其不良率约为10%10%;而;而供应商供应商Y Y是一个是一个新供应商,其许诺提供部品的不良率将小

    40、于新供应商,其许诺提供部品的不良率将小于10%10%;i顾客认为如果供应商顾客认为如果供应商Y Y比供应商比供应商X X的不良率小的不良率小1 1个百分点,则更换个百分点,则更换供应商就有经济利益;供应商就有经济利益;i用来决定是否值得采用供应商用来决定是否值得采用供应商Y Y的样本容量是多少?的样本容量是多少?i为了比较,分别计算获得检验功效为为了比较,分别计算获得检验功效为0.60.6、0.70.7、0.80.8和和0.90.9 所需所需要的样本容量;要的样本容量;i假设假设a=0.05 =0.05 例题例题3-样本容量计算样本容量计算:拒绝部品比例拒绝部品比例 专业专业.零假设零假设(H

    41、o):供应商之间部品的不供应商之间部品的不良率没有差异良率没有差异 备择假设备择假设(Ha):供应商供应商X的部品不的部品不良率要大于供应商良率要大于供应商Y的的拒绝部件的比例:假设拒绝部件的比例:假设 专业专业.在检验功效分别为在检验功效分别为0.6、0.7、0.8和和0.9时,能计算并比较两个观察时,能计算并比较两个观察 的不良率所需样本容量是多少?的不良率所需样本容量是多少?从所给的信息,我们知道从所给的信息,我们知道 显著水平显著水平,=0.05如果供应商如果供应商Y的部品不良率要比供应商的部品不良率要比供应商X低一个百分点,低一个百分点,顾客将选择供应商顾客将选择供应商Y 比例的差异

    42、比例的差异,d=0.01备择假设备择假设(Ha)是供应商是供应商X的不良率大于供应商的不良率大于供应商Y的不良率的不良率 拒绝部品比例拒绝部品比例:样本容量样本容量专业专业.选择选择 Stat Power and Sample Size 2 Proportions5.输入 alpha,4.指定供应商 X大于供应商 Y先填选项 1-3;然后点“Options”并填选项 4和5;最后,在所有打开的窗口中点 OK 2.输入检验功效3.输入供应商 Y 的比例 拒绝部品比例拒绝部品比例:利用利用 Minitab1.输入供应商 X 的不良率专业专业.Power and Sample Size Test f

    43、or Two ProportionsTesting proportion 1=proportion 2(versus)Calculating power for proportion 2=0.09Alpha=0.05 Sample TargetProportion 1 Size Power Actual Power 0.1 6196 0.6 0.600035 0.1 8091 0.7 0.700008 0.1 10630 0.8 0.800005 0.1 14724 0.9 0.900006需要很大的样本容量!为了提供90%的检验功效来探测百分之一的差异(如果存在),则需要每个供应商提供147

    44、240件部品!拒绝部品比例拒绝部品比例:Minitab 输出输出专业专业.每箱每箱64打的冰其凌打的冰其凌,允许的误差不能超过允许的误差不能超过3打打.机器包装时的标准差是机器包装时的标准差是1打打.对于检验功效分别为对于检验功效分别为0.7,0.8 和和 0.9 的情形的情形,为了得到每箱冰其凌为了得到每箱冰其凌的平均容量的置信度为的平均容量的置信度为99%的区间估计的区间估计,样本容量应取多大样本容量应取多大?专业专业.一个工程师计划比较一台新机器的有效性一个工程师计划比较一台新机器的有效性.该机器的感兴趣的响应变量为均值为该机器的感兴趣的响应变量为均值为5,标准差为标准差为1.如果新机器

    45、的平均响应高出现有机器至少如果新机器的平均响应高出现有机器至少3个单位个单位,则他会建议购买则他会建议购买.由于投资很大由于投资很大,他希望把投资失误的风险控制在他希望把投资失误的风险控制在0.5%以内以内.为使检验的功效为为使检验的功效为0.7,0.8 和和 0.9,样本容量需要多大样本容量需要多大?专业专业.一个管理人员想了解本部门的一个管理人员想了解本部门的 Six Sigma 意识水平究竟如何意识水平究竟如何.他他想知道他的员工中是否有超过想知道他的员工中是否有超过50%的人熟识的人熟识 Six Sigma 哲学哲学.如如果比例低于果比例低于45%,那么就要举办一个培训课程那么就要举办

    46、一个培训课程.对对 =0.05 和和 =0.15,样本容量需要多大样本容量需要多大?专业专业.管理层想评估关于管理层想评估关于 Six Sigma 的新的培训课程的效果的新的培训课程的效果.培训前估计培训前估计Six Sigma 的意识水平估计为的意识水平估计为40%.如果至少能提高如果至少能提高30%,则此次培训课程可被认为是成功的则此次培训课程可被认为是成功的.对对 =0.05 和和 =0.15,试决定所需的样本容量试决定所需的样本容量.专业专业.Casen1456常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数?将每一列的将每一列的“?”,画,画上向或下向的箭头上向或下向的箭头 例如例如,在第一种情况下,如果在第一种情况下,如果 和和 不变,如果你需要较小的不变,如果你需要较小的,你的样本容量是大些你的样本容量是大些(上向箭头上向箭头)还是小些还是小些(下向箭头)下向箭头)?用用 Minitab 来验证这些来验证这些数字规律数字规律 课堂综合练习课堂综合练习专业专业.Casen1456常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数专业专业.

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:统计培训教材22-抽样及样本容量课件.ppt
    链接地址:https://www.163wenku.com/p-4839588.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库