第八章输入数据分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第八章输入数据分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 输入 数据 分析 课件
- 资源描述:
-
1、1一、输入数据的收集一、输入数据的收集二、分布的识别二、分布的识别三、参数估计三、参数估计四、拟合度检验四、拟合度检验五、相关性分析五、相关性分析2?模型的输入数据哪里来?模型的输入数据哪里来? 输入数据分析输入数据分析3生产仿真结果的准确性生产仿真结果的准确性生产模型的准确建立仿真数据的准确性仿真数据的准确性输入数据是仿真模型的动力输入数据是仿真模型的动力GIGO(garbage in garbage out)4系统名称系统名称典型的输入数据典型的输入数据排队系统排队系统 顾客到达的间隔时间顾客到达的间隔时间 顾客被服务时间的分布顾客被服务时间的分布自动化物流自动化物流系统系统 货物到达间隔
2、时间货物到达间隔时间 装载时间装载时间 卸载时间卸载时间生产系统生产系统 作业到达的间隔时间作业到达的间隔时间 作业类型的概率作业类型的概率 每种作业每道工序服务时间的分布每种作业每道工序服务时间的分布可靠性系统可靠性系统 生产无故障作业时间生产无故障作业时间 系统的仿真依靠这些原型系统的运行数据,缺乏这系统的仿真依靠这些原型系统的运行数据,缺乏这些数据的实验和实验值的提取,仿真也就毫无意义。些数据的实验和实验值的提取,仿真也就毫无意义。5收集原始数据收集原始数据 基本统计分布基本统计分布的辨识的辨识 参参 数数 估估 计计 拟合度检验拟合度检验 可信否?可信否?否是是输入数据分析的基础,需要
3、分析的经验,是输入数据分析的基础,需要分析的经验,对收集的方法、数据需要做预先的设计和估对收集的方法、数据需要做预先的设计和估算。因此这是一个关键的、细致的工作。算。因此这是一个关键的、细致的工作。通过统计的数学手段(计数统计、频率分析、通过统计的数学手段(计数统计、频率分析、直方图制作等),得出统计分布的假设函数直方图制作等),得出统计分布的假设函数(如:正态分布、负指数分布、(如:正态分布、负指数分布、Erlang分布分布等)等)根据统计特征,计算确定系统的假设分布参根据统计特征,计算确定系统的假设分布参数。数。运用统计分布的检验方法,对假设的分布函运用统计分布的检验方法,对假设的分布函数
4、进行可信度检验。通常采用的是数进行可信度检验。通常采用的是 2检验。检验。正确输入数据正确输入数据 6 做好仿真计划,详细规划仿真所需要收集的数据做好仿真计划,详细规划仿真所需要收集的数据在收集数据过程中要注意分析数据在收集数据过程中要注意分析数据数据的均匀组合数据的均匀组合收集的数据要满足独立性的要求收集的数据要满足独立性的要求数据自相关性的检验数据自相关性的检验 根据问题的特征,进行仿真的前期研究。分析影根据问题的特征,进行仿真的前期研究。分析影响系统的关键因素。从相关事物的观察入手,尽响系统的关键因素。从相关事物的观察入手,尽量收集相关的数据。为此可以事先设计好调研表量收集相关的数据。为
5、此可以事先设计好调研表格,并注意不断完善和修改调研方式,使收集的格,并注意不断完善和修改调研方式,使收集的数据更符合仿真对象的数据需要。数据更符合仿真对象的数据需要。数据的收集与仿真的试运行是密切相关的,应当是边收集数数据的收集与仿真的试运行是密切相关的,应当是边收集数据、边进行仿真的试运行。然而系统仿真是一项专业性很强据、边进行仿真的试运行。然而系统仿真是一项专业性很强的工作,要正确认识的工作,要正确认识“仿真仿真”的含义,抓住仿真研究的关键,的含义,抓住仿真研究的关键,避免求全、求精。确信所收集的数据足以确定仿真中的输入避免求全、求精。确信所收集的数据足以确定仿真中的输入分量,而对仿真无用
6、或影响不显著的数据就没有必要去多加分量,而对仿真无用或影响不显著的数据就没有必要去多加收集。收集。针对仿真所收集的各个数据需要进行相关性检验。为针对仿真所收集的各个数据需要进行相关性检验。为了确定在两个变量之间是否存在相关。要建立两个变了确定在两个变量之间是否存在相关。要建立两个变量的散布图。通过统计方法确定相关的显著性。量的散布图。通过统计方法确定相关的显著性。尽量把均匀数据组合在一组里。校核在相继的时间周期尽量把均匀数据组合在一组里。校核在相继的时间周期里以及在相继日子内的一时间周期里的数据的均匀性。里以及在相继日子内的一时间周期里的数据的均匀性。当校核均匀性时,初步的检验是看一下分布的均
7、值是相当校核均匀性时,初步的检验是看一下分布的均值是相同。同。考察一个似乎是独立的观察序列数据存在自相关的可能性。考察一个似乎是独立的观察序列数据存在自相关的可能性。自相关可能存在于相继的时间周期或相继的顾客中。例如,自相关可能存在于相继的时间周期或相继的顾客中。例如,第第i个顾客的服务时间与个顾客的服务时间与(i+n)个顾客的服务时间相关。个顾客的服务时间相关。 数据收集过程中的注意事项数据收集过程中的注意事项71 1直方图的构造方法如下:直方图的构造方法如下:取取值值区区间间划划分分水水平平 区区坐坐 间间标标 标标轴轴 注注的的计计 区区算算 间间确确 内内定定 的的每每 发发一一 生生
8、 数数垂垂直直 标标坐坐 注注标标 频频轴轴 数数上上绘绘 上上制制 的的各各 发发个个 生生区区 频频间间 数数绘绘制制直直方方图图81 1F分组区间的组数依赖于观察次数以及数据的分散或散分组区间的组数依赖于观察次数以及数据的分散或散布的程度。布的程度。F一般分组区间组数近似等于样本量的平方根。即:一般分组区间组数近似等于样本量的平方根。即: Nm 如果区间太宽(如果区间太宽(m太小),则直方图太粗或呈短粗状,这样,它的太小),则直方图太粗或呈短粗状,这样,它的形状不能良好地显示出来。形状不能良好地显示出来。如果区间太窄,则直方图显得凹凸不平不好平滑如果区间太窄,则直方图显得凹凸不平不好平滑
9、 合适的区间选择(合适的区间选择(m值)是直方图制作,分布函数分析的基础。值)是直方图制作,分布函数分析的基础。 0 05 51010151520202525012345678频率13579 11 13 15 17 19 21 23 259024681012频率1357911 13 15 17 19 21 23 25x1011121 1 设某一个随机过程设某一个随机过程X,其,其n个抽样样本为个抽样样本为x1,x2,xn,该样本的均值为,该样本的均值为 该样本的方差为该样本的方差为 如果离散数据已按频数分组,则如果离散数据已按频数分组,则niixnX1121221211)(11XnxnXXnS
10、niiniikiiixfnX11212211XnxfnSkiiik是是X中不相同数中不相同数值的个数即分组数,值的个数即分组数,fi是是X中数值中数值Xj的观的观察频数察频数 132 2XX1bmax1xnnb2,X22S分分 布布参参 数数建议使用的估计量建议使用的估计量泊松泊松指数指数在(在(0,b)上)上的均匀分布的均匀分布正态正态,仿真中常用的一些分布参数建议值仿真中常用的一些分布参数建议值 14?理论分布和实际分布的差异程度?理论分布和实际分布的差异程度? 拟合度检验拟合度检验150 02 24 46 68 8101012121 12 23 34 45 56 67 78 89 910
11、10 1111 1212 1313 1414 1515 1616 1717 1818 1919 2020 2121 2222 2323 2424 2525k=6iiiEEO220 Ei 是在该分组区间的期望频数。每一分组区间的期是在该分组区间的期望频数。每一分组区间的期望频数是望频数是 Ei = n pi, 这里这里pi是理论值,是对应第是理论值,是对应第i个分组区间的假设概率。个分组区间的假设概率。 2拟合度检验拟合度检验式中,式中,Oi是在第是在第i个个分组区间的观察频数。分组区间的观察频数。 Oi = ni /n 16可以证明:可以证明: 02近似服从具有自由度近似服从具有自由度 f =
12、 k- -s- -1的的 2分布。分布。这里这里 s 表示由采样统计量所估计的假设分布的参数个数。表示由采样统计量所估计的假设分布的参数个数。假设检验:假设检验:H0:随机变量:随机变量X服从参数是由参数估计给出的分布假设服从参数是由参数估计给出的分布假设。H1: 随机变量随机变量X不确认不确认若若 2太大则拒绝太大则拒绝H0,若拟合是好的,则期望值,若拟合是好的,则期望值 2很小。很小。拟拟合合程程度度的的判判定定首先划分区间,定义首先划分区间,定义k值值计算各组的观察频数计算各组的观察频数计算计算 0查阅查阅 2表,得到表,得到如果如果 ,则拒绝,则拒绝H0的值2, f拟拟合合度度检检验验
13、步步骤骤2,20f17指定拟合度的检验指定拟合度的检验 我们可以根据拟合度检验的要求,设定一个拟合度的我们可以根据拟合度检验的要求,设定一个拟合度的显著性指数显著性指数 ,根据设定的,根据设定的显著性指数显著性指数 以及以及 2分布的分布的自由度数自由度数f = k- -s- -1,可以查,可以查 2表得到表得到 ,f2 。 如果 则检验未通过,H0不成立。 如果 则检验通过, H0成立。2,20f2,20f在应用这个检验时,如果期望的频数太小,将对检验的有效性有在应用这个检验时,如果期望的频数太小,将对检验的有效性有所影响。一般情况下区间的个数所影响。一般情况下区间的个数k宜在宜在3040以
展开阅读全文