大学精品课件:现代制造系统(v3)4-1建模分析(数据模型).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学精品课件:现代制造系统(v3)4-1建模分析(数据模型).ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 精品 课件 现代 制造 系统 v3 _1 建模 分析 数据模型
- 资源描述:
-
1、现代制造系统,第4章 制造系统的建模与分析(1) 东北大学秦皇岛分校 黄亮 n-xyz,引言,制造系统的研究可分为分析与综合两个阶段: 系统分析的目的是了解系统的运行原理,以便能够对新的系统设计方案的执行效果进行预测,是系统设计的基础。其主要工作为制造系统的建模与性能评价。,系统综合的目的就是根据系统分析掌握的原理,构造出新的更优秀的制造系统。其主要工作为制造系统的设计与控制。,使用制造系统模型具有重要意义: (1)有利于加速新系统的研究开发; (2)可降低实验成本; (3)有利于保证安全; (4)节省时间,提高效率; (5)简化操作,易于理解。 本章按照从制造数据、制造过程到制造企业的顺序,
2、由简单到复杂逐步介绍制造系统建模领域的常见模型,以及这些模型的性能分析方法。,很显然,这门课程涉及到的模型不是实物模型或比例模型,而都是由信息构造的虚拟模型。 这样,不管模型有多复杂,其根本上都是由数据组成的,这些数据的来源包括 (1)直接测量得到的; (2)间接计算得到的; (3)通过预测得到的。 本课程将在第4.1节介绍这些数据的建模方法。,第4章 制造系统的建模与分析 4.1 制造数据模型 4.1.1 直接测量数据 4.1.2 间接计算数据 4.1.3 预测数据 4.2 制造过程模型 4.3 制造企业模型,复习真值: 在某一时刻和某一状态下, 某量的客观值或实际值。 绝对意义上,真值一般
3、是未知的; 相对意义上,真值是可以获得的,例如: 公理,例如平面三角形三内角之和为180; 国家标准,国际标准; 高精度仪器所测之值; 多次实验值的平均值。,复习平均值: 有很多种,在制造系统建模领域,我们通常只使用算术平均值(arithmetic mean): 思考:为什么平均值就接近真值?,既然平均值只是近似地表达真值,那如何评价这种近似的准确程度呢? 相关概念:误差。 误差的计算方法有很多,制造系统建模领域最常用的是样本标准差(standard deviation)。,当真值本身也是不确定数据时,均值与标准差难以充分描述真值,这时常使用概率分布函数。 例如,正态分布的概率密度函数:,不确
4、定性数据的表达方式,(1)均值; (2)均值 + 标准差; (3)概率分布函数。 以上方式的表达效果越来越好, 但相应的计算也越复杂, 并且对样本数量的要求也越来越大。,直接测量数据有哪些?,直接测量数据指生产管理文档中直接记载的数据,涉及到制造系统建模的主要有 (1)活动持续时间,例如某道工序的加工时间、装配时间,某种原料的采购时间等。 (2)事件发生频率,例如订单或客户的到达频率,出现不合格品的频率,设备出现故障的频率等。 (3)资源消耗数量,例如铸造一个零件消耗的铸铁重量,设备工作一小时消耗的平均电量等。,什么样的概率分布函数适合描述制造系统中的不确定性数据? 首先是“实践出真知”, 记
5、录一定数量的实际生产数据, 然后转化成概率密度函数或累积分布函数, 得到的概率分布通常称为经验分布(empirical distribution)。 经验分布来源于实际数据,因此准确度较高,缺点是信息存储量较大,需要数据表记录。,(1)对活动持续时间的模拟,案例1:记录某种零件170次采购所需的时间,得到统计数据如下:,(1.1)经验分布(empirical distribution),将统计数据转换成经验分布, 得到案例1中零件采购时间的概率密度函数为,与上述经验分布的概率密度函数 对应的累积分布函数为,除了(1.1)经验分布,人们还常使用标准分布(standard distribution
6、)来描述不确定数据。 常用来描述活动持续时间的标准分布有: (1.2)均匀分布(uniform distribution); (1.3)三角形分布(triangular distribution); (1.4)正态分布(normal distribution); (1.5)贝塔分布(beta distribution); (1.6)指数分布(exponential distribution); (1.7)爱尔朗分布(Erlang distribution)。 使用标准分布的好处是信息存储量较小,并且其中有些能够支持分析类过程模型的快速计算,缺点是与实际分布的差异较大(相对于经验分布)。,(1.
7、2)均匀分布(uniform distribution),定义: 概率密度函数 累积分布函数 服从均匀分布的x落在区间a,b中长度相等的任一子区间内的可能性是相等的,所谓的均匀指的就是这种等可能性。在实际问题中,当我们无法区分在随机变量x 取不同值的可能性有何不同时,我们可以假定x 服从均匀分布。,分别使用区间5, 23和8,16来构造均匀分布, 称为均匀分布1和均匀分布2,用来模拟案例1中的零件采购时间,得到概率密度函数图为,与上述均匀分布的概率密度函数 对应的累积分布函数图为,均匀分布总结: 均匀分布的概率密度函数和累积分布函数从形状上看与经验分布的差异较大,因此用于实际生产活动时间的模拟
8、可能产生较大的误差,仅用于模拟持续时间较短的活动。 均匀分布的优点在于产生随机数方便(甚至可以用骰子模拟),很多软件开发工具提供的随机数函数都直接产生区间0, 1上的均匀分布,是产生其它复杂概率分布的基础。,(1.3)三角形分布(triangular distribution),定义: 概率密度函数 累积分布函数 a称之为下限,b称之为上限,c称之为众数。,令a = 7,b = 17,c = 11,使用三角形分布来模拟案例1中的零件采购时间,得到概率分布函数图为,与上述三角形分布的概率密度函数图 对应的累积分布函数图为,三角形分布总结: 三角形分布的概率密度函数和累积分布函数从形状上看与经验分
9、布的很接近,但在变化趋势上存在着一定的误差。 在仿真类过程模型中,三角形分布经常被用于模拟生产活动时间,但不如正态分布应用得多。 相对于正态分布,三角形分布的优点在于计算相对简单,并且可以描述概率密度函数出现“偏心”的情况。,(1.4)正态分布(normal distribution),正态分布又名高斯分布(Gaussian distribution),是数学、物理和工程领域应用得非常广泛的一种概率分布,其定义: 概率密度函数 累积分布函数 其中,参数为概率分布的均值,为概率分布的标准差。,卡尔弗里德里希高斯(C. F. Gauss)(1977-1855)德国数学家、物理学家、天文学家、大地测
10、量学家,近代数学奠基者之一。 高斯在历史上影响之大,可以和阿基米德、牛顿、欧拉并列,有“数学王子”之称。除了计算出标准正态分布之外,高斯还发现了最小二乘法,证明了数论中的二次互反律,提出了微分几何中的正投影理论等等,贡献十分之多。 为了纪念高斯,1989年至2001年流通的10元德国马克纸币上印有高斯的肖像。,案例1中170次采购时间的均值是11.49天,标准差是2.57,以此构造正态分布记作正态分布1;同时以均值11、标准差1.8构造正态分布记作正态分布2,分布对案例1中的零件采购时间进行模拟,得到概率密度函数图为,与上述正态分布的概率密度函数图 对应的累积分布函数图为,正态分布总结: 正态
11、分布的概率密度函数和累积分布函数从形状上看与经验分布的很接近,比三角形函数的误差还小,但不适合描述分布的“偏心”情况。 不一定是与样本数据的均值和标注差一致正态分布拟合的最好,实际中往往需要反复调整参数来追求更高的拟合效果,是个优化问题,常用统计软件提供相关的优化功能。 在仿真类过程模型中,正态分布经常被用于模拟生产活动时间,是应用得最多的一种标准分布。,(1.5)贝塔分布(beta distribution),贝塔分布也写作分布或beta分布。 定义: 概率密度函数 累积分布函数,贝塔函数(beta function)通常写成(, ),又称作第一类欧拉积分。其定义式为 不完全贝塔函数为贝塔函
12、数的扩展 由于贝塔分布可写成贝塔函数的形式,故因此而得名。,相关概念伽玛函数(gamma function)通常写成(),又称作第二类欧拉积分,可看做是定义在复数范围内的阶乘。其定义式为 与贝塔函数的关系 当函数的变量是正整数时,函数的值就是前一个整数的阶乘,或者说(n+1)=n!。,莱昂哈德欧拉(Leonhard Euler)(1707-1783),瑞士数学家和物理学家,近代数学先驱之一。,欧拉在微积分、图论、力学、光学和天文学领域都做出过重大发现。 他引进的许多数学术语和书写格式,例如函数的记法“f(x)“,一直沿用至今。 欧拉一生共写下了886本书籍和论文,彼得堡科学院为了整理他的著作,
13、足足忙碌了四十七年。他是科学史上最多产的数学家之一。,贝塔分布的 概率密度函数,贝塔分布总结: 由于贝塔分布可以产生“偏心”的概率密度函数,因此有时候能够比正态分布更准确地描述生产活动时间。 同正态分布类似,贝塔分布也主要用于仿真类过程模型。拟合程度高的贝塔分布也需要反复调节参数和,同样是优化问题。 但由于计算复杂,贝塔分布在实际应用中出现得比较少。,(1.6)指数分布(exponential distribution),定义: 概率密度函数 累积分布函数 指数分布也称作负指数分布,常用来描述连续两次事件之间的时间间隔,参数表示事件发生的平均频率,既是函数的均值,也是方差。,案例1中170次采
14、购时间的均值是11.49天, 以1/11.49为构造指数函数, 则概率密度函数图为,与上述指数分布的概率密度函数图 对应的累积分布函数图为,指数分布总结: 指数分布的概率密度函数和累积分布函数从形状上看与经验分布差异非常大,但由于其良好的计算特性,能够极大地简化多个指数分布函数之间的合并运算,因此仍广泛地应用于以排队网络为代表的分析类模型中。 指数分布仅在活动持续时间较短的情况下模拟误差较小,对于案例1这种误差较大的情况,实际应用时也常使用(常数+指数分布)的方式模拟,如下:,将案例1中的生产活动时间用(常数10 + 参数为3.5的指数分布)模拟, 得到概率密度函数图为,与上述(固定值 + 指
15、数分布概率密度)函数图 对应的累积分布函数图为,(1.7)爱尔朗分布(Erlang distribution),爱尔朗分布按阶次分类,k阶爱尔朗分布的概率密度函数为 一阶爱尔朗分布为指数分布,即指数分布为爱尔朗分布的特例;而30阶以上的爱尔朗分布近似于正态分布。,与指数分布类似,爱尔朗分布在排队理论中也有一定的应用: 案例1:k个服务台串行处理1件任务,各个服务台的服务时间相互独立,并且都服从相同参数的指数分布,则k个服务台的总服务时间服从k阶爱尔朗分布。 案例2:k个串行完成的任务在1个服务台处理,各个任务的服务时间相互独立,并且都服从相同参数的指数分布,则k个任务的总服务时间服从k阶爱尔朗
16、分布。,(2)对事件发生频率的模拟,除模拟活动时间之外,离散事件动态系统中另一个需要模拟的重要对象是事件发生的频率,例如订单的到达频率、不合格品出现的频率等。 除了(2.1)经验分布外,通常情况下,事件的发生与否可以看做是重复n次的伯努利试验,则事件的发生概率服从(2.2)二项分布; 当实验次数很大,并且事件的发生概率很低时,二项分布又近似等于(2.3)泊松分布。,(2.2)二项分布(binomial distribution),二项分布用于表达n次试验中正好得到k次成功的概率,因此常用于模拟每批产品中的不合格品数量(课件第3.1.3节)。 其概率密度函数为 累积分布函数为,(2.3)泊松分布
17、(Poisson distribution),在二项分布的伯努利试验中,如果试验次数n很大,二项分布的概率p很小,且乘积=np比较适中,则事件出现的次数的概率可以用泊松分布来逼近。事实上,二项分布可以看作泊松分布在离散时间上的对应物。 由于泊松分布比二项分布计算简单些,在制造系统建模的实际应用中经常代替二项分布。特别是对一段时间内某事件发生频率的模拟,泊松分布比二项分布也更符合实际情况,例如对订单到达频率、设备故障频率等事件的模拟。,泊松分布的概率密度函数为 能够证明,当某种事件在一段时间内的发生频率服从泊松分布时,这些事件的发生间隔时间服从指数分布。 上述性质使得泊松分布经常在排队网络模型中
18、用于模拟订单或顾客的到达频率。,西莫恩德尼泊松(Simeon Denis Poisson)(1781-1840),法国数学家、物理学家和力学家。,泊松最重要的贡献即为提出描述随机现象的一种常用分布泊松分布; 在固体力学领域,泊松以材料的横向变形系数泊松比而知名; 除此之外,泊松还解决了许多热传导、静电学、静磁学和引力学等方面的问题; 在光的波动说验证实验中出现于圆板阴影中央的亮斑也以他命名。,(3)对资源消耗量的模拟,相对于活动持续时间和事件发生频率,制造系统中资源的消耗相对稳定(例如一个零件总是固定需要一套毛坯),因此采用概率函数进行模拟的相关研究较少。 对于存在不确定性的资源消耗(例如原料
19、的采购价格存在浮动),常用的模拟手段即为均值,也有一些研究使用(3.1)经验分布、(3.2)均匀分布或(3.3)正态分布进行模拟。,直接测量数据的建模方法,(1)对于活动持续时间的模拟: 经验分布;均匀分布;三角形分布;正态分布;贝塔分布;指数分布;爱尔朗分布。 (2)对于事件发生概率的模拟: 经验分布;二项分布(常用于模拟不合格品数量);泊松分布(常用于模拟订单或客户的达到频率)。 (3)对于资源消耗量的模拟: 经验分布;均匀分布;正态分布。,直接测量数据模型的评价,除了经验分布直接依据样本数据产生外,各种标准分布都是对样本数据的一个近似模拟,即用一个连续的函数拟合一系列离散的点,函数曲线与
20、离散点的差异大小即为模型好坏的评价标准。 上述评价问题称为:拟合优度检验。 例如实验设计中提及的正态分布拟合质量的检验方法:卡方检验。,拟合优度检验:判断某标准分布符合一组样本数据。 常用方法(SPSS等常用统计软件提供): K-S检验(Kolmogorov-Smirnov test), 音译作科尔莫格洛夫-斯莫洛夫检验; A-D检验(Anderson-Darling test), 音译作安德森-达林检验。,实际数据的采集,实际生产中使用操作指示单(又称作业票)记录和管理生产数据。样单举例如下图:,从操作指示单中采集的最重要数据是实动工时,是制造系统建模的基础数据。采集时可根据操作指示单的下发
展开阅读全文