工业大数据分析指南课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《工业大数据分析指南课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工业 数据 分析 指南 课件
- 资源描述:
-
1、工业大数据分析指南工业大数据分析指南工业大数据分析指南序言如今,全球掀起了以制造业转型升级为首要任务的新一轮工业变革,工业大数据作为引领这场变革的主要驱动力,已经成为当今工业领域的热点之一。新一代信息技术与制造业的深度融合,将促进工业领域的服务转型和产品升级,重塑全球制造业的产业格局。为紧紧抓住这一重大历史机遇,抢占制造业新一轮竞争制高点,党中央高度重视并作出长期性、战略性部署。党的十九大报告指出,要“加快建设制造强国,加快发展先进制造业,推动互联网、大数据、人工智能和实体经济深度融合”。工业大数据是智能制造的核心,以“大数据+工业互联网”为基础,用云计算、大数据、物联网、人工智能等技术引领工
2、业生产方式的变革,拉动工业经济的创新发展。工业大数据分析技术作为工业大数据的核心技术之一,可使工业大数据产品具备海量数据的挖掘能力、多源数据的集成能力、多类型知识的建模能力、多业务场景的分析能力、多领域知识的发掘能力等,对驱动企业业务创新和转型升级具有重大的作用。可以从以下三个方面来理解。首先,资源优化是分析的目标。企业之间竞争的本质是资源配置效率的竞争,优化资源配置效率是企业技术创新应用的主要动力,也是工业大数据分析的核心目标。工业大数据分析是实现新一代信息技术与制造业融合的重要技术支撑,其目的是不断优化资源的配置效率,实现生产全过程的可视化、高端定制化生产、产品生产节能增效、供工业大数据分
3、析指南I 序言如今,全球掀起了以制造业转型升级为首工业大数据分析指南应链配置优化、企业智能化管理等,达到提升质量、降低成本、灵活生产、提高满意度等目的,促进制造业全要素生产率的提高。其次,数据建模是分析的关键。来源于产品生命周期的各个环节中的海量数据,为工业大数据分析提供了前提和基础,而海量的工业数据如果不经过清洗、加工和建模等处理是无法直接应用于实际的业务场景。工业大数据分析通过模型来描述对象,构建复杂工业过程与知识之间的映射,实现知识清晰化、准确化的表达。最后,知识转化是分析的核心。确定性和稳定性是工业应用的两个基本特点,这就决定了工业大数据分析技术就是感知信息和提炼知识,其核心在于如何把
4、海量数据转化为信息,信息转化为知识,知识转化为决策,以应对和解决制造过程的复杂性和不确定性等问题。工业大数据分析指南是在新形势下对工业大数据分析关键共性问题进行的辨识、抽象和提升,适应当前工业大数据的应用需求和技术变革,具有较为广泛的通用性和相对普遍的指导意义,适于工业领域内的企业、机构的研究和参考。希望通过与业界的分享,共同推动工业大数据开发利用和应用推广,为制造强国和网络强国建设添薪助力!谢少锋I I工业大数据分析指南工业大数据分析指南编写说明工业大数据是工业领域相关数据集的总称,是工业互联网的核心,是智能制造的关键。工业大数据分析技术作为工业大数据的核心技术之一,是工业智能化发展的重要基
5、础和关键支撑。为此,在工业互联网产业联盟的指导下,工业大数据特设组主持编写了这本工业大数据分析指南。本书旨在对通用的工业大数据分析方法和分析流程进行归纳总结,对其关键共性进行辨识、抽象和提升,而非针对某一特定行业、企业或产品进行阐述。本书更加关注于方法论而非某些具体的技术,因此具有更加广泛的通用性和相对普遍的指导意义。本书共分为 9 章,第 1 章首先论述了工业大数据分析的概念、特殊性以及常见的问题;第 2 章提出了工业大数据分析框架,简要介绍了 CRISP-DM 模型,并针对模型落地的难点和模型使用的指导思想展开讨论;从第 3 章到第 8 章,依次对业务理解、数据理解、数据准备、数据建模、模
6、型验证与评估、模型部署这 6 个 CRISP-DM 模型的基本步骤进行了详细的阐述,从需求分析到目标评估,从数据来源到数据分类,从数据预处理到建模过程,从模型验证到部署问题处理,对每一个步骤中的原理方法、分析过程、处理方式、问题排除等都一一进行了讲解和说明;最后,第 9 章对工业大数据分析的未来发展进行了展望。本书由工业大数据特设组组长单位清华大学牵头编写,在编写过程中得到了工信部领导的悉心指导和相关单位的有力支撑。特别感谢工业大数据分析指南I I I 编写说明工业大数据是工业领域相关数据工业大数据分析指南清华大学孙家广院士、工信部信软司谢少锋司长等给予的全面指导。同时,北京工业大数据创新中心
7、的李三华、田春华,清华大学的任艮全、徐哲、强逍等在本书的编写阶段也给予了无私的帮助,在此表示诚挚的谢意。工业大数据作为新兴概念,其数据分析的原则、手段、方法和流程还很模糊,对海量数据的挖掘、分析和处理等技术仍在不断的发展和进步,由于作者自身的能力和水平有限,本书不可避免的存在诸多的缺点和不足,期待各位读者能够积极发现问题,并予以批评指正。编写单位:清华大学编写组成员:王建民、郭朝晖、王晨I V工业大数据分析指南工业大数据分析指南目 录序言.I1.工业大数据分析概论.11.11.1.11.1.21.1.31.1.41.1.51.1.61.21.2.11.2.21.2.31.31.3.11.3.2
8、1.3.3工业大数据分析的概述.1工业大数据分析的概念.1工业大数据分析的相关技术.2工业大数据分析的基本过程.2工业大数据分析的类型.4工业大数据分析价值.5工业大数据分析支撑业务创新.6工业大数据分析的特殊性.8从工业数据分析到工业大数据分析.8工业大数据与商务大数据分析.10工业大数据建模的难点.11工业数据分析中的常见问题.12业务和数据理解不当导致的失误.12建模和验证过程的失误.12避免失误的方法.132.工业大数据分析框架.142.12.22.3CRISP-DM 模型.14CRISP-DM 模型的落地难点.15工业大数据分析的指导思想.163.业务理解.193.1认识工业对象.1
9、9I工业大数据分析指南1.工业大数据分析概论.3.1.13.1.23.1.33.1.43.23.2.13.2.23.2.33.2.43.33.3.13.3.23.3.33.4工业大数据分析指南工业系统的抽象化.19工业系统的功能描述.20系统功能到技术原理的理解.20系统功能与业务场景的关联.21理解数据分析的需求.21工业过程中的数据分析需求.21数据分析的价值需求.22具体业务场景的数据分析需求.23数据分析需求的梳理方法.23工业数据分析目标的评估.24工业知识的理解.24工业知识的合用性.24专业领域知识的融合.25制造的全生命周期.264.数据理解.274.14.1.14.1.24.
10、1.34.24.2.14.2.24.34.3.14.3.2数据来源.27业务与数据的关系.27离散行业的数据源.28流程行业的数据源.28数据的分类及相互关系.30工业数据的分类.30数据间的关联关系.31数据质量.32数据质量的定义.32数据质量的组成要素.33II3.1.1工业大数据分析指南4.数据理解.4.3.3工业大数据分析指南数据质量的影响因素.335.数据准备.355.15.25.35.45.4.15.4.25.4.35.4.4业务系统的数据准备.35工业企业的数据准备.36物联网的数据准备.38建模分析的数据准备.39数据预处理概述.39数据异常处理.40数据缺失处理.41数据归
11、约处理.416.数据建模.426.16.1.16.1.26.1.36.26.2.16.2.26.2.36.36.3.16.3.26.3.36.3.46.3.5模型的形式化描述.43基本描述.43模型的深入表述.43对建模思想的影响.45工业建模的基本过程.46建模的基本思路.46模型融合的方法.46模型的优化过程.47工业建模的特征工程.48数据初步筛选.48特征变换.48特征组合.49特征筛选.50特征的迭代.50III4.3.3工业大数据分析指南5.数据准备.6.46.4.16.4.26.4.36.4.46.4.56.4.66.4.7工业大数据分析指南工业数据分析的算法介绍.51传统的统计
12、分析类算法.51通用的机器学习类算法.52针对旋转设备的振动分析类算法.52针对时序数据的时间序列类算法.53针对非结构化数据的文本挖掘类算法.54统计质量控制类算法.54排程优化类算法.557.模型的验证与评估.557.17.1.17.1.27.1.37.27.2.17.2.27.2.37.37.3.17.3.27.3.37.3.47.4知识的质量.55知识的确定性与准确性.55知识的适用范围.56知识的质量与可靠性.56传统数据分析方法及其问题.56基于精度的验证方法.56精度验证方法的局限性.57解决验证问题的传统方法.57基于领域知识的模型验证与评估.58对适用范围的评估.58对精度的
13、评估.60场景的综合评估.61模型的迭代评估.61总结与展望.618.模型的部署.628.1模型部署前应考虑的问题.62IV6.4工业大数据分析指南7.模型的验证与评估.8.1.18.1.28.1.38.28.2.18.2.28.2.38.2.48.38.3.18.3.28.3.38.3.48.4工业大数据分析指南模型部署对工作方式的改变.62模型部署的标准化与流程化.63模型部署的自动化与智能化.63实施和运行中的问题.64数据质量问题.64运行环境问题.64精度劣化问题.65范围变化问题.65问题的解决方法.65数据质量问题.65运行环境问题.66精度劣化问题.66范围变化问题.66部署后
14、的持续优化.679.展望未来.67V8.1.1工业大数据分析指南9.展望未来.工业大数据分析指南课件1.工业大数据分析指南工业大数据分析概论1.1 工业大数据分析的概述1.1.1 工业大数据分析的概念工业大数据分析是利用统计学分析技术、机器学习技术、信号处理技术等技术手段,结合业务知识对工业过程中产生的数据进行处理、计算、分析并提取其中有价值的信息、规律的过程。大数据分析工作应本着需求牵引、技术驱动的原则开展。在实际操作过程中,要以明确用户需求为前提、以数据现状为基础、以业务价值为标尺、以分析技术为手段,针对特定的业务问题,制定个性化的数据分析解决方案。工业大数据分析的直接目的是获得业务活动所
15、需各种的知识,贯通大数据技术与大数据应用之间的桥梁,支撑企业生产、经营、研发、服务等各项活动的精细化,促进企业转型升级。工业大数据的分析要求用数理逻辑去严格的定义业务问题。由于工业生产过程中本身受到各种机理约束条件的限制,利用历史过程数据定义问题边界往往达不到工业的生产要求,需要采用数据驱动+模型驱动的双轮驱动方式,实现数据和机理的深度融合,能较大程度去解决实际的工业问题。1.工业大数据分析指南1.1 工业大数据分析的概述图工业大数据分析指南1.1.2 工业大数据分析的相关技术近年来,大数据的兴起有两种起因:传统业务的发展遭遇数据存储量大、采集速度频率快、结构复杂等瓶颈问题,需要采用新的技术来
16、解决,即“大数据平台技术”,如时序数据采集技术、海量数据存储技术等;另一种起因是随着数据存储量的增大和处理能力的增强,催生了新的应用和业务,即“大数据应用技术”,如智能制造、现代农业、智能交通等。下图是工业大数据系统参考框架,从底至上分别是由工业大数据平台技术到工业大数据的应用技术。图 1.2 工业大数据分析软件栈总体上看,“大数据平台技术”关注的主要偏重 IT 技术,而“大数据应用技术”关注的重点主要是业务和领域知识。而大数据分析技术则是深度融合这两类技术知识,并结合机器学习技术、产品分析技术等数据分析技术,去解决实际业务问题的技术统称。1.1.3 工业大数据分析的基本过程工业数据分析的基本
17、任务和直接目标是发现与完善知识,企业开2工业大数据分析指南图 1.2 工业大数据分析软工业大数据分析指南展数据分析的根本目标却是为了创造价值。这两个不同层次的问题,需要一个转化过程进行关联。为了提高分析工作的效率,需事先制定工作计划,如下图所示。业务 需求方案1途径1模型1算法1.图 1.3 工业数据分析任务的工作方案与探索路径数据分析起源于用户的业务需求,相同的业务需求会有多个可行方案,每一个方案又有若干可能的实现途径。例如,面对减少产品缺陷的业务需求,可以分成设备故障诊断和工艺优化等方案。而设备诊断又可进一步根据设备和机理的不同,分成更明确的途径,如针对特定设备特定故障的诊断。遇到复杂问题
18、,这些途径可能会被再次细分,直至明确为若干模型。首先了解到的输入输出关系,如特定参数与设备状态之间的关系,这些关联关系即为知识的雏形,然后需要寻找适当的算法,提取和固化这些知识。知识发现是个探索的过程,并不能保证每次探索都能成功,上述计划本质上是罗列了可能的方案。只要找到解决问题的办法,并非每一条方案或途径都需要进行探索。在不同的途径中,工作量和成功的概率、价值成本都是不一样的,一般尽量挑选成功概率大、工作量相对较小、价值大成本低的路径作为切入点,尽量减少探索成本。在项目推进或者探索的过程中,还会根据实际的进程,对预定的计划及顺序进行调整。3方案2途径2模型2.工业大数据分析指南方案1算法1.
19、方案2.工业大数据分析指南计划制定和执行过程,本质上体现了领域知识和数据分析知识的融合。其中,方案和途径的选择,要兼顾业务需求和数据条件。这就是第三到第五章讨论的问题,而算法、模型、验证等相关问题,则放在第六章和第七章讨论。1.1.4 工业大数据分析的类型根据业务目标的不同,数据分析可以分成四种类型:描述型分析:描述型分析用来回答“发生了什么”、体现的“是什么”知识。工业企业总的周报、月报、商务智能(BI)分析等,就是典型的描述型分析。描述型分析一般通过计算数据的各种统计特征,把各种数据以便于人们理解的可视化方式表达出来。诊断型分析:诊断型分析用来回答“为什么会发生这样的事情”。针对生产、销售
20、、管理、设备运行等过程中出现的问题和异常,找出导致问题的原因所在,诊断分析的关键是剔除非本质的随机关联和各种假象。预测型分析:预测型分析用来回到“将要发生什么?”。针对生产、经营中的各种问题,根据现在可见的因素,预测未来可能发生的结果。处方型(指导型)分析:处方型(指导型)分析用来回答“怎么办”的问题。针对已经和将要发生的问题,找出适当的行动方案,有效解决存在的问题或把工作做得更好。业务目标不同,所需要的条件、对数据分析的要求和难度就不一样。大体上说,四种问题的难度是递增的:描述性分析的目标只是便工业大数据分析指南4 计划制定和执行过程,本质上体现了领域知识工业大数据分析指南进一步与实施手段和
21、流程的创新相结合。同一个业务目标可以有不同的实现路径,还可以转化成不同的数学问题。比如,处方型分析可以用回归、聚类等多种办法来实现,每种方法所采用的变量也可以不同,故而得到的知识也不一样,这就要求要对实际的业务问题有着深刻的理解,并采用合适的数理逻辑关系去描述。1.1.5 工业大数据分析价值工业大数据分析的根本目标是创造价值。工业对象的规模和尺度不同,价值点也有所不同,数据分析工作者往往要学会帮助用户寻找价值。价值寻找遵循这样一个原则:一个体系的价值,决定于包含这个体系的更大体系。所以,确定工作的价值时,应该从更大的尺度上看问题。对象不同,隐藏价值的地方往往也不尽相同。下面是常见的价值点。1)
22、设备尺度的价值点船舶、飞机、汽车、风车、发动机、轧机等都是设备。设备投入使用之后,首先面对的就是如何使用,包括如何使用才能有更好的性能或更低的消耗、如何避免可能导致造成损失的使用;其次是如何保证正常使用,也就是如何更好更快更高效地解决设备维修、维护、故障预防等问题。除此之外,从设备类的生命周期看问题,分析下一代设备进行设计优化、更方便使用等问题。2)车间尺度的价值点按照精益生产的观点,车间里面常见的问题可以划分为七种浪费:工业大数据分析指南5 进一步与实施手段和流程的创新相结合。同一工业大数据分析指南归结到这七种浪费。一般来说,这七种浪费的可能性是人发现的,处理问题的思路是人类专家给出的。人们
23、可以用数据来确定他们是否存在、浪费有多少,并进一步确定最有效的改进方法。3)企业尺度的价值点除了生产过程,工业企业的业务还包括研发设计(创新)、采购销售、生产组织、售后服务等多方面的工作。相关工作的价值,多与跨越时空的协同、共享、优化有关。比如,把设计、生产、服务的信息集成起来;加强上下级之间的协同、减少管理上的黑洞;把历史数据记录下来,对工业和产品设计进行优化;把企业、车间计划和设备控制、反馈结合起来等等。随着企业进入智能制造时代,这一方面的价值将会越来越多。然而,问题越是复杂,落实阶段的困难越大,应在价值大小和价值落地直接取得平衡。4)跨越企业的价值点跨越企业的价值点包括供应链、企业生态、
24、区域经济、社会尺度的价值。这些价值往往涉及到企业之间的分工、协作、以及企业业务跨界重新定义等问题,是面向工业互联网的新增长点。1.1.6 工业大数据分析支撑业务创新一般来说,工业大数据分析服务于现有业务,但越来越多的企业开始把这一工作作为业务创新、转型升级的手段。两类工作的性质不同,前者重点在如何进行数据分析,后者重点是如何应用数据分析。支撑企业的转型升级、业务创新是工业大数据最重要的用途之一,但是从转型升级的尺度看问题,工业大数据分析只是一种技术支撑手工业大数据分析指南6 归结到这七种浪费。一般来说,这七种浪费的工业大数据分析指南反之,思维就会受到较大的局限,甚至南辕北辙。用大数据推动业务创
25、新时,需要确认几个问题:想做什么(业务目标)、为什么这么做(价值存在性)、打算怎么做(技术线路、业务路径)、需要知道什么(信息和知识,数据分析的目标)、怎么才能知道(数据分析过程)。由此观之,推动企业的业务创新和优化(做什么、怎么做)是个大目标,而具体的数据分析则只是一个子目标(怎么才能知道)。两类目标之间的尺度是不一样的。对于具体的问题,数据分析不仅要关注如何得到小目标,还要结合业务需求,将大目标分解成子目标,也就是确定“需要知道什么”。从数据分析师的过程来说,子目标的实现是战术问题,子目标的设定则是战略问题。它们都是数据分析团队需要面对的难点所在。如前所述,数据分析是个探索的过程。而数据分
展开阅读全文