大数据技术和标准化课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据技术和标准化课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 标准化 课件
- 资源描述:
-
1、大数据技术和标准化大数据技术和标准化2内内 容容 大数据发展背景 标准化工作现状 下一步工作重点3一、大数据催生了信息化一、大数据催生了信息化3.03.0(智慧化阶段)(智慧化阶段)信息化1.0-1995以单机应用为特征的数字化阶段-2015以联网应用为特征的网络化阶段2015-以数据的深度挖掘与融合应用为特征的智慧化阶段经历基础性变革后的未来信息技术支撑的信息化信息化2.0信息化3.0?金税工程金税工程n数据规模更大,来源更丰富,类型更复杂,变化更快4一、一、大数据催生了信息化大数据催生了信息化3.03.0(智慧化阶段)(智慧化阶段)技术廉价化、互联网发展、信息化建设长期积累,形成了规模巨大
2、的数据资源,且仍将加速增长大数据应用的成功案例,激发了基于数据,萃取知识、指导实践的巨大需求大数据大数据现象出现现象出现数据应用需求激增以数据的深度挖掘与融合应用为特征的智慧化智慧化阶段信息化信息化3.03.05二、二、大数据的战略意义大数据的战略意义大数据正在改变大数据正在改变人类的思维方式人类的思维方式随机样本精确求解因果关系全体数据近似求解关联关系传统思维大数据思维6二、二、大数据的战略意义大数据的战略意义GDP改善民生:改善民生:优化资源配置优化资源配置,健康医疗、就业、社保、教育、公共交通健康医疗、就业、社保、教育、公共交通产业转型,创新业态:产业转型,创新业态:颠覆传统产业颠覆传统
3、产业,提高运行效率和决策能力提高运行效率和决策能力,催生智能制造、催生智能制造、互联网金融等新业态互联网金融等新业态大数据时代,信息技术不仅是行业发展的大数据时代,信息技术不仅是行业发展的“倍增倍增器器”、“催化器催化器”,甚至会成为行业的颠覆者,甚至会成为行业的颠覆者7二、二、大数据的战略意义大数据的战略意义美国棱镜计划:美国棱镜计划:电邮、即时消息、视频、照片、语音、文件传输、视频会议、社交网络等数据的收集与综合分析自主可控的大数据技术体系是自主可控的大数据技术体系是不可或缺的基础!不可或缺的基础!8三、三、大数据产业生态链(技术)大数据产业生态链(技术)大数据采集大数据采集大数据存储、大
4、数据存储、管理和处理管理和处理大数据呈现大数据呈现和应用和应用大数据分析大数据分析和挖掘和挖掘9三、三、大数据产业生态链(商业)大数据产业生态链(商业)10四、四、我国大数据产业发展现状我国大数据产业发展现状基础设施和分析方法方面:主要依赖国外技术和产品,核心技术方面仍是学习者和追随者应用方面:BAT在网络大数据具有优势:网站、微博、微信、搜索、交易数据等,互联网企业的技术优势难以顺畅地扩散到各行业 部门、地方和一些行业开始关注大数据资源建设 初级发展阶段,缺少典型性、共识性强的大数据应用;数据资源开放方面:我国数据资源主要来源于互联网,业务、政务数据共享开放程度低 急需标准化,保证有序发展、
5、开放共享11内内 容容 大数据发展背景 标准化工作现状 下一步工作重点12一、大数据工作组概况一、大数据工作组概况(一)组织架构(一)组织架构 组长:组长:梅梅 宏宏 上海交通大学上海交通大学 副校长(院士)副校长(院士)副组长:副组长:车品觉车品觉 阿里巴巴集团副总裁阿里巴巴集团副总裁 吴建明吴建明 华为华为ITIT技术开发部部长技术开发部部长 杜小勇杜小勇 中国人民大学信息学院院长中国人民大学信息学院院长 秘书长:秘书长:高高 林林 工业和信息化部信软司工业和信息化部信软司 副司长副司长 联络员:联络员:刘大山刘大山 国家标准化管理委员会工业二部国家标准化管理委员会工业二部 处长处长 孙文
6、龙孙文龙 工业和信息化部信软司工业和信息化部信软司 处长处长 侯建仁侯建仁 工业和信息化部电子信息司工业和信息化部电子信息司 处长处长进一步扩大工作组规模进一步扩大工作组规模 申请报名的成员单位170+家成员单位管理成员单位管理 统一邮箱: 微信公众平台建立联络关系建立联络关系 贵州省贵阳市政府、中关村大数据产业联盟建立大数据专家团队建立大数据专家团队一、工作组概况一、工作组概况13一、工作组概况一、工作组概况(二)组织管理(二)组织管理n 2014年年12月月2日,工作日,工作组成立大会组成立大会n 2015年年7月月14日,工作日,工作组第二次全会,正式成组第二次全会,正式成立立7个专题组
7、个专题组n 2015年年12月月17日,工作日,工作组第三次全会(组第三次全会(2015年年年终总结)年终总结)n 工作组开展了一系列调工作组开展了一系列调研活动,组织线下活动研活动,组织线下活动5次,召开专题组会议次,召开专题组会议18次次工作组总体专题组组长:电子四院 张群国际专题组组长:华为 杨莉莉技术专题组组长:北大 王亚沙联合组长:中兴 董振江产品和平台专题组组长:浪潮电子 张东联合组长:亚信 陈利仓安全专题组组长:阿里云 陈雪秀联合组长:信安标委 叶润国工业大数据专题组组长:数码大方 齐建军电子商务大数据专题组组长:京东 葛胜利联合组长:阿里 姜蕾秘书处二、标准体系框架二、标准体系
8、框架1516n 基础标准基础标准为整个标准体系提供包括总则、术语和参考模型、元数据等基础性标准。n 技技术标准术标准该类标准主要针对大数据相关技术进行规范。包括数据治理和数据质量两类标准。其中,数据治理标准主要针对数据的收集、预处理、分析、可视化、访问、能力成熟度评价模型等方面进行规范。数据质量标准主要针对数据质量提出具体的管理要求和相应的指标要求,确保数据在产生、存储、交换和使用等各个环节中的质量,为大数据应用打下良好的基础,包括质量评价、数据溯源、质量检测等标准。二、标准体系框架二、标准体系框架17n 产品和平台标准产品和平台标准该类标准主要针对大数据相关技术产品和应用平台进行规范。包括关
9、系型数据库产品、非结构化数据管理产品、智能工具、可视化工具、数据处理平台和测试规范六类标准。其中关系型数据库产品标准针对存储和处理大数据的关系型数据库管理系统,从访问接口、技术要求、测试要求等方面进行规范,为关系型数据库管理系统进行大数据的高端事务处理和海量数据分析提供支持;非结构化数据管理产品标准针对存储和处理大数据的非结构化数据管理系统,从参考架构、数据表示、访问接口、技术要求、测试要求等方面进行规范;智能工具用来帮助用户对大数据进行分析决策,包括ETL、OLAP、数据挖掘等工具,智能工具标准对智能工具的技术及功能进行规范;可视化工具是对大数据处理应用过程中所需用到的可视化展现工具的技术和
10、功能要求进行规范;大数据平台标准是针对大数据存储、处理、分析系统从技术架构、建设方案、平台接口等方面进行规范;测试规范针对大数据的产品和平台给出测试方法和要求。二、标准体系框架二、标准体系框架18n 大数据安全标准大数据安全标准数据安全作为数据标准的支撑体系,贯穿于数据整个生命周期的各个阶段。抛开传统的网络安全和系统安全,大数据时代下的数据安全标准主要包括通用要求、隐私保护两类标准。n 应用和服务标准应用和服务标准应用和服务类标准主要是针对大数据所能提供的应用和服务从技术、功能、开发、维护和管理等方面进行规范。主要包括开放数据集、数据服务平台和领域应用数据三类标准。其中开放数据集标准主要对向第
11、三方提供的开放数据包中的内容、格式等进行规范;数据服务平台标准是针对大数据服务平台所提出的功能性、维护性和管理性的标准;领域应用数据指的是各领域根据其领域特性产生的专用数据标准,包括工业、电子商务等领域。二、标准体系框架二、标准体系框架二、大数据参考模型二、大数据参考模型19二、大数据标准化白皮书二、大数据标准化白皮书V2.0V2.0局势局势(产业、(产业、技术等)技术等)基本概念和内涵 特征 重要作用生态链生态链 大数据产业链(商业)大数据产业链(技术)规划规划 技术发展规划 国内外政策、趋势大数据大数据标准化标准化 参考架构 标准体系成功案成功案例例 十一大领域的应用案例20二、研究报告二
12、、研究报告4 4、加强研究加强研究(英国)开放数据白皮书 NIST在大数据领域的相关研究报告:大数据互操作性框架:第一卷:定义、大数据互操作性框架:第二卷:大数据分类、大数据互操作性框架:第四卷:安全与隐私、大数据互操作性框架:第六卷:参考架构、NIST大数据互操作性框架:第七卷:大数据标准路线图。为了更好的开展政府大数据开放共享和数据资产管理方面的标准化工作,工作组正在开展政府大数据分类分级和数据资产管理的相关研究工作,目前已经形成两份研究报告的初稿。21(二)标准化工作进展(二)标准化工作进展 已立项标准已立项标准三、标准研制三、标准研制序号计划号标准名称状态120141191-T-469
13、 信息技术 大数据 术语审定会220141190-T-469 信息技术 大数据 技术参考模型完成草案320141184-T-469 数据能力成熟度评价模型完成草案420141172-T-469 多媒体数据语义描述要求完成草案520141194-T-469 信息技术 科学数据引用完成草案620141200-T-469 信息技术 数据交易服务平台 交易数据描述完成草案720141201-T-469 信息技术 数据交易服务平台 通用功能要求完成草案820141202-T-469 信息技术 数据溯源描述模型完成草案920141203-T-469 信息技术 数据质量评价指标草案大纲1020141204-
14、T-469 信息技术 通用数据导入接口规范草案大纲23共定义了共定义了28个术语,该标准目前处于征求意见阶段。个术语,该标准目前处于征求意见阶段。重点介绍:重点介绍:大数据 大数据参考体系结构 大数据生命周期模型 大数据工程化 读时模式 数据科学家三、标准研制三、标准研制Volume24大数据大数据big databig data 具有数量巨大、来源多样、生成极快且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据。注:国际上,大数据的4个特征普遍不加修饰地直接用volume、variety、velocity和variability予以表述,并分别赋予了它们在大数据语境下的定义
15、:数量 VolumeVolume多样性Variety 多变性variabilityVolume构成大数据的数据构成大数据的数据集的规模。集的规模。速度Velocity数据可能来自多个数据可能来自多个数据仓库、数据领数据仓库、数据领域或多种数据类型域或多种数据类型。Volume单位时间的数据流单位时间的数据流量。量。大数据其他特征,大数据其他特征,即数量、速度和多即数量、速度和多样性等特征都处于样性等特征都处于多变状态。多变状态。三、三、信息技术信息技术 大数据大数据 术语术语25三、三、信息技术信息技术 大数据大数据 术语术语大数据参考体系结构大数据参考体系结构 big data refere
16、nce architecture big data reference architecture 一种用作工具的、便于对大数据内在要求、设计结构和运行进行开放性探讨的高层概念模型。注:比较普遍认同的大数据参考体系结构一般包含系统协调者、数据提供者、大数据应用提供者、大数据框架提供者和数据消费者等5个逻辑功能构件。26大数据生命周期模型大数据生命周期模型 lifecycle model for big data lifecycle model for big data 用于描述大数据的“数据 信息 知识 价值”生命周期和指导大数据相关活动的模型;这些活动主要由收集、准备、分析和行动等阶段覆盖。注
17、:几个阶段的主要活动如下:a.收集阶段采集原始数据并按原始数据形式存储;b.准备阶段将原始数据转化为干净的、有组织的信息;c.分析阶段利用有组织的信息产生合成的知识;d.行动阶段运用合成的知识为企业生成价值。三、三、信息技术信息技术 大数据大数据 术语术语27大数据工程化大数据工程化 big data engineering big data engineering 为适应大数据对于有效存储、操作和分析的需求而运用治理独立资源的先进技术构建可伸缩数据系统的过程。读时模式读时模式 schema-on-read schema-on-read 一种数据模式应用;按此应用,在从数据库读取数据时,先经过
18、诸如转换、净化、整合之类准备步骤。数据科学家数据科学家 data scientist data scientist 数据科学专业人员;他们具有足够的业务需求管理机制方面的知识、领域知识、分析技能、以及用于管理数据生命周期中每个阶段的端到端数据过程的软件和系统工程知识。三、三、信息技术信息技术 大数据大数据 术语术语28该技术参考模型展示了一个通用的、由逻辑功能构件组成的大数据系统,该技术参考模型展示了一个通用的、由逻辑功能构件组成的大数据系统,该模型独立于供应商、实现技术和基础设施。该模型独立于供应商、实现技术和基础设施。三、三、信息技术信息技术 大数据大数据 技术参考模型技术参考模型29n
19、大数据价值链的两个维度组织:大数据作为一种数据科学方法对从数据到知识的处理过程中所实现的信息流价值 大数据价值通过数据的收集、预处理、分析、可视化和访问等活动实现。信息价值链(水平轴)大数据作为一种新兴的数据应用范式对IT技术产生的新需求所带来的价值 大数据价值通过为大数据应用提供存放和运行大数据的网络、基础设施、平台、应用工具以及其他IT服务实现IT价值链(垂直轴)三、三、信息技术信息技术 大数据大数据 技术参考模型技术参考模型30n 五个角色+两个重要的逻辑构件:数据消费者大数据框架提供者大数据应用提供者数据提供者系统协调者安全和隐私安全和隐私管理管理代表大数据系统中存在的不同技术角色能够
20、为大数据系统的其他五个主要构件提供服务和功能三、三、信息技术信息技术 大数据大数据 技术参考模型技术参考模型 已上报申请立项标准已上报申请立项标准序号已申请国家标准名称牵头单位1信息技术 大数据 基于参考架构下的接口框架华为2信息技术 大数据 分类指南中科院信工所3信息技术 大数据 系统通用规范电子四院4信息技术 大数据 系统运维和管理功能要求华为5信息技术 大数据 存储与处理系统功能要求华为6信息技术 大数据 存储与处理系统功能测试规范华为7信息技术 大数据 分析系统功能要求浪潮电子8信息技术 大数据 分析系统功能测试规范浪潮电子9信息技术 大数据 面向应用的基础计算平台基本性能要求浪潮电子
21、10信息技术 大数据 开放共享 第1部分:总则电子四院11信息技术 大数据 开放共享 第2部分:政府数据开放共享基本要求国家信息中心12信息技术 大数据 开放共享 第3部分:开放程度评价电子四院13信息技术 工业大数据 术语数码大方14信息技术 工业大数据 参考架构数码大方15信息技术 工业大数据 工业订单元数据数码大方16信息技术 工业大数据 产品核心元数据规范电子四院17信息技术 电子商务大数据 采集规范京东18信息技术 电子商务大数据 仓库建设模型京东19信息技术 电子商务大数据 应用指标体系 第2部分:电子商务大数据 京东开放程度形式许可证数据在网站上可用(任意格式)开放许可证作为结构
22、化数据可用(比如Excel,而不是表的扫描图)开放许可证以一种开放的、非专属的形式可用(比如,CSV、XML而不是Execl)开放许可证除了使用开放的格式,使用统一资源定位符(URLs)识别使用来自W3C的开放标准和推荐的事物开放许可证除了使用开放格式和URLs识别事物,链接数据到其他用户的数据,提供上下文环境开放许可证数据开放程度衡量标准数据开放程度衡量标准英国内阁办公室英国内阁办公室开放数据白皮书开放数据白皮书四、工作重点:数据资源开放共享四、工作重点:数据资源开放共享3233四、工作重点:数据资源开放共享四、工作重点:数据资源开放共享数据资源开放共享数据资源数据规划数据分类元数据数据交换
23、接口资源标识OID编码机制分发技术管理规程领域应用政务技术服务能力基层政务服务政务数据开放共享智慧城市公共服务信息平台参考模型教育教育资源教育管理教育公共支撑环境医疗社保农业 提出重点标准研制提出重点标准研制标准名称参编单位大数据开放共享 第1部分:总则中国电子技术标准化研究院、国家信息中心、北京信息资源中心、华为技术有限公司、上海卓繁信息技术股份有限公司大数据开放共享 第2部分:政府数据开放共享基本要求国家信息中心、中国电子技术标准化研究院、阿里云计算有限公司、上海卓繁信息技术股份有限公司、北京市信息资源管理中心大数据开放共享 第3部分:开放程度评价中国电子技术标准化研究院、国家信息中心、北
24、京信息资源中心、华为技术有限公司、上海卓繁信息技术股份有限公司信息技术 大数据开放共享 第4部分:政府资源目录体系拟立项四、工作重点:数据资源开放共享四、工作重点:数据资源开放共享34 收集各领域元数据相关标准,建立元数据资源库金融交通林业卫生电子商务电子政务教育已收集到的各领域元数据相关标准已收集到的各领域元数据相关标准相关标准研制相关标准研制元数据资源库元数据资源库对外开放,提供服务对外开放,提供服务四、工作重点:数据资源开放共享四、工作重点:数据资源开放共享35甲方:甲方:通过通过DCMMDCMM对对自身自身(行业、地方、(行业、地方、领域、企业)评估,识别领域、企业)评估,识别差距差距
25、,找到找到措施措施对对乙方乙方评估,找到合适评估,找到合适技术提供技术提供方方数据数据策略策略未来整体未来整体规划规划,指导部指导部署署数据数据战略战略定义数据定义数据需求需求,指导对数据资产,指导对数据资产的的分布控制与整合分布控制与整合建立数据标准建立数据标准体系体系,控制数据,控制数据质质量与安全量与安全提升人员提升人员数据管理能力数据管理能力,保障数,保障数据据生命周期生命周期乙方:乙方:准确准确定位定位甲方的甲方的能力和需求能力和需求,从从而而提出提出针对性的大数据针对性的大数据解决方案解决方案对对甲方甲方进行大数据能力进行大数据能力评估和认评估和认证证提供对机构和人员提供对机构和人
展开阅读全文