大数据概念技术与应用介绍课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据概念技术与应用介绍课件.pptx》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 概念 技术 应用 介绍 课件
- 资源描述:
-
1、大数据概念技术与应用介绍PPT1.1.大数据大数据4.04.02.2.什么是大数据什么是大数据3.3.大数据如何产生大数据如何产生目 录Contents4.4.大数据带来的思维变革大数据带来的思维变革5.5.大数据可以做什么大数据可以做什么6.6.中国:从中国:从“数据大国数据大国”走向走向“数据强国数据强国”Part 1国家大数据战略大数据系统的三要素数据资源业务化的数据资源整合跨界数据合作的必然趋势宽度和深度的数据丰富数据生产能力可驾驭的数据技术可落地的数据治理衔接产品和数据的桥 梁数据产品场景化的业务主题数据驱动应用的模式推动数据和生产能力的整合服务于数据产品的基础设施“三通一平”,为唱
2、戏的搭台IT支撑业务,不是引领业务;不当瓶 颈、不拖后腿、不背黑锅;SLA是关 键目前大数据生产所面临的问题 复杂度高 复杂度隔离,业务的和 技术 业务与技术交叉影响业务理解和技 术实现的松耦合 业务理解与信息化协同业务理解和 技术实现的强一致性 大数据容灾难有效防范技术单点故 障,杜绝技术绑架 业务协同、数据协同难公共知识,跨角色和角色间沟通协作的基础业务化的数据流图,不懂 技术的我,也能看懂文档即生产,生产即文 档,“知行合一”!大数据生产4.0快速、高质量的规模化量产个性化产品Cyber-Physical System 用户可全程参与产品设计和制造环节 动态、有机重构、模块化的生产方式工
3、厂标准化,全制造流程的数字化快速、高质量的规模化量产个性化数据产品用户可全程参与数据产品的设计和生产过程动态、敏捷、对象化的数据生产方式 数据工厂标准化,全生产流程的数字化Data-Tech SystemHi,I am 工业 4.0Hi,I am 数据4.0从数据作坊,到数据工厂分析型系统的难题数据产品的个性化数据资源的多样性数据生产的复杂度业务满意度难保障响应时间的不 可控响应质量的不 可控数据产品数据输出中间数据数据加工、处理基础数据数据输入数据资源:结构化、非结构化数据生产Data Manufacturing成品:业务线原材料:技术线半成品:数据线大数据系统+生产数据产品的制造业=数据工
4、厂大数据梦工厂=数据+技术移动互联大数据+政务大数据 数据总和的价值远远大于数据价值的总和行为数 据移动互 联数据物联网 数据政务数据基础数据滚雪球,为缓变的政务数据注入新的活力和价值用户标签体系近千个维度标签人口属性生活方式应用兴趣消费兴趣付费能力城市为民,需要兼顾网络侧与政务侧网络空间政务空间停车园区一卡 通办公维修工作单位园区医院体育运动社保公积信息资源库喜欢听歌喜欢玩 刀塔传奇他还在在 租房有车一族 经常代驾关心 宝宝他很喜欢 旅游中产阶级 生活小资她很爱美丽滴滴重度 用户他工作在 CBD居住在通州他很喜欢 新闻Part 2什么是大数据大数据的解释 大数据是需要新处理模式才能具有更强的
5、决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据就是“未来的新石油”。本章概要0102什么是大数据大数据的五个特点1.什么是大数据它什么都知道它什么都知道会员卡号是:342623我想要一个海鲜披萨。*披萨店为您服务。您的会员卡号是?为什么?海鲜披萨不适合您。根据您的医疗记录根据您的医疗记录,你的血压和胆固醇都偏高。您可以试试我们的低脂健康比萨。那你们有什么推荐?您上星期一在国家图书馆国家图书馆借了一本低脂健康食谱。你怎么知道我会喜欢吃这种的?好。那要一个家庭特大号,多少钱?99元,它足够您一家六口一家六口吃。但您母亲应该少吃。你们直接把比萨送我家吧,你们多久会送到?大
6、约30分钟。如果您不想等,可以自己骑车来。根据我们CRMCRM全全球定位系统球定位系统的车辆行驶自动跟踪系统记录,您登记有一辆车号为车号为SV-568SV-568的摩托车,而您目前正在铁山路右侧骑着这辆摩托车她上月刚做上月刚做了心脏手术,还在恢复期。1.什么是大数据大数据挖掘和整合一切有用的信息,为人类社会提供更好的服务。21世纪前10年社交媒体的产生,数据开始呈现爆炸式的增长,大数据的提法开始进入大众的视野并获得了越来越多的关注。2.大数据的五个特点类型多75%网络日志、音频、视频、图片、地理位置信息社交媒体中产生的数据25%“1、2、3、4”等传统数字以及符号非结构化数据非结构化数据结构化
7、数据2.大数据的五个特点容量大 美国的国会图书馆美国的国会图书馆50005000 百度每天处理数据量百度每天处理数据量根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB,而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍,相当于我们地球上所有海滩沙粒总数的57倍。(摘自涂子沛数据之巅大数据)截至2010年,人类拥有的信息总量大概是1.2Z1.2Z存储数据量最大的图书馆之一。2011年4月,拥有235TB的数据一首歌4M10241024一部电影1G1024一图书馆藏书1T1024谷歌每小时处理1P13亿中国人人手1本5
8、00页书的信息量总和=1E1024吉(吉(G G)兆(兆(M M)太(太(T T)拍(拍(P P)艾(艾(E E)泽(泽(Z Z)约为5000个美国图书馆总和2.大数据的五个特点 数据产生得快数据产生得快一台大型粒子对撞机里共有1.51.5亿个传感器亿个传感器每秒钟发生粒子对撞6 6亿次亿次仅仅使用十万分之一一年积累25PB25PB的数据1TB1TB的硬盘2500025000个个剔除剔除99.999%99.999%数据处理速度快数据处理速度快大数据通过云计算,以上数据储存仅需2020分钟分钟共计1PB,速度1G/s,还剩144小时已完成50%存取速度快2.大数据的五个特点应用价值大大数据之“大
9、”,其实并不在于其表面的“大容量”,而在于其潜在的“大价值”。如果不能把拥有的数据转化为价值,那么拥有再多的数据也是毫无意义的。个人位置大数据服务80008000亿美元亿美元的市场规模麦肯锡研究院对美国的测算零售业大数据帮助企业增加60%60%的利润制造业大数据降低50%50%的产品开发制造装配成本2.大数据的五个特点具备大智能更加智能的社会传感器、可穿戴式设备等微小的计算设备将进一步普及“万物皆互联、无处不计算万物皆互联、无处不计算”实时收集数据确保安全行驶谷歌无人驾驶汽车Part 3大数据如何产生123保存数据的能力在增强处理数据的能力在增强生产数据的能力在增强大数据的背后推手1.随着存储
10、器硬件能力的提升,人类保存数据的能力在增强摩尔定律摩尔定律英特尔的创始人之一戈登摩尔半个世纪来,硬件技术的发展基本符合摩尔定律:同一面积芯片上可容纳的晶体管数量,约每隔1824个月便增加一倍。今天,一根头发尖大小的地方,就能放上万个晶体管。1.随着存储器硬件能力的提升,人类保存数据的能力在增强世界上第一款硬盘IBM商用硬盘存储器一兆字节的存储量需要60006000多美元多美元19551955年年20102010年年一兆字节的存储量仅需要0.0050.005美分美分20202020年年1T硬盘=一杯咖啡的钱=一个图书馆的全部信息2.随着物联网技术与互联网经济的发展,人类生产数据的能力在增强传感器
11、传感器感知和运输不断生产的数据移动设备收集了大量的用户数据2.随着物联网技术与互联网经济的发展,人类生产数据的能力在增强社交媒体及互联网经济的发展移动设备收集了大量的用户数据记录各自的活动和行为留下支付行为、空间位置、兴趣爱好、信用历史等每个网民每个网民都是数据的生产者都是数据的生产者3.随着云计算的诞生与发展,人类处理数据的能力在增强爱迪生发明电灯泡自己用电信息时代的信息时代的“云计算云计算”发电机和电线持续供电个人和企业独立发电私人电厂遍地开中央电厂 公共电网付费用电3.随着云计算的诞生与发展,人类处理数据的能力在增强A 大数据大数据B 云计算云计算 云计算一般由数量惊人的计算机群数量惊人
12、的计算机群构成,谷歌云计算拥有的服务器超过100100万台万台;云计算系统是一个极其庞大的资源池子,用户可以随时、随地、按需灵活地购买,就像购买煤气和自来水一样便利;云计算让普通人体验每秒10万亿次的运算能力。而如此强大的计算能力,可以模拟核爆炸、预测气候变化和市场发展趋势。Part 4大数据带来的思维变革大数据带来的思维变革大数据带来的思维变革(更多)人口大普查全数据模式随机采样样本模式大数据应用全数据模式是指在国家统一规定的时间内,按照统一的方法、统一的项目、统一的调查表和统一的标准时点,对全国人口普遍地、逐户逐人地进行的一次性调查登记;主要特点是调查组织高度集中性,普查对象的全面完整性;
13、人口大普查耗时耗费,一般来讲是十年一次,新中国成立以来共进行了6次人口大普查;人口大普查是一种典型的全数据模式;大数据带来的思维变革(更多)人口大普查全数据模式随机采样样本模式大数据应用全数据模式人口大普查是一种耗时耗费的工程,一般是以十年为单位;各国每年需要进行几百次的小规模人口调查,采取随机采样分析的方式,这是一种样本模式;源于实用并且很好的创新!随机采样分析是小数据时代的产物;大数据带来的思维变革(更多)人口大普查全数据模式随机采样样本模式大数据应用全数据模式我们已具备了大数据的各种技术能力,思维需要转换到大数据的全数据模式:样本=全部;大数据不用随机分析法这样的捷径,而采用所有数据的方
展开阅读全文