大数据知识普及与应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据知识普及与应用课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 知识 普及 应用 课件
- 资源描述:
-
1、大数据Big Data友情提示上课时间请勿:-请将您手机改为“震动”避免在课室里使用手机-交谈其他事宜-随意进出教室请勿在室内吸烟上课时间欢迎:-提问题和积极回答问题-随时指出授课内容的不当之处大数据什么是大数据大数据原理和构成大数据应用大数据价值Big Data目录什么是大数据Big Data什么是大数据HadoopIBM英特尔HP数据商业智能数据库服务器SAP HANANoSQLSQLHDFS预测数据流运算节点机器学习并行计算磁盘阵列甲骨文AMD内存计算GoogleMap reduce 可视化GbPbTbZbBig Data什么是大数据由多个软件、硬件部分组成的一个数据系统一个执行体系有别
2、于传统企业数据中心,用来应对现代海量数据化的生活,商业环境。不是一个行业,而是一种新的数据处理方法是关于数据的运输和处理,以及最后有效使用的体系与云计算一样 都是一种新的生产组织形式Web 2.0时代的解决方案大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯Big Data什么是大数据大数据的目的原始数据的处理和分类存储将存储的数据调取并分析最终提供决策依据 归类数据类型有效分析组合大数据的特点4V海量高速多样精确Big Data什么是大数据1 KB=1024字节存储单
3、位1 MB=1024 KB1 GB=1024MB1 TB=1024GB 1 PB=1024TB=1,048,576 GB1 EB=1024PB=1,073,741,824 GB 1 ZB=1024EB=1,099,511,627,776 GB100万 G10亿 G1万亿 G22亿台215万台2100台500G硬盘电脑15寸电脑排成行可以往返一次月球Big Data什么是大数据Volume 海量1 PB=1024TB=1,048,576 GB1 EB=1024PB=1,073,741,824 GB 1 ZB=1024EB=1,099,511,627,776 GBIntel:人类文明开始到2003
4、年 地球共产生了5EB数据.2012年全年,全球产生数据2.7ZB 是 2003年以前的500倍2015年,全球估计产生数据8ZB,等于1800万个美国国会图书馆44%35 ZB2000年 数字信息占全球数据量的25%75%都在报纸 胶片 磁带等媒介2013年 数字信息 98%非数字信息 2%Big Data什么是大数据商业数据现状Twitter2007年 5000条微博更新/天2008年 30万条微博更新/天2009年 250万条微博更新/天2010年 3500万条微博更新/天2011年 2亿条微博更新/天2013年 4亿条微博更新/天2013年 上传时长12年的视频/天2013年 用户分享
5、25亿条信息/天我国一个一线城市的健康档案数据 5PB/年我国一个智慧城市的数据 800 PB/年 一个单数据表几亿-几百亿条记录下线商品14亿件,在线商品8亿件淘宝数据库存了20PB数据平均每月增加1.5PB智能移动终端设备的巨量增长Big Data什么是大数据Velocity 高速6000万用户登录/天20亿次 页面访问/天每天1.2亿次网站访问 响应时间小于100毫秒大数据的惊人不止是在数量上,同时数据还是巨量具有动态分析价值的数据。访问响应时间的加快,数据库读写速度的加快,对电商企业来说就等于多成交。对于很多情况下,动态的数据价值远大于静态数据,比如气象预测,灾难预测,快消行业等。由于
6、输入速度加快,所以要求输出速度也要加快Big Data什么是大数据Variety 多样数据:结构化数据半结构化数据非结构化数据指关系型数据表指关系结构与内容混合在一起的数据类型文档、视频、音频、图片20%结构化 80非结构化企业数据2012年互联网产生的数据25%结构化 75非结构化50%-70%源于人与人的互动Big Data什么是大数据Veracity 准确大数据的核心思想之一准确源自于对全部数据的处理分析基础数据的真实准确性,才能保证结果的有效性。Big Data什么是大数据大数据 VS 云计算两者都是生产方式改变为主,生产资料改变为辅,提高生产效率。云计算是将计算和存储,由本地转移到了
展开阅读全文