大数据简介应用及技术简述PPT课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据简介应用及技术简述PPT课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 简介 应用 技术 简述 PPT 课件
- 资源描述:
-
1、大数据技术与应用什么是大数据什么是大数据Part 1 Part 1 什么是大数据什么是大数据何为大?数据度量1Byte = 8 Bit1KB = 1,024 Bytes1MB = 1,024 KB = 1,048,576 Bytes1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes1TB = 1,024 GB = 1,048,576 MB = 1,099,511,627,776 Bytes1PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes1EB = 1,024 PB = 1,0
2、48,576 TB = 1,152,921,504,606,846,976 Bytes1ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes1YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes数据没有办法在可容忍的时间下使用常规软件方法完成存数据没有办法在可容忍的时间下使用常规软件方法完成存储、管理和处理任务储、管理和处理任务Part 1 Part 1 什么是大数据什么是大数据大数据定义:大数据定义: 所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、
3、并整理成为帮助企业经营决策更积极目的的资讯。主要的特点主要的特点: : Volume 数据体量 Velocity 数据速度 Variety 数据多样 Veracity 数据真实 4V4V特征特征Part 1 Part 1 什么是大数据什么是大数据大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据就是“未来的新石油”。大数据的特征大数据的特征Part 2 Part 2 大数据的特征大数据的特征Big Data大数据Volume非结构化数据的超大规模和增长总数据量的8090%比结构化数据增长快10倍到50倍是传统数据仓库的10倍到50倍数
4、据量体Value大量的不相关信息对未来趋势与模式的可预测分析深度复杂分析(机器学习、人工智能Vs传统商务智能)数据价值Variety大数据的异构和多样性很多不同形式(文本、图像、视频、机器数据)无模式或者模式不明显不连贯的语法或句义数据多样 Velocity实时分析而非批量式分析数据输入、处理与丢弃立竿见影而非事后见效数据速度Part 2 Part 2 大数据的大数据的4V4V特征特征VolumeVolume1Bity1KB1MB1GB1TB1PB1EB1ZB1YB1PB相当于50%的全美学术研究图书馆藏书信息内容5EB相当于至今全世界人类所讲过的话语1ZB如同全世界海滩上的沙子数量总和1YB
5、相当于7000位人类体内的微细胞总和一般情况下,大数据是以PB、EB、ZB为单位进行计量的Part 2 Part 2 大数据的大数据的4V4V特征特征VelocityVelocity大数据的处理速度快实时数据流处理的要求,是区别大数据引用和传统数据仓库技术,BI技术的关键差别之一;1s 是临界点,对于大数据应用而言,必须要在1秒钟内形成答案,否则处理结果就是过时和无效的;82254132215327现在及未来几年内美国的移动网络数据流量增长(PB/月)源自英国Coda研究咨询公司大数据的增长速度快Part 2 Part 2 大数据的大数据的4V4V特征特征VarietyVariety行业/企业
6、内数据互联网数据物联网数据大数据数据来源多企业内部多个应用系统的数据、互联网和物联网的兴起,带来了微博、社交网站、传感器等多种来源。数据类型多保存在关系数据库中的结构化数据只占少数,7080%的数据是如图片、音频、视频、模型、连接信息、文档等非结构化和半结构化数据。关联性强数据之间频繁交互,比如游客在旅行途中上传的图片和日志,就与游客的位置、行程等信息有了很强的关联性。Part 2 Part 2 大数据的大数据的4V4V特征特征ValueValue价值密度低(Value)价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强
7、大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。挖掘大数据的价值类似沙里挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀淘金,从海量数据中挖掘稀疏但珍贵的信息疏但珍贵的信息大数据技术简介及现况大数据技术简介及现况Part 3 Part 3 大数据技术简介大数据技术简介数据采集数据预处理数据存储数据分析挖掘数据可视化实时处理 Spark Storm机器语音R语言关联分析用户画像构建 推理预测知识图谱2D法时间可视化多维法 层次法分布式架构 Hadoop MapReduce数据库体系 NoSQLNewSQLMPP混合架构Lambda架构数据清理 遗漏值处理 噪音数据数
8、据集成 实体识别 数据冗余数据归约 维度归约 数值归约硬件采集 传感技术 RFID软件采集系统日志抓取企业特定API、网络众包Part 3 Part 3 大数据技术现况大数据技术现况将在三个环节分层突将在三个环节分层突破破采集端多源数据融合社交数据、IOT数据 等外部数据与企业内 部数据融合拉通运营化发展通过长期采集积累 海量数据资源的企 业实现数据联合运 营分析端处理实时化针对网络视频化潮流, 更加强化对实时流数 据的处理能力高效化数据量的不断增加, 云端处理API结合后 台支撑将使数据处理 更加高效应用端智能化以机器学习作为核心, 将实现对用户需求的自 我理解和智能迭代云端化云计算和移动互
9、联网 将促进大数据应用从2B市场迅速推广到2C市场THANK YOUSUCCESS2022-5-1215可编辑Part 3 Part 3 大数据及其关联技术大数据及其关联技术物联网云计算大数据物联网是大数据的重要来源大数据技术为物联网数据分析提供支撑云计算为物联网提供海量数据存储能力物联网为云计算技术提供了广阔的应用空间云计算为大数据提供了技术基础,大数据为云计算提供用武之地 云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者既有区别又有联系大数据应用大数据应用Part 4Part 4大数据主要用途21%16%24%21%18%精准经营降低成本智能服务风险管理创新经营24%的大数据企
展开阅读全文