书签 分享 收藏 举报 版权申诉 / 18
上传文档赚钱

类型4.2.1 大数据处理的基本思想与框架 ppt课件 (18张PPT)-2023新浙教版(2019)《高中信息技术》必修第一册.pptx

  • 上传人(卖家):Q123
  • 文档编号:5426139
  • 上传时间:2023-04-11
  • 格式:PPTX
  • 页数:18
  • 大小:2.64MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《4.2.1 大数据处理的基本思想与框架 ppt课件 (18张PPT)-2023新浙教版(2019)《高中信息技术》必修第一册.pptx》由用户(Q123)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    高中信息技术 4.2.1 大数据处理的基本思想与框架 ppt课件 18张PPT_2023新浙教版2019高中信息技术必修第一册 4.2 数据处理 基本 思想 框架 ppt 课件 18 _2023 下载 _必修1 数据与计算_浙教版(2019)_信息_高中
    资源描述:

    1、4.2.1大数据处理的基本思想与框架第 四 章第四章目录分治思想分治思想批处理批处理流计算流计算图计算图计算全球每秒钟发送3百万封电子邮件,一分钟读一篇的话,足够一个人昼夜不息的读5.5年.每天会有2.88万个小时的视频上传到Youtube,足够一个人昼夜不息的观看3.3年.每个月网民在社交软件上要花费7千亿分钟,被移动互联网使用者发送和接收的数据高达1.3EB.Google.上每天需要处理24PB的数据.数据体量巨大(Volumme)速度快(Velocity)数据类型多(Variety)价值密度低(Value)开发“羊了个羊”小程序写代码画界面设计游戏宣传计算机专业 美术专业计算机专业 新媒

    2、体专业成果分 治思 想分将问题分解为规模更小的子问题治将规模更小的子问题逐个击破合将已解决的子问题合并,最终得出原问题的解大数据处理思想分治大数据处理分类大数据处理静态数据流数据图数据静态数据:在处理时已收集完成、在计算式不会发生改变的数据流数据:是指不间断地、持续地到达的实时数据,随着时间的流逝,流数据的价值也随之降低,通过实时分析计算可以得到更有价值的分析的结果图数据:以社交网络、道路交通等数据为例的众多以图为数据呈现形式的数据,或者转化为图之后再进行分析静态数据批处理Hadoop是一个运行于计算机集群上的分布式系统基础架构,适用于静态数据的批处理计算。Spark是一种与hadoop相似的

    3、,应用较广的开源分布式计算架构。Spark启用了内存存储中间结果,运行速度比hadoop快。批处理计算HDFS数据以文件的形式、用多副本保存在不同的存储节点中,并进行分布式管理容错性高,可以部署在廉价的机器中应用:云盘、网盘HBase功能:采用基于列的存储方式,用于存储半结构化和非结构化数据,具有良好的横向扩展能力,可管理PB级的大数据,是BigTable的开源实现。特点:高可靠、高性能、可伸缩、分布式Hbase(数据存储与管理)分布式并行计算模型MapReduceMapReduce主要用于处理大规模数据集的并行运算,由Map(映射)和Reduce(归纳)两部分组成。它的核心思想就是将任务分解

    4、并发到多个节点上进行处理,最后汇总输出。批处理计算大数据处理框架不间断地、持续地到达的实时数据。流数据的价值会随着时间的流逝而降低。对采集的数据实时分析和计算并反馈实时结果。经处理系统处理完成的数据流直接丢弃或存储用户可以实时查询最新数据分析结果,数据不断更新,实时推荐给用户流计算应用:广告推送、个性化推荐、实时交通流计算软件:Storm、Streams、S4、Puma流数据流计算流处理系统处理的是实时的数据,而传统的数据处理系统处理的是预先存储好的静态数据。用户通过流处理系统获取的一般是实时结果,而传统的数据处理方式获取的都是过去某一个历史时刻的快照。流处理系统会实时地把生成的结果不断的推动

    5、给用户,传统数据需要用户主动查询才能获取数据。平台的整合缩短了批处理与流处理之间的切换延时时间,有利于减少系统的开销,降低使用成本。传统数据与流数据现实世界中以图形式展现的数据。如社交网络、道路交通等。图处理软件:Pregel、GraphX图数据图数据图计算图计算练一练1.下列关于流数据的描述不正确的是()A.数据在处理时已经采集完成B.数据价值随着时间的流逝降低C.实时分析流数据可以得到更有价值的结果D.可以采用流计算进行实时分析A 练一练2.下列关于Hadoop架构的描述正确的是()A.是一个对大数据进行聚合式处理的基础软件框架B.不能运行于大规模计算机集群上C.采用NTFS文件系统管理数据文件D.采用MapReduce编程模型处理大规模数据集D练一练3.下列软件主要用于进行流计算的有()A.HadoopB.StormC.PregelD.SparkB练一练4.实时处理与批处理整合的优势有()可以在同一个平台做批处理计算和流计算缩短了批处理计算和流计算之间的切换延时有利于降低使用成本增加了系统开销A.B.C.D.A

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:4.2.1 大数据处理的基本思想与框架 ppt课件 (18张PPT)-2023新浙教版(2019)《高中信息技术》必修第一册.pptx
    链接地址:https://www.163wenku.com/p-5426139.html
    Q123
         内容提供者     

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库