4.2.1 大数据处理的基本思想与框架 ppt课件-2023新浙教版(2019)《高中信息技术》必修第一册.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《4.2.1 大数据处理的基本思想与框架 ppt课件-2023新浙教版(2019)《高中信息技术》必修第一册.pptx》由用户(Q123)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中信息技术 4.2.1 大数据处理的基本思想与框架 ppt课件_2023新浙教版2019高中信息技术必修第一册 4.2 数据处理 基本 思想 框架 ppt 课件 _2023 新浙教版 2019 下载 _必修1 数据与计算_浙教版(2019)_信息_高中
- 资源描述:
-
1、4.2.1大数据处理的基本思想与框架第 四 章第四章目录分 治 思 想批 处 理流 计 算图 计 算大数据具有数据量大、数据来源与类型多样、处理速度快等特点分-将问题分解为规模更小的子问题治-将规模更小的子问题逐个击破合-将已解决的子问题合并,最终得出原问题的解什么是分治思想?大数据类型及其计算方式静态数据:静态数据:在处理时已收集完成、在计算式不会发生改变的数据流数据:流数据:是指不间断地、持续地到达的实时数据,随着时间的流逝,流数据的价值也随之降低,通过实时分析计算可以得到更有价值的分析的结果图数据:图数据:以社交网络、道路交通等数据为例的众多以图为数据呈现形式的数据,或者转化为图之后再进
2、行分析的批处理计算Hadoop进化史最早起源于Nutch项目Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页的抓取、索引、查询等功能随着抓取网页的数量增加、遇到了严重的拓展性问题如何解决数十亿网页的存储和索引问题Google2003年谷歌发表了两篇论文为该问题提供了解决方案GFS:Google File SystemMapReduce:并行式计算模型BigTable:数据库Doug Cutting用了两年时间,将论文实现了出来2008年Hadoop成为Apache的顶级项目批处理计算运用Hadoop企业一览数据仓库,商业智能 (facebook,twitter,淘宝,京东,暴风,新浪
3、,58同城.,移动大云)互联网广告计算(亿赞普,科捷,各类大互联网企业)大搜索引擎项目 (Yahoo,国产盘古,人民搜索)站内搜索引擎项目 (Ebay,支付宝)内容推荐引擎(人人,新浪微博,优酷)病毒分析,垃圾邮件识别(Yahoo,趋势科技,360)云计算服务项目(亚马逊云,阿里云)地图项目(月球表面探测地图)科研项目(欧洲量子对撞机)金融项目(股票分析,阿里金融)批处理计算Hadoop是一个可运行与大规模计算机集群上的分布式系统架构,适用于静态数据的批处理计算。Spark是一种与Hadoop相似的、应用较为广泛的开源分布式计算架构。Spark使用了内存存储中间结果,运行速度比Hadoop快很
展开阅读全文
链接地址:https://www.163wenku.com/p-6549807.html