(2021新浙教版)高中信息技术必修一4.2大数据处理ppt课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(2021新浙教版)高中信息技术必修一4.2大数据处理ppt课件.pptx》由用户(大布丁)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2021新浙教版 2021 新浙教版 高中 信息技术 必修 4.2 数据处理 ppt 课件 下载 _必修1 数据与计算_浙教版(2019)_信息_高中
- 资源描述:
-
1、第四章 数据处理与应用 学习目标: 1、理解理解Hadoop的组成和功能的组成和功能 2、掌握大数据处理类型、掌握大数据处理类型 未来,已发生改变未来,已发生改变 大数据的关键技术大数据的关键技术 n大数据,或称海量数据,指所涉及的数据量规模巨大到无法通过人工,在 合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。 n在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小 型数据集合合并后进行分析可得出许多额外的信息和数据关系性,可用来 察觉商业趋势、避免疾病扩散、打击犯罪、测定实时交通路况或判定研究 质量等。 大数据的魅力 大数据的魅力 顾客一次购买商品 1面包、黄油、
2、尿布、牛奶 2咖啡、糖、小甜饼、鲑鱼 3面包、黄油、咖啡、尿布、牛奶、鸡蛋 4面包、黄油、鲑鱼、鸡 5鸡蛋、面包、黄油 6鲑鱼、尿布、牛奶 7面包、茶叶、糖、鸡蛋 8咖啡、糖、鸡、鸡蛋 9面包、尿布、牛奶、盐 10茶叶、鸡蛋、小甜饼、尿布、牛奶 经关联分析,可发现顾客经常同时购买的商品:尿布牛奶 什么是分治思想?什么是分治思想? 分-将问题分解为规模更小的子问题 治-将规模更小的子问题逐个击破 合-将已解决的子问题合并,最终得出原问题的解 正如“不同的锁需要不同的钥匙”企业中不同的应用场景数据不同的计算模式, 需要使用不同的大数据技术 不同的计算模式需要使用不同的产品 大数据处理类型?大数据处
3、理类型? 一一、批处理计算批处理计算 设想:硬盘读取速度永远满足要求! 你发现:目前的硬盘容量是1T,速度100MB/s 要把现在的硬盘数据刷一遍,要两个多小时,太可怕了。 而Hadoop就是一个并行处理海量数据的工具。 Hadoop 诞生于大搜索应用 Doug Cutting MapReduce | GFS | BigTable Hadoop是什么? 是一个可运行于大规模计算机集群上的分布式系统基础架构, 适用于静态数据批处理计算。 方便用户便捷处理海量数据。 目前Yahoo!(雅虎)是最主要的贡献者。 批处理计算批处理计算 国内外那些企业用Hadoop? 数据仓库,商业智能 (facebo
4、ok,twitter,淘宝,京东,暴风,新浪,58同城., 移动大云) 互联网广告计算 (亿赞普,科捷,各类大互联网企业) 大搜索引擎项目 (Yahoo,国产盘古,人民搜索) 站内搜索引擎项目 (Ebay,支付宝) 内容推荐引擎 (人人,新浪微博,优酷) 病毒分析,垃圾邮件识别(Yahoo,趋势科技,360) 云计算服务项目 (亚马逊云,阿里云) 地图项目 (月球表面探测地图) 科研项目 (欧洲量子对撞机) 金融项目 (股票分析,阿里金融) 分布式文件系统分布式文件系统HDFSHDFS 分布式数据库分布式数据库HBaseHBase 分布式分布式并行计算并行计算模型模型MapReduceMapR
展开阅读全文