书签 分享 收藏 举报 版权申诉 / 18
上传文档赚钱

类型大数据的应用学习路线图课件.pptx

  • 上传人(卖家):三亚风情
  • 文档编号:2874786
  • 上传时间:2022-06-07
  • 格式:PPTX
  • 页数:18
  • 大小:1.07MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据的应用学习路线图课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 应用 学习 路线图 课件
    资源描述:

    1、大数据的应用“大数据的应用”学习路线图深入深入认知认知初识初识大数据算法与理论大数据系统与实践NoSQLHadoop大数据带来的思维变化大数据带来的价值链大数据发展现状与未来大数据 vs 人类什么是大数据大数据的特性大数据与传统技术的关系大数据与其他新兴技术的关系什么是大数据 百度百科:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯资讯。 维基百科:大数据是由数量巨大、结构复杂、类型众多数据构成的数据集合数据集合,是基于云计算的数据处理与应用模式,通过数据的整

    2、合共享,交叉复用形成的智力资源智力资源和知识服务知识服务能力。 我的观点:大数据是由大量异构的数据组成的数据集合数据集合,它是可以应用合理的数学算法或工具从中找出有价值的信息,为人们带来利益的一门新兴学科新兴学科。什么是大数据2009年,甲型H1N1流感在全球爆发传播,为了发现和控制疫情,各国政府和卫生相关部门付出了巨大努力,但得到的数据仍然滞后一两周,而Google对人们的搜索的历史记录进行处理,建立合理的数学模型后,得到的预测结果与官方的数据相关性高达97%,能够立刻判断出流感是从哪里传播出来的,没有一两周的滞后。Google处理了5000万条历史记录、4.5亿个不同的数学模型。什么是大数

    3、据Farecast是一个对机票价格进行预测的公司,帮助消费者抓住最佳购买机票的时机,使乘客节省很多钱。最初预测系统建立在41天之内的12000个价格样本基础上,数据是从旅游网站上抓取的,如今已经拥有超过2000亿条飞行记录。系统只推测机票的价格何时最便宜,不关心是什么原因导致的价格下降。FarecastBing大数据的特性大数据大数据的特性的特性大数据与传统数据库的区别 大数据是在传统数据库学科的分支数据仓库与数据挖掘的基础上进一步发展起来的。但有两点比较主要的不同: 结构化程度 传统数据库保存的是结构化或者半结构化的数据,以二维表或者标准XML文件的方式存储数据,由于结构清晰,处理相对容易;

    4、 大数据面向的是一切计算机可以存储的数据格式,包括互联网上的各种网页、图片、音频、视频,包括办公文档、报表,包括人们在搜索引擎中输入的关键词、在社交网络中的留言、喜好,也包括各种传感器自动收集的监控结果等等,显然不同的格式处理起来更加困难。 异常数据的处理 传统数据库通常把异常数据先剔除,应用在需要高精确度的领域,如银行对每个账户的管理; 大数据则允许异常数据存在,更多应用在预测方面,找出大量数据中隐藏的关联关系,少量异常数据不会对总体结果产生影响。大数据与其他新兴技术的关系 大数据、物联网、云计算、移动通信等都是近年涌现出来的新兴概念,彼此之间不是孤立的,而是存在着内部联系。大数据带来的思维

    5、方式的变化 处理的对象往往是全部数据,而不是部分数据的采样 采样的不合理会导致预测结果的偏差,在大数据时代,依靠强大的数据处理能力,应该去处理全部的数据。 不再执迷于精确性 精确的、规范化的、可以被传统数据库处理的数据只占全部数据的5%,必须接受不精确性才能处理另外95%的数据。 错误的数据是客观存在的,竭力避免它就失去了应有的客观性和公平性。 大数据的简单算法比小数据的复杂算法更有效。 更加关注相关性,而不是因果性 预测依靠的是相关性。 很多情况下知道“是什么”即可,不必知道“为什么”。大数据的价值链数据的掌控者,拥有或者可以收集大量数据的公司。海量的数据就是财富,可以考虑自己分析或者卖数据

    6、给其他公司。技术供应商或者分析公司。掌握了从海量数据中分析出有用信息的技能或者工具,但本身不一定拥有数据。有创新思维的人或者公司。他们对大数据敏感,有怎样挖掘数据的新价值的独特想法。我们应如何学习大数据知识技术术人员员创业创业人员员其他决决策者大大数数据据人类应如何对待大数据 机遇 大数据能够为人类带来新的理念、新的价值,推动社会的快速进步,能够让人类发现一些以往未曾发现的潜在关联。 风险 个人隐私如何保护 数据垄断、独裁 数据主宰一切 掌控 法律法规的建立 人类的思考 vs 大数据的结论国内外现状 Google、IBM、Amazon、Oracle、Microsoft、EMC等IT行业巨头已经

    7、在大数据产业链开始行动,从不同的角度挖掘大数据的价值。 腾讯、百度、新浪、淘宝等国内知名互联网和电商公司也快速加入到大数据队伍中,对已经持有的大数据进行挖掘,以便改善自身的服务。 国内外政府机构对大数据的重视更多在于报告和组织会议上,行动的步伐远远不及企业。如今,我们处在大数据时代拥抱大数据参考资料推荐参考文献 1 维克托迈尔-舍恩伯格,肯尼斯库克耶. 大数据时代. 浙江人民出版社. 2013.1 2陆嘉恒.大数据技术的学习指南.电子工业出版社. 2013.4 3 Anand Rajaraman, Jeffrey David Ullman.大数据:互联网大规模数据挖掘与分布式处理. 人民邮电出版社. 2012.9作业 1. 请查阅资料,探讨大数据可以应用在哪个领域,要求写出具体的方案。 2. 大数据除了探索数据的相关性之外,也可以探索因果性,请查阅资料,写出一个利用大数据探索因果性的案例。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据的应用学习路线图课件.pptx
    链接地址:https://www.163wenku.com/p-2874786.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库