大数据技术及应用培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据技术及应用培训课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 应用 培训 课件
- 资源描述:
-
1、大数据技术及应用123大数据应用目 录大数据时代大数据技术大数据时代大 数 据 时 代生活、工作与思维的大变革Living,working and thinking big changes一场生活、工作与思维的大变革 大数据开启了一次重大的时代转型。就想望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发大数据,变革生活大数据,变革商业大数据,变革思维大数据,开启重大的时代转型预测是大数据的核心第一个故事,百货公司知道女孩怀孕第二个故事,搜索热词里的商机第三个故事,阿里知道谁需要贷款第四个故事,中
2、移动挽留流失客户第五个故事:每天,我们借助大数据完成微信上的互动第六个故事:大数据解救每一位“路盲”第七个故事:大数据协助大闸蟹养殖大数据时代大数据时代 国家电网大数据案例,基于PMS(电力生产系统)系统数据,构建基于词云图分析的文本信息挖掘及可视化实现对电网设备的家族缺陷信息的快速分析。6设备类型设备型号断路器查询LW25-126信息查询:高压开关设备缺陷统计分析结果一次系统其他二次系统其他数据挖掘分析流程应用大修技改流程厂家设计改进流程物资采购流程供应商评估流程检修计划流程详细记录信息厂家西安西开高压电器股份有限公司河南平顶山高压电器股份有限公司设备类型断路器断路器设备型号LW25-126
3、lw25-126投运日期2007-12-12008-3-1额定电压252KV252KV额定电流630A630A.西安西电高压开关有限责任公司断路器Lw25-1262008-3-20252KV630A.大数据时代大数据时代西安公交集团大数据案例 公交司机驾驶行为直接影响到乘客的安全,如全国公交一样,西安公交集团在每辆公交车上安装了监控设备,每日审核监控视频,对开车过程中出现违章行为的司机进行罚款处理,但由于公交车多,视频数量极大,这给分析处理视频的工作人员带来了很大的工作压力,因此公交集团希望能够建立一种快速视频识别分析手段,以缓解当前这种情况。如何能让20多名工作人员从每天10个小时的视频审核
4、工作中解脱出来?大数据时代 通过数据挖掘,使工作人员从每天长达数千小时视频违章信息筛选工作中脱离出来,将原来需要数十小时的视频审核工作,缩短为几个小时完成,大大提高了工作效率。且可以有效避免人为舞弊的情况。大数据时代 数据:2014年10月纳税人A申报营业额为10万。信息:2014年10月纳税人A申报营业额比去年同期减少了25%。知识:原因是纳税人A在华东地区的渠道销售不利,或其产品B进入了衰退期,还是公司整体营销活动落后,竞争者强力促销导致?或是其它原因。针对这一问题公司应对的策略是什么?智慧:应对的行动方案可能有多种,但(战略)选择哪个靠智慧。行动则又会产生新的交易数据。大数据时代大数据时
5、代的思维变革“更多”-不是随机样本,而是全体数据 当数据处理技术已经发生翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。一切都改变了,我们需要的是所有的数据,“样本总体”。让数据“发声”小数据时代的随机采样,最少的数据获得最多的信息全数据模式,样本总体大数据时代“更杂”-满足精确性,包容混杂性 执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是有框架且能适用于传统数据库的。如果不能接受混乱,剩下95%的非框架数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。允许不精确大数据的简单算法比小数据的复杂算法更有效纷繁的数据越多越好混杂性,不是竭力避
6、免,而是标准途径新的数据库设计的诞生大数据时代的思维变革大数据时代“更好”-不是因果关系,而是相关关系 知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。关联物,预测的关键“是什么”,而不是“为什么”改变,从操作方式开始大数据,改变人类探索世界的方法大数据时代的思维变革大数据时代大数据时代的商业变革“数据化”-一切皆可“量化”大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚光灯打向“I”,开始关注信息本身了
7、。数据,从最不可能的地方提取出来数据化,不是数字化量化一切,数据化的核心当文字变成数据当方位变成数据当沟通成为数据一切事物的数据化大数据时代大数据时代的商业变革“价值”-“取之不尽,用之不竭”的数据创新 数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。数据创新1:数据的再利用数据创新2:重组数据数据创新3:可扩展数据数据创新4:数据的折旧值数据创新5:数据废气数据创新6:开放数据给数据估值大数据时代大数据时代的商业变革“角色定位”-数据、技术与思维的三足鼎立 微软以1.1亿美元的价格购买了大
8、数据公司Farecast,而两年后谷歌则以7亿美元的价格购买了给Farecast提供数据的ITA Software公司。如今,我们正处在大数据时代的早期,思维和技术是最有价值的,但是最终大部分价值还是必须从数据本身来挖掘。大数据价值的3大构成大数据掌控公司大数据技术公司大数据思维公司和个人全新的数据中间商专家的消亡与数据科学家的崛起大数据,决定企业的竞争力大数据时代大数据时代的管理变革“风险”-让数据主宰一切的隐忧 我们时刻都暴露在“第三只眼”之下:亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的“TA”,还有我们的社交关系网。无处不在的“
9、第三只眼”我们的隐私被二次利用了预测与惩罚,不是因为“所做”,而是因为“将做”数据独裁挣脱大数据的困境大数据时代“掌控”-责任与自由并举的信息管理 当世界开始迈向大数据时代时,社会也将经历类似的地壳运动。在改变人类基本的生活与思考方式的同时,大数据早已在推动人类信息管理准则上重新定位。然而,不同于印刷革命,我们没有几个世纪的时间去适应,我们也许只有几年时间。管理变革1:隐私保护,从个人许可到让数据使用者承担责任管理变革2:个人动因VS预测分析管理变革3:打破黑盒子,大数据程序员的崛起管理变革4:企业和行业应用突破大数据时代的管理变革大数据时代正在发生的未来大数据并不是一个充斥着算法和机器的冰冷
10、世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。123大数据应用目 录大数据技术大数据时代大数据技术认知初识大数据算法与理论大数据系统与实践NoSQLHadoop大数据带来的思维变化大数据带来的价值链大数据发展现状与未来大数据 vs 人类什么是大数据大数据的特性大数据与传统技术的关系大数据与其他新兴技术的关系深入大数据技术什么是大数据 百度百科:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的
11、资讯。维基百科:大数据是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享,交叉复用形成的智力资源和知识服务能力。学术观点:大数据是由大量异构的数据组成的数据集合,它是可以应用合理的数学算法或工具从中找出有价值的信息,为人们带来利益的一门新兴学科。大数据技术2009年,甲型H1N1流感在全球爆发传播,为了发现和控制疫情,各国政府和卫生相关部门付出了巨大努力,但得到的数据仍然滞后一两周,而Google对人们的搜索的历史记录进行处理,建立合理的数学模型后,得到的预测结果与官方的数据相关性高达97%,能够立刻判断出流感是从哪里传播出来的,没有一两周
12、的滞后。Google处理了5000万条历史记录、4.5亿个不同的数学模型。什么是大数据大数据技术Farecast是一个对机票价格进行预测的公司,帮助消费者抓住最佳购买机票的时机,使乘客节省很多钱。最初预测系统建立在41天之内的12000个价格样本基础上,数据是从旅游网站上抓取的,如今已经拥有超过2000亿条飞行记录。系统只推测机票的价格何时最便宜,同时分析是什么原因导致的价格下降。FarecastBing什么是大数据大数据技术大数据的特性大数据的特征大数据技术 大数据是在传统数据库学科的分支-数据仓库与数据挖掘的基础上进一步发展起来的。但有两点比较主要的不同:结构化程度 传统数据库保存的是结构
13、化或者半结构化的数据,以二维表或者标准XML文件的方式存储数据,由于结构清晰,处理相对容易;大数据面向的是一切计算机可以存储的数据格式,包括互联网上的各种网页、图片、音频、视频,包括办公文档、报表,包括人们在搜索引擎中输入的关键词、在社交网络中的留言、喜好,也包括各种传感器自动收集的监控结果等等,显然不同的格式处理起来更加困难。异常数据的处理 传统数据库通常把异常数据先剔除,应用在需要高精确度的领域,如银行对每个账户的管理;大数据则允许异常数据存在,更多应用在预测方面,找出大量数据中隐藏的关联关系,少量异常数据不会对总体结果产生影响。大数据与传统数据库的区别大数据技术大数据、物联网、云计算、移
展开阅读全文