书签 分享 收藏 举报 版权申诉 / 51
上传文档赚钱

类型大数据时代概述.课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2297400
  • 上传时间:2022-03-31
  • 格式:PPT
  • 页数:51
  • 大小:1.04MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据时代概述.课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 时代 概述 课件
    资源描述:

    1、大大 数数 据据 时时 代代生活、工作与思维的生活、工作与思维的大变革大变革作者作者 作者:【英】维可托作者:【英】维可托.迈尔迈尔-舍恩伯舍恩伯格格 肯尼斯肯尼斯.库克耶库克耶译者:周涛译者:周涛维克托维克托迈尔迈尔-舍恩伯格(舍恩伯格(Viktor Mayer-Schnberger),被誉为),被誉为“大数据时代的预言家大数据时代的预言家”,也,也是最受人尊敬的权威发言人之一。现任牛津大学网络是最受人尊敬的权威发言人之一。现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,新加坡国立学肯尼迪学院信息

    2、监管科研项目负责人,新加坡国立大学信息政策研究中心主任。一百多篇论文公开发表大学信息政策研究中心主任。一百多篇论文公开发表在科学自然等著名学术期刊上。在科学自然等著名学术期刊上。备受众多世界知名企业、机构和国家政府高层信备受众多世界知名企业、机构和国家政府高层信赖的信息权威与智囊。他的咨询客户包括微软、惠普赖的信息权威与智囊。他的咨询客户包括微软、惠普和和IBM等全球顶级企业;他是欧盟互联网官方政策背等全球顶级企业;他是欧盟互联网官方政策背后真正的制定者与参与者,也是世界经济论坛、马歇后真正的制定者与参与者,也是世界经济论坛、马歇尔计划基金会等重要机构的咨询顾问;还先后担任新尔计划基金会等重要

    3、机构的咨询顾问;还先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。他所著的删层、迪拜及中东政府高层的咨询顾问。他所著的删除一书,获得美国政治科学协会颁发的除一书,获得美国政治科学协会颁发的“唐唐K普赖普赖斯奖斯奖”,以及媒介环境学会颁发的,以及媒介环境学会颁发的“马歇尔马歇尔麦克卢汉麦克卢汉奖奖”。肯尼斯肯尼斯库克耶(库克耶(Kenneth Cukier),经济学),经济学人数据编辑,曾任职于华尔街日报(亚洲版)人数据编辑,曾任职于华尔街日报(亚洲版)和国际先驱论坛报。他是美国外交关系协会成员,和国际先驱论

    4、坛报。他是美国外交关系协会成员,CNN、BBC和和NPR的定期商业和技术评论员之一。的定期商业和技术评论员之一。Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.目 录引 言第一部分:大数据时代的思维变革第二部分:大数据时代的商业变革第三部分:大数据时代的管理变革结 语引 言一场生活、工作与思维的大变革 大数据开启了一次重大的时代转型。就想望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大

    5、数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发大数据,变革公共卫生大数据,变革商业大数据,变革思维大数据,开启重大的时代转型预测,大数据的核心大数据,大挑战大数据大数据何为大?何为大?数据度量数据度量1Byte = 8 Bit1KB = 1,024 Bytes1MB = 1,024 KB = 1,048,576 Bytes1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes1TB = 1,024 GB = 1,048,576 MB = 1,099,511,627,776 Bytes1PB = 1,02

    6、4 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes1EB = 1,024 PB = 1,152,921,504,606,846,976 Bytes1ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes1YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes大数据大数据红楼梦含标点87万字(不含标点853509字)每个汉字占两个字节:1汉字=16bit = 2*8位=2bytes1GB 约等于671部红楼梦1TB 约等于631,903 部1PB

    7、约等于647,068,911部美国国会图书馆藏书(151,785,778册)(2011年4月:收录数据235TB )1EB = 4000倍美国国会图书馆存储的信息量一天之间,互联网上要发生多少事一天之间,互联网上要发生多少事每天有29402940亿亿封电子邮件发出,如果这些是纸质信件,在美国需要花费两年两年时间处理;每天有200200万万篇博客在网上发布,这些文章相当于时代杂志刊发770770年年的总量;每天有2.52.5亿亿张照片上传至社交网站Facebook,如果都打印出来,摞在一起能有8080个个埃菲尔铁塔埃菲尔铁塔那么高;每天有86.486.4万小时万小时视频被上传至视频网站Youtu

    8、be,相当于不间断播放视频9898年年;每天有1.871.87亿个小时亿个小时的音乐会在流媒体音乐网站Pandora上播放,如果一一台电脑从公台电脑从公元元年就开始播放这些音乐会,到现在还没完没了地接着放元元年就开始播放这些音乐会,到现在还没完没了地接着放;谷歌翻译每天处理的文字数量,每天翻译次数达十亿次十亿次,相当于一百万册图书一百万册图书,超过了全世界的专业翻译人员一年一年能够翻译的文字规模;百度每天的关键词搜索量5050亿亿,谷歌33.333.3亿亿;淘宝天猫双11那一天营业额达571571亿人民币亿人民币。中国小商品城全年成交额才580.03580.03亿元亿元人民币人民币;累积起来,

    9、互联网一天之内产生的信息总量,可以装满1.681.68亿张亿张DVDDVD光盘。未来:物联网每天产生的数据将会是海量的。GBTBPBEBZB地球上至今总共的数据量地球上至今总共的数据量:在2006 2006 年,个人用户才刚刚迈进TBTB时代,全球一共新产生了约180EB180EB的数据;在2011 2011 年,这个数字达到了1.8ZB1.8ZB。而有市场研究机构预测:到2020 2020 年,整个世界的数据总量将会增长44 44 倍,达到35.2ZB35.2ZB(1ZB=10 1ZB=10 亿TBTB)!)!1PB = 250字节1EB = 260字节1ZB = 270字节大数据时代的爆炸

    10、增长大数据时代的爆炸增长想驾驭这庞大的数据,我们必须了解大数据的特征。大数据 = 海量数据 + 复杂类型的数据大数据包括:交易数据和交互数据集在内的所有数据集大数据的构成大数据的构成海量交易数据:企业内部的经营交易信息主要包括联机交易数据和联机分析数据,是结构化的、通过关系数据库进行管理和访问的静态、历史数据。通过这些数据,我们能了解过去发生了什么。海量交互数据:源于Facebook、Twitter、LinkedIn及其他来源的社交媒体数据构成。它包括了呼叫详细记录CDR、设备和传感器信息、GPS和地理定位映射数据、通过管理文件传输Manage File Transfer协议传送的海量图像文件

    11、、Web文本和点击流数据、科学信息、电子邮件等等。可以告诉我们未来会发生什么。海量数据处理:大数据的涌现已经催生出了设计用于数据密集型处理的架构。例如具有开放源码、在商品硬件群中运行的Apache Hadoop。1. VolumeVolume2. VarietyVariety3. value4. VelocityVelocity结构化数据、半结构化数据和非结构化数据如今的数据类型早已不是单一的文本形式,订单、日志、音频,对处理能力提出了更高的要求沙里淘金,价值密度低以视频为例,一部一小时的视频,在连续不间断监控过程中,可能有用的数据仅仅只有一两秒。如何通过强大的机器算法更迅速地完成数据的价值“

    12、提纯”是目前大数据汹涌背景下亟待解决的难题实时获取需要的信息大数据区分于传统数据最显著的特征。如今已是ZB时代,在如此海量的数据面前,处理数据的效率就是企业的生命大数据是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合什么是什么是Big DataBig Data数据量巨大全球在2010 年正式进入ZB 时代,IDC预计到2020 年,全球将总共拥有35ZB 的数据量大数据大数据变革公共卫生变革公共卫生2009年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,确定了

    13、45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。预测,是大数据的核心,准确的预测是最大的竞争力预测,是大数据的核心,准确的预测是最大的竞争力大数据带来大挑战!大数据带来大挑战!让数据来说话让数据来说话一切专家的经验只是来源于判断和估一切专家的经验只是来源于判断和估算,而大数据分析是精算算,而大数据分析是精算.一、大数据时代的思维

    14、变革一、大数据时代的思维变革更多“更多”不是随机样本,而是全体数据 当数据处理技术已经发生翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。一切都改变了,我们需要的是所有的数据,“样本总体”。让数据“发声”小数据时代的随机采样,最少的数据获得最多的信息全数据模式,样本总体一、大数据时代的思维变革更杂“更杂”不是精确性,而是混杂性 执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是有框架且能适用于传统数据库的。如果不能接受混乱,剩下95%的非框架数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。允许不精确大数据的简单算法比小数据的复杂算法更有效纷

    15、繁的数据越多越好混杂性,不是竭力避免,而是标准途径新的数据库设计的诞生 无所不包的谷歌翻译系统无所不包的谷歌翻译系统IBM在名为 Candide 的项目上花费了大概十年的时间,将大约有300万句之多的加拿大议会资料译成了英语和法语并出版。翻译的标准非常高,投入资金也很多,但取得的成效不大,最终被迫停止了该项目。 而谷歌翻译利用更大更杂的数据库(上万亿的语料库),也就是全球的互联网。它吸收了它能找到的所有翻译,还会去寻找联合国等国际组织发布的译本。尽管其输入源很混乱,但较其他翻译系统而言,谷歌的翻译质量相对而言还是最好的,而且可翻译的内容更多。大数据的简单算法比小数据的复杂算法更有效。大数据的简

    16、单算法比小数据的复杂算法更有效。一、大数据时代的思维变革更好“更好”不是因果关系,而是相关关系 知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。关联物,预测的关键“是什么”,而不是“为什么”改变,从操作方式开始大数据,改变人类探索世界的方法 相关关系的核心是量化两个数据值之间的数理关系。 相关关系强是指当一个数据值增加时,另一个数据值很有可能也会增加。 相关关系弱就意味着当一个数据值增加时,另一个数据值几乎不会发生变化沃尔玛,请把蛋挞与飓风用品摆在一起沃尔玛,请把蛋挞与飓风用品摆在一起2004年,沃尔玛对历史交易记录这个庞大的

    17、数据库进行了观察,这个数据库记录的不仅包括每一个顾客的购物清单以及消费额,还包括购物篮中的物品、具体购买时间,甚至购买当日天气等。沃尔玛公司注意到,每当在季节性飓风来临之前,不仅手电筒销量增加了,而且POP-Tarts蛋挞的销量也增加了。因此当季节性风暴来临时,沃尔玛会把库存的蛋挞放在靠近飓风用品的位置,以方便行色匆匆的顾客从而增加销量。关联物,预测的关键关联物,预测的关键美国折扣零售商塔吉特与怀孕预测美国折扣零售商塔吉特与怀孕预测塔吉特公司在完全不和准妈妈对话的前提下成功的预测了一个女性会在什么时候怀孕。公司分析团队首先查看了签署婴儿礼物登记簿的女性的消费记录,登记簿上的妇女会在怀孕大概第三

    18、个月的时候买很多无香乳液。几个月之后,她们会买一些营养品,比如镁、钙、锌。公司最终找出了大概20多种关联物,这些关联物可以给顾客进行“怀孕趋势”评分。这些相关关系甚至使得零售商能够比较准确地预测预产期,这样就能够在孕期的每个阶段给客户寄送相应的优惠券,这才是塔吉特公司的目的。美国折扣零售商塔吉特与怀孕预测美国折扣零售商塔吉特与怀孕预测杜西格在习惯的力量一书中讲到了接下来发生的事情。一天,一个男人冲进了一家位于明尼阿波利斯市郊的塔吉特商店,要求经理出来见他。他气愤地说:“我女儿还是高中生,你们却给她邮寄婴儿服和婴儿床的优惠券,你们是在鼓励她怀孕吗?”而当几天后,经理打电话向这个男人致歉时,这个男

    19、人的语气变得平和起来。他说:“我跟我的女儿谈过了,她的预产期是8月份,是我完全没有意识到这个事情的发生,应该说抱歉的人是我。”关联物,预测的关键关联物,预测的关键大数据的核心大数据的核心 建立在相关关系分析法基础上的预测!二、大数据时代的商业变革二、大数据时代的商业变革数据化“数据化”一切皆可“量化” 大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚光灯打向“I”,开始关注信息本身了。数据,从最不可能的地方提取出来数据化,不是数字化量化一切,数据化的核心当文字变成数据当方

    20、位变成数据当沟通成为数据一切事物的数据化大数据的大数据的早期早期实践实践曾经,一位美国海军军官在上任为图表和仪器厂负责人时,利用以前海军的航海日志、地图和图表等数据整理成全新的航海图,整合之后,这些数据显示出了更有价值的模式,也提供了更有效的航海路线。多年后,当他前去到欧洲为他绘制的图表寻求国际支持的时候,四个国家授予了他爵士爵位,包括梵蒂冈在内的其他八个国家还颁给了他金牌。即使到今天,美国海军颁布的导航图上仍然有他的名字。莫里的导航图,大数据的最早实践之一莫里的导航图,大数据的最早实践之一数据,从最不可能的地方提取出来数据,从最不可能的地方提取出来日本先进工业技术研究所的教授越水重臣所做的一

    21、个研究就是一个人的坐姿。很少有人会认为一个人的坐姿能表现出什么信息,但其实当一个人坐着的时候,他的身形、姿势和重量分布都可以量化和数据化。研究者通过在汽车座椅下部安装总共360个压力传感器以测量人对椅子施加压力的方式。把人体坐姿特征转化成了数据,并且用0256这个数值范围对其量化,这样就会产生独属于每个乘车者的精确数据资料。数据,从最不可能的地方提取出来数据,从最不可能的地方提取出来这个研究并不愚蠢。这项技术可以作为汽车防盗系统安装在车上。有了这个系统之后,汽车就能识别出驾驶者是不是车主,如果不是,系统就会要求司机输入密码;如果司机无法准确输入密码汽车就会自动熄火。把一个人的坐姿转化为数据后,

    22、这些数据就孕育出了一些切实可行的服务和一个前景光明的产业。比方说,通过汇集这些数据,我们可以利用事故发生之前的一些姿势变化情况,分析出坐姿和行驶安全之间的关系。这个系统同样可以在司机疲劳驾驶的时候发出警示或者自动刹车。同时,这个系统不但可以发现被盗车辆,而且可以通过收集到的数据识别出盗贼的身份。日本教授的坐姿研究与汽车防盗系统日本教授的坐姿研究与汽车防盗系统收集用户地理位置数据的能力收集用户地理位置数据的能力 当方位变成数据当方位变成数据从个人层面上来说,根据他所居住的地点和他要去的地方的预测数据,可以为他提供定制广告。而且,这些信息汇集起来可能会揭示事情的发展趋势。公司可以利用大量的位置数据

    23、预测交通情况,你也许无法想象,这是通过高速公路上的手机而不是汽车的数量和移动速度预测出来的。AirSage每天通过处理来自上百万手机用户的150亿条位置信息,为超过100个美国城市提供实时交通信息。二、大数据时代的商业变革价值“价值”“取之不尽,用之不竭”的数据创新 数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。数据创新1:数据的再利用数据创新2:重组数据数据创新3:可扩展数据数据创新4:数据的折旧值数据创新5:数据废气数据创新6:开放数据给数据估值亚马逊,让数据的价值再大一点亚马逊,让数

    24、据的价值再大一点 数据的再利用数据的再利用亚马逊早期与AOL达成了一项协议,为AOL电子商务网站提供后台技术服务。在许多人眼里,这只是一个普通的外包协议,而亚马逊真正的用意在于掌握用户的数据:他们在看什么、买什么。“这些数据可以帮助亚马逊提高它的推荐引擎性能。”亚马逊前首席科学家韦斯岸一语道破。可怜的AOL从来没有意识到这一点,只看到了销售这个基本用途所带来的利益,而聪明的亚马逊却知道如何从二次利用中获利。验证码和数据的再利用验证码和数据的再利用 ReCaptchaReCaptcha与数据再利用与数据再利用为了区分计算机和人类的辨识程度,冯安创作了验证码,但是,当他意识到每天有这么多人要浪费1

    25、0秒钟的时间输入这堆恼人的字母,而随后大量的信息被随意地丢弃时,他找到了能使人的计算能力得到更有效利用的方法,即ReCaptcha。在这里数据的主要用途是证明用户是人,但它也有第二个目的:破译数字化文本中不清楚的单词。2009年谷歌收购了冯安的公司,并将这一技术用于图书扫描项目。丹麦癌症协会:手机是否增加致癌率丹麦癌症协会:手机是否增加致癌率 重组数据重组数据丹麦拥有1985年手机推出以来所有手机用户的数据库,同时记录了所有癌症患者的信息。结合这两个数据集后,研究人员开始寻找两者的关系。两个数据集都采用了严格的质量标准,信息的收集不存在偏差。 最重要的是,这项研究并没有基于任何样本,却很接近“

    26、样本=总体”的准则,即包括了几乎所有癌症患者和移动用户。最后,研究没有发现使用移动电话和癌症风险增加之间存在任何关系。微软与谷歌的拼写检查微软与谷歌的拼写检查 数据废气数据废气“数据废气”是用户在线交互的副产品,包括浏览了哪些页面、停留多久、鼠标光标停留的位置、输入了什么信息等。谷歌拥有世界上最完整的拼写检查器,依据的是其每天处理的30亿查询中输入搜索框中的错误拼写。谷歌的拼写检查系统显示,那些“不合标准”、“不正确”或“有缺陷”的数据也是非常有用的,因为它很可能与正确的拼写高度相关。谷歌不仅利用错别字开发了世界上最好、最新式的拼写检查器来提高搜索质量,而且将其应用于许多其他服务中,如搜索的“

    27、自动完成”功能、Gmail、谷歌文档甚至翻译系统。二、大数据时代的商业变革角色定位“角色定位”数据、技术与思维的三足鼎立 微软以1.1亿美元的价格购买了大数据公司Farecast,而两年后谷歌则以7亿美元的价格购买了给Farecast提供数据的ITA Software公司。如今,我们正处在大数据时代的早期,思维和技术是最有价值的,但是最终大部分价值还是必须从数据本身来挖掘。大数据价值的3大构成大数据掌控公司大数据技术公司大数据思维公司和个人全新的数据中间商专家的消亡与数据科学家的崛起大数据,决定企业的竞争力大数据可以变革公司的赢利模式和传统大数据可以变革公司的赢利模式和传统交流方式交流方式 大

    28、数据思维公司和个人大数据思维公司和个人如今的汽车装满了芯片、传感器和各种软件,一经启动,它们就会及时把汽车状况信息发送到制造商的电脑上。而这些设备监控到的汽车零部件的工作状况,能够在整合之后用来提高汽车的质量,因此,能够掌握这些数据的公司拥有非常大的竞争优势。德国一家汽车制造商曾通过与行业外的数据分析公司合作发现车辆配件的纰漏,通过改进软件而改进了这个零件,并且为这次改进申请了专利。然后,它把这项专利卖给了供货商,价格是很长一段时间内进行数据分析的成本的总额。 根据所提供价值不同来源,大数据价值链包括三大构成部分即:数据本身、技能与思维基于数据本身的公司:基于数据本身的公司: 这些公司拥有着大

    29、量数据或者至少可以收集到大量的数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能(Twitter公司、人人网、微博等)。这些公司拥有海量的数据,可以通过独立的公司将数据授权给别人使用。基于技能的公司:基于技能的公司:它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或者提出数据创新性用途的才能。(沃尔玛借助天睿公司)基于思维的公司:基于思维的公司:对于某些公司来说,数据和技能并不是成功的关键。挖掘数据新价值的创新思维才是这些公司脱颖而出的优势所在例如,皮特.华登(Jetpac 的联合创始人),就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行照片

    30、来为人们推荐下一次旅行目的地。三、大数据时代的管理变革二、大数据时代的管理变革风险“风险”让数据主宰一切的隐忧 我们时刻都暴露在“第三只眼”之下:亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的“TA”,还有我们的社交关系网。无处不在的“第三只眼”我们的隐私被二次利用了预测与惩罚,不是因为“所做”,而是因为“将做”数据独裁挣脱大数据的困境保护个人隐私的两种想法保护个人隐私的两种想法 第一种,使用数据时征询数据所有个人的知晓和授权。 难点:收集到的数据可能会被后续的多次利用。 第二种,模糊化与匿名化,让所有能揭示个人情况的信息都不出现在数据集

    31、里。 难点:匿名化会在数据收集越来越多和数据的相互结合关联使用时变得无效 我们的隐私被二次利用了我们的隐私被二次利用了想在大数据时代中用技术方法来保护隐私就是天方夜谭。如果所有人的信息本来都已经在数据库里,那么有意识地避免某些信息就是此地无银三百两。谷歌街景利用图像采集车丰富自己的数据,引起一些业主的不满,谷歌对这些业主的房屋或花园的影像模糊化处理,对于盗贼来说就是此地无银三百两。谷歌街景地图引发的隐私侵权谷歌街景地图引发的隐私侵权 数据独裁数据独裁麦克纳马拉从福特二世手里接过福特公司的控制权,用“数据集”的方法救活了濒临倒闭的福特汽车公司,但是也造成了汽车零件的极大浪费,他规定只有在旧车型的

    32、所有零件的存货用完之后才能生产新的车型,愤怒的生产线经理们一股脑将剩余的零件全部倒进了附近的河里。更典型而悲痛的例子是“大跃进”时期各地疯狂虚报粮食产量,以至于中央完全没有意识到20世纪60年代初可怕的饥荒,还在大量出口粮食以换取其他战略物资。数据独裁带来的危机数据独裁带来的危机 数据独裁数据独裁史蒂夫乔布斯多年来持续不断的改善Mac笔记本,以来的可能是行业分析,但他发行的iPod/iPhone和iPad靠的就不是数据,而是直觉他依赖于他的第六感。当记者问及乔布斯苹果推出iPad之前做了多少市场调研时,他那个著名的回答是这样的:“没做,消费者没有义务去了解自己想要什么。”只要得到合理的利用,而

    33、不单纯只是为了“数据”而“数据”,大数据就会变成强大的武器。卓越的才华并不依赖于数据卓越的才华并不依赖于数据二、大数据时代的管理变革掌控“掌控”责任与自由并举的信息管理 当世界开始迈向大数据时代时,社会也将经历类似的地壳运动。在改变人类基本的生活与思考方式的同时,大数据早已在推动人类信息管理准则上重新定位。然而,不同于印刷革命,我们没有几个世纪的时间去适应,我们也许只有几年时间。管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任管理变革2:个人动因VS预测分析管理变革3:击碎黑盒子,大数据程序员的崛起管理变革4:反数据垄断大亨管理变革管理变革1 1:让数据使用者承担责任:让数据使用者承

    34、担责任管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任。数十年来,全球范围内的隐私规范都开始让人们自主决定是否、如何以及经由谁来处理他们的信息,把这种控制权放在了人们自己手中,这也是隐私规范的核心准则。在互联网时代,这个伟大的理想往往会演变成“告知与许可”的公式化系统。在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于数据使用者为其行为承担责任,而不是将重心放在收集数据之初取得个人同意上。管理变革管理变革2 2:个人动因:个人动因VSVS预测分析预测分析管理变革2:个人动因VS预测分析在大数据时代,关于公正的概念需要重新定义以维护个人动因的想法:人们选择自我行为

    35、的自由意志。简单地说,就是个人可以并应该为他们的行为而非倾向负责。通过保证个人动因,我们可以确保政府对我们行为的评判是基于真实行为而非单纯依靠大数据分析。从而,政府只能依法对我们过去的真实行为进行追究,而不可以追究大数据预测到的我们的未来行为。管理变革管理变革3 3:击碎黑盒子,大数据算:击碎黑盒子,大数据算法师的崛起法师的崛起管理变革3:击碎黑盒子,大数据算法师的崛起。大数据的运作是在一个超出我们正常理解的范围之上的。我们能看到大数据预测、运算法则和数据库有变为黑盒子的风险,这个黑盒子不透明、不可解释、不可追踪,因而我们对其信心全无。社会发展出现过很多这种情况,当一个特定领域变得特别复杂和专

    36、门化之后,就会催生出对运用新技术的专门人才的迫切需求。管理变革管理变革4 4:反数据垄断大亨:反数据垄断大亨管理变革4:反数据垄断大亨。为了确保给大数据提供一个与早期技术领域情况相当的活跃的市场环境,我们应该实现数据交易,比如通过授权和协同合作的方式。但是,这就引发了一个问题:精心达到平衡的数据独有权,是否能让社会大众从中获利?反垄断法遏制了权力的滥用。然而令人惊奇的是,这些条例能从一个领域完美转移到另外一个领域,并且适用于不同类型的网络产业。这种不带任何偏袒的强有力的规章非常实用,因为它提供的是一个平等的竞争平台,一开始便没有任何优劣之分。结 语正在发生的未来 大数据并不是一个充斥着算法和机

    37、器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。思考思考1.工业工程的基础是什么?工业工程的基础是什么?2.在工作中如何收集数据?在工作中如何收集数据?3.如何让数据发声,产生价值?如何让数据发声,产生价值?4.大数据能在哪些工作中运用?大数据能在哪些工作中运用?。大数据总结大数据总结数数据化:一切皆可量化据化:一切皆可量化更多:主体更多:主体数数据据风险风险:让数让数据主宰一切据主宰一切隐忧隐忧思思维维变变革革更更杂杂:混:混杂杂性性更好:相更好:相关关关关系系管理变革管理变革掌控:掌控:责责任任与与自由自由并举并举价价值值:数数据据创创新新角色定位:角色定位:数数据、技据、技术术与与思思维维的三足鼎立的三足鼎立商商业业变变革革 谢谢观赏! “凡是过去,皆为序曲”读完此书,我们对大数据的认识才刚刚开始。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据时代概述.课件.ppt
    链接地址:https://www.163wenku.com/p-2297400.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库