大数据的商业应用课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据的商业应用课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 商业 应用 课件
- 资源描述:
-
1、第七章大数据的商业应用7.1 国外大数据应用经典案例7.2国内大数据应用经典案例习题 1资源数量的重要性2 数据之间的相关性3任何数据都存在商机4大数据新价值的挖掘5大数据在医疗行业的应用7.1 国外大数据应用经典案例第七章 大数据的商业应用资源数量的重要性Google使用的数据,常有不完整的句子,如拼字错误、语法缺失,但正因为拥有比其他语料库多出千万倍的资料,足以盖过他的缺点。因此,进入大数据时代的第一个应用观念,就是要接受资料数量远比数据品质更重要的事实。7.1 国外大数据应用经典案例第七章 大数据的商业应用实例 Google的翻译软件涵盖了60种语言。早在20世纪90年代,IBM 的专家
2、就曾开发一套 Candide 翻译系统,采用加拿大国会的英法双语文件,大约是300万个句对,训练电脑读懂使用机率,寻找词汇库中对应的词汇,来增加翻译的精准度,把翻译转换成数学问题,但效果不明显,进展不大,最后以失败告终。若要数据精确,首先必须要扩大资料的规模,扩大数据量,提高数据在库中的选择几率。017.1 国外大数据应用经典案例第七章 大数据的商业应用数据之间的相关性研究的重点,在于找出相关性。不在于为什么会爆炸,而是哪个孔盖会爆炸。筛选出有效指标,逐步缩小问题范围,降低爆炸可能性。7.1 国外大数据应用经典案例第七章 大数据的商业应用案例 美国纽约每年都会因为地下管道火灾,付出巨大代价,路
3、面上重达140千克的铸铁孔盖更是常因闷烧爆炸,飞到几层楼高,再砸回地面,造成严重的安全事故。且纽约市的地下电缆,长度超过15万公里,足以绕地球三圈半,光曼哈顿就有超过5万多个孔盖,数量之多,就算每年定期检查,意外仍然防不胜防。负责管理此业务的爱迪生联合电力公司,找到哥伦比亚大学统计专家Cynthia Rudin协助,期望能够解决这一现状,缓解和减少不必要事故的发生。首先,他们先收集1880年到2008年管路历史数据,但是光维修孔的表达方式就有38种不同的写法,数据杂乱无章。然而研究的重点,在于找出相关性。不在于为什么会爆炸,而是哪个孔盖会爆炸。筛选出有效指标,逐步缩小问题范围,降低爆炸可能性。
4、研究小组从106个重大孔盖灾害预测指标下手,慢慢去芜存菁,最后剩下几个最有效的指标。接着他们再缩小范围,仅研究某一区的地下电缆,分析截至2008年的数据,来预测2009年的危险孔盖位置,结果小组列出的前10%的危险清单,的确有44%曾发生过严重事故,也据此找出最有相关性的几个指标。最后,研究小组发现电缆年份和过去是否发生事故是最重要的判断指标,依此原则来替市区几万个孔盖安排检查顺序。虽然答案好像显而易见,但是过去却浑然不知,直到研究小组用大数据的科学验证,大家才恍然大悟。纽约政府利用这种方式同时解决了城市住宅问题。027.1 国外大数据应用经典案例第七章 大数据的商业应用7.1 国外大数据应用
5、经典案例第七章 大数据的商业应用对于大数据而言,首先要能够接受杂乱数据,从中找出相关性,进行数据分析。当然还有另一个重点,就是任何纪录,甚至连情绪、社交图谱、搜寻轨迹,都可数据化。任何数据都存在商机案例03Foursquare 蕴含用户地域位置的打卡数据、轨迹从一个社群平台,变成有附加价值的精确市场分析数据提供商。联合包裹速递服务公司通过每台货车的无线电设备和GPS,精确知道车辆所在位置,并从累积下来的大量的行车路径,找出最佳行车路线,进行推荐。靠着大数据分析技术,UPS 一年送货里程大幅减少4800公里,等于省下300万升的油料及减少3万吨二氧化碳排放量,安全性和效率也提高了,大数据让出行变
6、得低碳环保。推特是国外一个大型社交网站,他利用人们的情绪和社交互动进行数据分析。每天至少有四亿条以上的推文,表面看来大多数推文,就像是随口嚷嚷,但却成了重要的分析指标,可以用来提前了解消费者反应,或是判断推销活动成果,不少公司都抢着要和推特(Twitter)签订数据资源的存取权。网购龙头亚马逊正是依照客户浏览的历史,来比对产品和产品的关连性,开发无人能敌的自动推荐系统。现在亚马逊上,每三笔订单,就有一笔是来自电脑推荐和定制化系统。这便是,当用户的网络轨迹成为数据资源而带来的改变,无形中推动了一个行业的发展,带动了经济增长,完成了科技革命带来的新机遇。7.1 国外大数据应用经典案例第七章 大数据
7、的商业应用7.1 国外大数据应用经典案例第七章 大数据的商业应用大数据新价值的挖掘大数据的使用,应是每个领域,每个行业和每个企业的使用,并不是某一特定行业或企业的专有技术,不要认为用大数据分析,是大公司或是科技大厂的专利,小型企业不一定要自己拥有数据,可以靠授权获得,再使用廉价云端运算平台分析。拥有大数据思维和好点子,能让公司蓬勃发展。实例04Oren Etzioni在从西雅图飞往洛杉矶参加弟弟婚礼的飞机上,发现临座几位乘客的票价都比他的便宜,打破以往觉得飞机票越早买、越省钱的想法,萌生创业点子。他开发出了预测飞机票未来是涨是跌的服务Farecast。其关键是需要取得特定航线的所有票价资讯,再
8、比对与出发日期的关联性,假设平均票价下跌,则买票的事可以暂缓,如果平均票价上升,系统就会建议立即购票。Oren Etzioni先在某个旅游网站取得 1万2000 笔票价数据作为样本,建立预测模型,接着引进更多数据,直到现在,Farecast 手中有2000 亿笔票价纪录。后来Oren Etzioni的公司被微软并购,并把这套服务结合到Bing 搜寻引擎中,平均为每位用户节省 50美元。随后被 eBay 并购的价格预测服务D,也是 Oren Etzioni的杰作。在 2012 年,开业一年的 Decide,已调查超过 250亿笔价格资讯、分析400万项产品,随时和数据库中的产品价格比对。从普查中
9、,他们发现零售业秘密,就是新产品上市时,旧产品竟不跌反涨,或异常的价格暴涨,来警告消费者先等一等,再下手。7.1 国外大数据应用经典案例第七章 大数据的商业应用7.1 国外大数据应用经典案例第七章 大数据的商业应用大数据在医疗行业的应用医保行业可以通过大数据和高级分析来获得巨大收益。医保的成本推动了对大数据驱动的医保应用系统的需求,技术决策者不会忽略大数据带来的效率提升,经济吸引力和快速的创新步伐,都能够用在医保行业中并使行业受益。许多人发现,对医保数据进行数字化和共享的新标准和激励措施,以及商用硬件产品在存储和并行处理方面的改进和价格的下降,正在导致医保行业的的大数据革命,其以更低的成本提供
10、更好的服务为目标。其中有三个案例。Valence Health:提升医保结果和财务状况、Liaison 科技:医保行业数据记录的流处理和 Novartis Genomics。7.1 国外大数据应用经典案例第七章 大数据的商业应用Valence HealthValence Health 使用MapR公司的数据融合平台(Converged Data Platform)来建立一个数据湖并作为公司主要的数据仓库。Valence每天从3000个数据输入源接收45种不同类型的数据。这些关键数据包括实验室测试结果、患者健康记录、处方、疫苗记录、药店优惠、账单和付款,以及医生和医院的账单,用来提升决策来改善医
11、保结果和财务状况。该公司快速增长的客户和日益增加的相关数据量正在压垮现有的技术基础设施。在采用MapR的解决方案之前,如果收到一个数据源发来的2千万个实验室测试结果,他们需要22个小时来处理这些数据。MapR把这个处理时间从22小时降到20分钟,并且使用更少的硬件。提升了医保结果和财务状况。7.1 国外大数据应用经典案例第七章 大数据的商业应用Liaison 科技Liaison 科技提供了一个云端解决方案来协助企业集成,管理和安全保障他的数据。他的一个垂直解决方案是针对医保行业和生命科学行业,这两个行业有2个挑战-满足HIPAA合规要求和数据格式及其展现形式的多样性。利用MapR 流,流处理将
12、系统数据记录变成了一个无限的,不可更改的数据转换日志。多样性的挑战在于,一个患者信息的记录可以有多种使用方式即文档或图,或者是查询结果,当然这取决于不同的用户,可能是制药公司,医院,诊所或医生。利用流处理实时地将数据变化输出到 MapR-DB,HBase,MapR-DB JSON文档,图和搜索数据库,用户通过文档、图和搜索数据库可以得到最新的和最适合的数据。此外,通过在 MapR 融合数据平台上开发这一服务,Liaison 可以保障所有数据模块的安全,避免了其他方案的数据和安全孤岛的问题。解决了医保行业数据记录的流处理问题。7.1 国外大数据应用经典案例第七章 大数据的商业应用 Novarti
13、s Genomics下一代基因测序(NGS)是一个经典的大数据应用,它面临双重的挑战,即巨量原始异构的数据,以及NGS最佳实践的快速变化。另外,许多前沿研究需要与外部组织的不同数据进行大量的交互。这就需要强大的工作流程工具来处理大量的原始的NGS数据,而且足够灵活以跟上快速变化的研究技术。它还需要一个方法来将这些大量外部组织的数据有意义地整合到Novartis的数据,如1000 Geomes,NIH 的 GTEx(Genotype-Tissue Expression,基因型组织表达)和 TCGA(The Cancer Genome Atlas,癌症基因组图谱)-特别是临床数据,表型性数据,实验
14、数据和其他相关数据。第七章大数据的商业应用7.1 国外大数据应用经典案例7.2国内大数据应用经典案例习题 1智慧城市2 保险行业3 智慧医疗4交通大数据5环境大数据7.2 国内大数据应用经典案例第七章 大数据的商业应用6农业13互联网大数据7 零售行业8大数据舆情分析9物流行业10房地产业11地震面前,大数据来拯救12暑假出境游大数据分析国内大数据应用场景现有基础建设原则12“智慧XX”一期建设内容(“3211+N”)37.2 国内大数据应用经典案例第七章 大数据的商业应用智慧城市现有基础面临的问题与挑战六个统一1、缺乏顶层引领,建设处于相对无序状态。2、缺乏统筹协调,智慧应用项目相对分散。3
15、、缺乏规范标准,数据整合共享难度较大。4、缺乏配套机制,运维管理体系建设有待跟进。5、缺乏保障措施,政府信息资源面临安全挑战。6、建设主体单一,社会共建模式有待探索加强。“统一网络机房”、“统一政府门户网站”、“统一电子地图”、“统一资源数据库”、“统一办公平台”统一建设管理智慧城市现有基础7.2 国内大数据应用经典案例第七章 大数据的商业应用“智慧XX”建设方案整体思路坚持“规划设计、感知设施、应用平台、数据资源”四位一体建设思路以及具体要求。智慧城市建设原则 7.2 国内大数据应用经典案例第七章 大数据的商业应用建设整体框架是在国家智慧城市建设总体框架的指导下设计的,由“7+2”构成。7是
16、指:感知层、网络层、公共设施层、数据层、交换层、智慧应用和用户层;2是指:安全与保障体系、运营与管理体系。7.2 国内大数据应用经典案例第七章 大数据的商业应用“智慧XX”一期建设内容(“3211+N”)“3211+N”中“3”指的是要尽快建成“政务云平台”、“公共数据库平台”和“公共信息平台”等3个智慧政务公共基础设施;“2”指的城市网格化指挥中心综合管理平台和“一门式”公共服务综合信息平台等2个平台;第一个“1”指的是以“智慧XX微信平台”为切入点打造1个“XX区区级移动互联网综合服务平台”;第二个“1”指的是成立1个“智慧XX”建设和维护管理中心;“N”是指分类分批推进N个智慧应用项目实
17、施。保险行业保险数据主要是围绕产品和客户进行的,典型的有利用用户行为数据来制定车险价格,利用客户外部行为数据来了解客户需求,向目标用户推荐产品。7.2 国内大数据应用经典案例第七章 大数据的商业应用保险行业对保险企业客户进行建模面临的困难1)客户细分模型。2)客户价值模型。3)客户忠诚度模型。4)受众群体的扩散模型。5)社会模型。1)数据多,整合困难。2)客户多,分析困难。3)需求多,应用困难。保险行业7.2 国内大数据应用经典案例第七章 大数据的商业应用案例 泰康保险使用大数据进行数据采集和数据统计分析项目泰康人寿蓬勃发展,业务量壮大,客户量激增,却面临以下问题:如何使用用户数据?如何了解客
展开阅读全文