书签 分享 收藏 举报 版权申诉 / 44
上传文档赚钱

类型大数据解决方案V1044课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:3737693
  • 上传时间:2022-10-08
  • 格式:PPT
  • 页数:44
  • 大小:12.44MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据解决方案V1044课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 解决方案 V1044 课件
    资源描述:

    1、北京荣之联大数据解决方案目录n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造业应用大数据畅想n 案例大数据大数据时代到来时代到来IDC预测全球的数据使用量到2020年会增长44倍,达到35.2ZB(1ZB=10亿TB)宽带、移动网络普及和提速宽带、移动网络普及和提速移动网络和各种智能终端移动网络和各种智能终端视频视频(医疗影像、地理信息、监控录像等医疗影像、地理信息、监控录像等)统计、分析、预测、实时处理传感器、传感器、RFIDRFID阅读器、导航终端等非传统阅读器、导航终端等非传统ITIT设备设备社交网络社交网络(Facebook,Twitter,(Faceboo

    2、k,Twitter,微博等微博等)数据处理思维转变数据处理思维转变少量的样本数据数据关系力求明确清晰探求难以捉摸的因果关系要求数据精确无误全量数据乐于接受数据的纷繁复杂转而关注事物的关联关系数据的精确不是那么重要了 谷歌翻译系统为了训练其系统,收集其能找到的所有翻译;谷歌收集了上万亿页的语料库,包括质量参差不齐的文档;上万亿的语料库,相当于950亿句英语;相对而言,谷歌的翻译质量还是最好的;谷歌翻译之所以更好,不是因为它拥有一个更好的算法机制,而是增加了各种各样的数据,包括有错误的数据;在谷歌的翻译团队中,大多数工程师并不懂其翻译出来的语言;数据处理思维转变数据处理思维转变传统数据分析思维大数

    3、据分析思维案例一 聘请了20多名书评家和编辑组成的团队,在网页上创立“亚马逊的声音”向客户推荐新书,写书评;通过客户的购买历史,寻找客户的相似性,对客户分群进行产品推荐,推荐的总是与以往购买的相似或略有区别;通过大量的数据分析,找出书籍之间的关联关系,即“item-to-item”,时亚马逊发生了天翻地覆的变化。AMAZON销售额的三分之一来自于“item-to-item”的推荐系统。AMAZON最终放弃了在线书评,书评团队被解散。案例二数据处理思维转变数据处理思维转变数据处理思维转变 关联关系,预测的关键。很多时候,知道“是什么”就够了,没必要知道“为什么”。一旦我们完成了“关联关系”分析,

    4、我们就可以继续向更深层次研究因果关系,找出背后的“为什么”沃尔玛:请把蛋挞和飓风用品摆在一起,请把啤酒和尿片摆在一起;某信用评分公司,利用Facebook的社交圈来预测个人偿还债务的可能性;对冲基金通过分析Twitter微博的数据文本,作为股市投资的信号;某信用评分公司,利用Facebook的社交圈来预测个人偿还债务的可能性;对冲基金通过分析Twitter微博的数据文本,作为股市投资的信号;其它案例大数据与大数据与BIBI融融合合*大数据的商业价值大数据的商业价值大数据大数据主要厂商主要厂商大型企业和机构在寻求解决棘手的大数据问题时,往往会使用开源软件基础架构Hadoop的服务。由于Hadoo

    5、p深受欢迎,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop提供解决方案。Hadoop的发行版除了社区的Apache hadoop外,cloudera,IBM,ORACLE等都提供了自己的商业版本。商业版主要是提供Hadoop专业的技术支持,这对一些大型企业尤其重要。ClouderaEMCl。IBMOracle大数据生态Big Data Applications非结构化资料汇入SQL资料汇入分散式档案系统类SQL资料库系统(非即时性)分散式资料库(即时性)并行计算框架资料处理语言数据挖掘程序库目录n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造

    6、业应用大数据畅想n 案例企业大数据平台架构原则*技术-按需频度的数据获取批量和实时数据采用不同的技术手段和工具,遵循统一的文件接口标准技术-多样化数据共存跨同构/异构数据库(物理系统),基于文本、数据库的数据抽取和加载数据-数据即服务业务人员通过逻辑数据对象组件访问数据,而不用关心数据的物理存储方式。通过数据组织与前端应用功能,使业务人员可以较容易、较快地定位和了解数据的内容。数据-数据质量控制通过一系列的技术和业务手段实现数据集成平台数据质量控制,主要体现在数据正确性(技术)、完整性、一致性(业务)、有效性。大数大数据据平平台整体架台整体架构构大数大数据处理流程据处理流程a.建立对非结构化数

    7、据进行SQL语法查询的支持,实现与结构化数据的集成关联(key)主分类关键词标签地名人名全国统一分类分词,倒排搜索共性、个性文本识别处理功能模块网页分类反向搜索关键词分析日志关联内容分词索引建立索引分析日志合并用户类别标签摘要结构化元信息网页信息分类数据获取语义分析数据解析 非结构化数据数据获取结构化数据数据集市数据集市EDW结构化元数据Hadoopa.建立非结构化信息的标签、摘要、索引、日志、内容等a.提取结构化的元数据信息,如类别、标引、摘要等;实现与结构化数据的整合ODSSQL声誉度分析品牌分析服务质量分析竞争产品分析产品评价市场动态跟踪ETL网络爬虫大大数据关键技术数据关键技术大大数据

    8、关键技术数据关键技术-Hadoop-HadoopHadoopHadoop系统工作原理系统工作原理大数据关键技术大数据关键技术-网络数据获取网络数据获取分布式分布式网络爬虫网络爬虫分布式文件系统分布式文件系统分布式存储横向扩容(Scale-out)架构分布式软件架构并行计算框架大数据关键技术大数据关键技术-两种平台相互两种平台相互集成集成大数据关键技术大数据关键技术-数数据据应应用功能用功能数据查询数据统计信息检索数据分析语义分析数据挖掘经营管理市场活动市场口碑分销管理决策支持用户服务大数据关键技术-数据管控目录n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造业应用大

    9、数据畅想n 案例传统数据平台与大数据分布式传统数据平台与大数据分布式平台特性差异平台特性差异大大数据分析与传统数据分析与传统BIBI分析差异分析差异 结构化数据 数据规模一般为TB规模 集中式,为了分析进行大量数据移动,数据向计算靠近 批处理为主 结构化/非结构化混合分析的能力 数据规模从数十TB到PB级别 分布式,计算向数据靠近 支持流式分析事务关系型数据库批处理数据仓库分析集群化非结构化流式多种数据源分析(MapReduce)组织传统传统BIBI分析分析大数据分析大数据分析大大数据处理和管理体系数据处理和管理体系-多结构多结构化化大数据实施建议第一阶段:应用场景驱动的大数据开发第二阶段:各

    10、业务系统、各渠道系统等配合大数据改造优化第三阶段:管理信息体系下的大数据平台建设第四阶段(目标):以大数据驱动的,实时的、整体联动的IT解决方案Think big,start small.大处着眼,小处着手。大大数据实施方法论数据实施方法论大数据业务战略大数据建设目标大数据架构设计大数据实施大数据运维企业战略目标业务目标业务模式大数据治理目标应用场景服务模式服务对象大数据服务定义大数据信息模型大数据管理定义技术选择验证测试容量规划安装,配置验收测试系统上线大数据服务管理服务性能管理生命周期管理资源调度系统监控大数据持续改进业务调整服务改进技术升级架构优化大大数据的角色和技能数据的角色和技能目录

    11、n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造业应用大数据畅想n 案例汽车企业汽车企业ITIT的过去的过去汽车企业汽车企业ITIT的将来的将来业务挑战l产品研发周期响应长l市场扩张不够且竞争激烈l客户忠诚度不高l成本增长且利润率低业务趋势l提升客户服务,增加用户粘度l提高生产率l扩大市场份额l加强集团管控l降低成本l绿色经济新兴技术云(Cloud)移动(Mobility)社交(Social)大数据(Big Data)一体化平台客户体验(CX)汽车制造业大数据能力创新的汽车制造业大数据能力创新的方向方向部分数据开放实时/近实时封闭延时报表/KPI“大”数据更深入大数

    12、据在汽车制造企业的应用大数据在汽车制造企业的应用企业级数据行业数据跨行业数据企业传统数据供应商数据订单数据维修记录分销商数据客户数据资源数据生产数据产品数据运营数据打包价格客户行为传感器数据最终客户需求客户建议和意见竞争对手情况业界预测行业动态政策法规保险电子商务交通天气金融贷款地理位置热点事件旅游市场公共安全文化体育车饰周边微博微信共享的大数据平台深度分析高敏捷性高度可伸缩性实时市场宣传和精准营销提升客户服务和满意度把握市场需求和供应掌握车辆状态和质量提升支持管理决策和集团管控大大数据在汽车制造行业大有作数据在汽车制造行业大有作为为保证基础信息质量,保证数据揭示的信息达到最佳使用效果产品创新

    13、供应优化精准营销服务提升深入洞察客户所想,所需,所感,所在及所得通过大数据连接客户和产品通过大数据连接客户和产品加强客户和产品生命周期管理驾驶习惯喜爱偏好购买行为品牌形象市场定位营销渠道置换设计研发服务销售供应生产感知客户行为,实时精准营销感知客户行为,实时精准营销与服务与服务目录n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造业应用大数据畅想n 案例典型案例:新华社新媒体数据典型案例:新华社新媒体数据库项目库项目基于大数据与云计算技术体系理念和技术架构基础上,建立一个全新的新媒体数据库,并实现工作素材库、工作库、应用库和知识库的架构格局。为全球一体化多媒体采编与数

    14、字加工平台,新媒体多元化加工开发与集成服务平台等一系列关键业务系统提供数据存储、全文检索、数据库及其基础应用服务。全面提升新媒体数据库的应用服务能力,达到对外服务商业化的标准。整合更多的社会资源,组建知识库群,进而形成决策智库,服务于各级政府决策,提升新华社在政府决策中的影响力根据用户的兴趣特点和购买行为,实现个性化推荐,拓展了具有很大潜力的长尾客户典型案例:贵州移动用户互联典型案例:贵州移动用户互联网行为分析项目网行为分析项目随着3G爆发性增长和智能手机普及,移动互联网发展一日千里,流量猛增大大超前运营商预期,另一方面,无论在移动还是固定网络,语音通信市场目前已经趋向饱和,基于语音通信的增值

    15、业务已有明显下降的趋势;随着移动互联网的飞速发展,语音业务的经营必然被流量增值业务的经营所取代。基于用户WAP上网行为分析,实现对客户内容偏好、客户网络行为偏好和互联网标签的筛选,助力于精细化营销开展。基于互联网行为分析,洞悉客户需求,将客户细分为娱乐、交流、学习、生活、商务、工具六大类,构建移动互联网产品标签库;通过自有互联网业务与网络热点产品进行“渗透率”、“覆盖率”、“活跃率”对比分析,构建增值业务产品市场竞争评估体系。典型案例典型案例:中国人力资源和社会保障出版集团:中国人力资源和社会保障出版集团企业培训平台企业培训平台当前,我国正处于贯彻落实“十二五”规划的关键时期和实施人才强国战略

    16、的重要时期,产业布局调整、企业升级换代进入关键阶段,许多地区和行业存在着技能劳动者供不应求的现象,尤其是在传统产业和高新技术产业领域,技能劳动者特别是高技能人才严重短缺,供需之间的结构性短缺矛盾日益突出。中国人力资源和社会保障出版集团将坚持以服务人力资源社会保障事业发展为己任,以培育人才、助力民生为工作主线,逐步打造成为我国人力资源社会保障信息交汇平台、职业教育和职业培训教材研发基地、职业安全和劳动保障知识传播中心。满足远程教育培训的需求(满足培训和教学两方面的功能需求),针对课件制作、精品课程制作提供良好便捷的设计制作平台。足集团未来信息化扩展的需求,应对日益激烈的信息数字化竞争。典型案例典

    17、型案例:中信银行信用卡中:中信银行信用卡中心心中信银行信用卡中心充分利用银行的内部资源,自2007年发卡至今,凭借强大的安全保障、便捷的还款方式、优质的客户服务以及持续丰富的刷卡优惠活动,中信平安信用卡已从竞争日趋白热化的国内信用卡市场中异军突起。发卡量增长迅速:2008年发卡约500万张,2010年增加了一倍。业务数据增长迅速:随着业务的迅猛增长,业务数据规模也线性膨胀。数据存储、系统维护、数据有效利用都面临巨大压力。实时的商业智能 可以结合实时、历史数据进行全局分析,风险管理部门现在可以每天评估客户的行为,并决定对客户的信用额度在同一天进行调整;原有内部系统、模型整体性能显著提高秒级营销提

    18、供了统一的客户视图,更有针对的进行营销。2011年,中信银行信用卡中心通过其数据库营销平台进行了1286个宣传活动,每个营销活动配置平均时间从2周缩短到2-3天。EMC Green PlumCloudera HadoopInformatica PowerCenterIBM SPSS分布式架构与关系型数据库的结合,实现结构化与非机构化数据的存储与处理多数据源(30+)整合,数据交换平台建设创建客户统一视图,客户全方位挖掘分析。营销活动管理的闭环应用典型案例:迪信通库存优化项典型案例:迪信通库存优化项目目提供了库存优化的解决方案。建立的销量预测模型,实现了对周期采购的合理指导。实现了销量预测准确率

    19、校验、库存周转效果校验、缺货校验等功能。迪信通是国内市场占有率最高的通讯连锁零售企业,库存量偏高、库存周转率低一直是困扰企业的难题。迪信通库存优化项目是通过大数据分析和挖掘技术实现手机销量的准确预测,根据预测结果指导采购人员合理采购,从而达到降低库存量,提高库存周转的目的。通过库存优化模型,降低了企业的库存量,提高了库存周转率。为企业的采购提供了科学依据,提升了企业的采购管理、库存管理能力。Cloudera HadoopSASBirt典型案例典型案例:国金证券营销活动:国金证券营销活动管理平台管理平台国金证券股份有限公司是中国证券监督管理委员会核准的七家合规试点证券公司之一,公司现有客户超过3

    20、0万户,托管的证券市值和保证金超过280亿元。随着规模的不管扩大,企业对信息化建设的要求也在不断提高。国金证券希望满足业务创新对营销活动管理的要求,实现智能化的营销决策支持、多步骤多渠道的活动流程管理、精细化的客户信息管理、高度自动化的系统执行。在数据层采集交易系统、CRM系统、HR系统、EBOSS系统、呼叫中心系统的数据,建立客户、员工、产品统一视图,为了满足后续业务的扩展,比如实现融资融券、股指期货、资产管理等相关系统数据的采集和对接。营销活动管理系统的功能包括活动统一视图、营销活动上线前管理、营销活动执行管理、营销活动评估、客户营销活动360度视图、渠道系统对接等。自动对接外围系统,包括

    21、互动短信、彩信平台、EDM、电销、微信平台、股票终端,进行对客户的接触。业务人员自助式的通过简单建模对大量的营销历史数据进行多维数据分析和数据挖掘。为智能化的营销管理提供支持客户360度视图查询客户接触信息的统一管理市场营销活动的统一视图管理市场营销活动全生命周期的流程管理自动化的渠道系统对接Oracle 11g RACCloudera HadoopInformatica PowerCenterIBM SPSS典型案例典型案例:华大基因项目:华大基因项目随着华大基因信息化建设工作的不断深入,业务系统不断建设和深化应用,为了充分利用各应用系统积累的数据资源,提升企业的数据利用水平,实现基于综合数

    22、据的科学辅助决策。全面整合华大基因现有业务系统数据,建立面向分析的企业级数据仓库和灵活可扩展的BI展现系统的任务已经迫在眉睫。随着不断发展的华大科研和资源体系,对科学管理提出了更高的要求;随着不断增长的客户需求和市场前景,对科学决策提出了更高的要求;不断壮大的华大业务和员工队伍,对科学运营提出了更高的要求。整合离散的业务数据,实现数据挖掘;直观展现集团运营状况和市场变化;建立BI系统,实现科学决策Oracle 11gINFORMATICA 9.5TABLEAU 8.1构建企业级数据仓库平台和企业级数据展现平台通过对业务数据的分析使决策者及时精确的掌握公司整体运营状况,并对未来经营状况和发展规划进行科学决策对其他主要业务系统的数据全面整合,进行多维度的关联加工汇总,提供及时准确的全面运营数据展现。更多思想期待碰撞

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据解决方案V1044课件.ppt
    链接地址:https://www.163wenku.com/p-3737693.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库