书签 分享 收藏 举报 版权申诉 / 17
上传文档赚钱

类型大数据简介-课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4104849
  • 上传时间:2022-11-11
  • 格式:PPTX
  • 页数:17
  • 大小:1.01MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据简介-课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 简介 课件
    资源描述:

    1、汪灏 2013.4.13大数据介绍分享大数据介绍分享什么是大数据?什么是大数据?大数据的大数据的定义定义Gartner的定义:“大数据”是需要新计算模式才能处理的,具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的4V特点:Volume:数据规模巨大(TB-PB 量级);Velocity:数据产生速度快,数据响应处理速度快;Variety:数据形式多而杂乱。多渠道、多媒体、多用途;Value:数据价值分散。单体价值低,数据量越大,价值越明显。数据的来源和去向数据的来源和去向Analytical SystemsReporting SystemsBusiness

    2、 IntelligenceCorporate Performance ManagementDataWarehouseData MartsPortal/Dashboard 建模建模识别识别置信置信级联级联监管监管集成集成多源数据集多源数据集数据交换数据交换 平台平台BI&Reporting数据仓库数据仓库分析型分析型系统系统操作型系统操作型系统智能设备智能设备大数据兴起的原因大数据兴起的原因海量信息的出现海量信息的出现 互联网的普及导致信息供应的社会化和即时化趋势 智能控制和联网设备的增加提供了大量的实时控制信息 多媒体技术的成熟导致信息形态的多元化呈现相关技术的成熟到位相关技术的成熟到位 不断

    3、升级换代的网络技术保证了数据存取的响应速度 日趋低廉的存储成本为大数据的保存提供了可能 云计算等技术的出现极大提高了数据处理性能快速获取信息的需求快速获取信息的需求 个人和企业面对海量的数据面临选择困难 数据而非经验越来越成为决策的重要依据 信息获取的速度有时比质量更重要供应供应需求需求能力能力大数据的产业链大数据的产业链数据生产方数据保有方数据处理方数据消费方大大数据带来哪些变革?数据带来哪些变革?思维变革思维变革关注数据的全体,而不是样本 抽样样能节省分析时间,但也有无法预知的风险 技术进步使得基于全体的分析成为可能关注数据的数量,而不是个体的质量 规模化的数据可以抵消单一数据的低质量问题

    4、 多来源、多媒体的数据提供了多样化的价值 数据的非结构化恰恰是其自然形态的表现关注数据的量化关系,而不是逻辑关系 存在即合理。事实比推理分析和专家建议更可靠。不是每一种关联性都能容易找到逻辑关系“知其然,而不知其所以然”也能提供巨大的商业价值技术变革技术变革云计算:云计算:把集中的运算分散开来把集中的运算分散开来物联网:物联网:把分散的设备连在一起把分散的设备连在一起H Hadoopadoop:把大数据切:把大数据切成小模块成小模块大大数据带来的风险和挑战数据带来的风险和挑战数据隐私谁有权使用我们的个人信息?电信?淘宝?QQ?政府有权滥用个人信息吗?Big data is big brothe

    5、r?!如何适当有效地披露公众信息?数据安全数据量大,黑客就不容易找到攻击方向了吗?仅仅隐匿某些信息能够保证数据不被盗用吗?一切都在网上,谁来监督数据安全公司?数据暴力洞悉过去就可以预知未来吗?有意图就一定会去做吗?客观数据能完全替代人的主观感受吗?如何应用大数据?如何应用大数据?Market Basket AnalysisMarket Basket AnalysisSupport(A B)=transactions containing every item in A and B all transactionsSupport(C-A)=2/5=0.4 ABCACDBCDADEBCEFrom

    6、BiMBA MIS Course PPT by Leida Chen推荐引擎示例推荐引擎示例基于年龄和性别的推荐基于内容的推荐基于用户的协同过滤的推荐基于项目的协同过滤推荐京东京东通过大通过大数据挖掘进行关联营销数据挖掘进行关联营销购物篮购物篮/协同过滤算法协同过滤算法 交叉购买规交叉购买规律律 近邻聚类分析近邻聚类分析/预测模型预测模型 个性化购个性化购买规律买规律推荐页面区块的推荐页面区块的A/B测试测试京东后台系京东后台系统统(商品图片、库存、价格、促销信息)京东推荐系统ACN RulesJD Rules跟踪指标跟踪指标ADO 采用线上采用线上A/B测试的方式实际优化规则测试的方式实际优

    7、化规则项目项目KPI:推荐所带来推荐所带来的平均客单的平均客单价提升价提升辅助辅助KPI:推荐销售额推荐销售额/销售量的销售量的占比提升占比提升推荐商品转推荐商品转化率提升化率提升 关联推荐是通过客户行为,分析算法导出推荐规则,在京东主商品页面进行实时的关联推荐,用以推动业务指标提升-通过一系列数据挖掘算法挖掘客户的购买规律-再将推荐规则输入至现有推荐系统-持续优化业务指标数字营销数字营销汉莎航空提供多个维度让客户选择和打分基于客户偏好推荐汉莎航空基于客户偏好推荐航班汉莎航空基于客户偏好推荐航班NetflixNetflix在在“纸牌屋纸牌屋”上的成功上的成功基于3300万订阅用户观看习惯的大数据分析BBC已获成功的热播题材金牌导演David Fincher老戏骨主演Kevin Spacey

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据简介-课件.pptx
    链接地址:https://www.163wenku.com/p-4104849.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库