大数据与大数据技术ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据与大数据技术ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 ppt 课件
- 资源描述:
-
1、专注于分析预测与行业应用的的大数据公司AdvancedAnalytic Services 音智达虞强 2016.101议程u公司简介u大数据与大数据技术u大数据技术应用 u大数据案例分享u问题讨论 22022-5-243AdvancedAnalytic Services 音智达公司简介公司概况&发展历史主要客户&大数据产品3新加坡上海北京公司概况青岛雅加达专注于分析预测与行业应用的的大数据公司深圳业务1业务2业务3提供基于大数据技术的预测性分析及商务智能解决方案大数据平台、数据集成与准备工具、开源开发技术自助式分析工具、数据可视化工具提供全球顶尖的大数据软件产品300+ 技术服务人员端到端的大
2、数据平台数据集成、数据挖掘与预测性分析、高级分析企业级大数据仓库、企业绩效管理、商务智能大数据SaaS应用和DaaS服务基于云平台的软件即服务大数据应用为企业提供全面的数据服务 4发展历史数据仓库绩效管理高级分析数据可视化看板管理商务智能2.0至今2005200720112002大数据技术大数据应用分析预测数据挖掘数据即服务数据集市 14年来,我们与数俱进5汽车制造 电子产品及家电 快消零售 医药与生命科学 航空与物流 高科技制造业 金融及其他主要客户6云以 H a d o o p 为核心的大数据产品系列数据集成与准备SQL on HadoopText here流计算机器学习开源开发技术数据挖
3、掘以 H a d o o p为核心的大数据产品大数据软件产品Statistica 数据可视化Vortex7数据创新经验融合拥有多元化的数据科学家团队和十余年的数据分析经验。经十余年自主开发的IP打造数据行业领先的技术优势。 追踪吸收和引进行业内最先进的技术,产品和应用经验。世界顶尖数据技术公司在中国地区的首选合作伙伴。在一大批竞争行业(汽车、制药、快消、家电、物流等)内拥有深厚的客户基础和众多行业成功案例。追求行业业务能力和技术能力的融合以及企业系统架构与解决业务问题间的平衡,具有扎实的项目实施能力。HEADLINE 竞争优势82022-5-249AdvancedAnalytic Servic
4、es 音智达大数据与大数据技术9Hadoop技术的发展物联网应用需要将物联网应用需要将Hadoop变为一个高性能的分析平台变为一个高性能的分析平台需要Hadoop不光能存储数据,更要能够处理计算数据10SQL 分析挖掘预测图形化数据分析智能搜索时间、用户、地理位置、时间、用户、地理位置、事件事件 等标签等标签辅助技术:Kafka, HBase, Cassandra, Accumulo基于大数据技术的数据分析处理Hadoop 核心层核心层11u技术更迭过快u开源产品成熟度u开发效率u与现有架构的关系u运维与安全大数据技术的顾虑大数据平台计算框架SQLYARN传统数仓功能非结构化流式挖掘分析软件架
5、构 (举例)DATA PLATFORM(HDFS)灵活数据准备灵活数据准备SQL in Hadoop数据挖掘与预测数据挖掘与预测S Q L(ODBC、JDBC、。NET)API:Java, C/+, Python前端应用报表报表外部应用外部应用下游系统下游系统管理控制台管理控制台 (CloudEra、Talend、KNIME)数据安全以及认证(数据安全以及认证(Portal集成)集成)用工具取代代码作坊MapReducePerformance(runs on disk)OneClickSparkPerformance(runs in-memory &on disk)20XFaster同时处理实
6、时与批次流式处理批次处理转换清洗治理转换清洗治理推荐引擎Spark Streaming/KafkaSpark数据库,文件,批次数据实时,流数据HDFS文件数据流输出基于用户数据理解地模型预测u图形化数据准备挖掘u运用Spark Mlib 等进行计算 u结果回写入Impala或者HIVE非结构化数据为存储的新型SQLu 基于落地HDFS的文件或HBASE进行SQL建表解析u 提供工业MPP级别查询性能u 线性可扩展 u 标准JDBC SQL界面,直连BO,Tableau ,Qlikview, MSTR等报表工具技术方案:特点小结u 基于开源系统的成熟商用插件方案u部署简便u提高开发效率u降低实施
7、风险u基于内存的计算 性能优异u 全部基于唯一Hadoop集群内,统一存储统一计算u减少数据传输迁移的同步问题u维护便捷:一套集群,维护简单u扩展性:无限扩展 线性提升u 便捷的开发及报表展现工具u 图形化 ETL,数据挖掘开发u 便捷报表展现分析工具u 建模过程100% 用户参与u IT基础架构与用户数据准备、探查、分析、预测分离19大数据团队组织建设数据与业务的结合大数据开发团队技术平台支持业务人员咨询团队大数据管理员内部团队与专业伙伴紧密合作Evan数据科学家202022-5-2421AdvancedAnalytic Services 音智达大数据技术应用21Internet of Cu
8、stomers and Internet of ThingsInvisible devices and Wearable devicesTrillions of networked nodesLow bandwidth last-mile connectionMostly addressed by local schemesMachine-centricSensing-focusGlobal addressingUser-centricCommunication-focusLaptops / tablets / smartphones Billions of networked devices
9、High-bandwidth access22Predictive Maintenancethat enable you to change your businessHadoopMachine LearningQuery and reportingIoT 解决方案Command and ControlYou have devices on the network edgePlant FloorThingsSupply ChainThingsBack OfficeThingsBasic SensorsIntelligent Devicesthat provide you dataSQL Dat
10、abasesBlob StorageTable StorageExternal StorageDocumentDBthat you understand, apply rules, models and moreCommand andControlEvent Hub (Service Bus) 本质是基于“信息物理系统”实现“智能化”二、工业4.0时代的智能制造IoT 的本质 25二、工业4.0时代的智能制造IoT-智能工厂26p 360 Customer Profilep Micro-Segmentationpp Next Best Actionp Customer Sentiment pp
11、p关联分析行动创建客户档案创建客户档案识别共同关键词CRM账户信息及客户特征EDW交易历史社交媒体关键字整合数据并载入hadoop连接至文本挖掘应用将数据库连接至EDW连接至flat file购买周期趋势购买家庭信息购买人口特征通过API与CRM相连连接至flat file连接至flat file删除重复客户载入Hadoop在用户ID间连接数据第一阶段识别人口微簇客户画像 删除重复客户在用户ID间连接数据识别共同关键字创建客户档案创建客户档案数据流引擎数据流引擎人口分布客户倾向HADOOP 集群集群/YARN关联分析行动数据库分析数据库分析查询可视化报表查询可视化报表分析工具及应用分析工具及应
12、用HDFS/NFS低延迟查询集成服务器集成服务器BI服务器服务器数据库集群数据库集群/服务器服务器社交媒体链接数据库链接文本分割链接API链接固定文本链接文本分割链接消费心理第一阶段HDFS API数据混合与浓缩数据混合与浓缩集成引擎集成引擎ACTIAN分析平台CRM账户信息及客户特征EDW交易历史社交媒体关键字购买周期趋势购买家庭信息购买人口特征客户画像参考架构360度客户视图302022-5-2431AdvancedAnalytic Services 音智达案例分享车联网大数据应用31项目背景围绕车辆全生命周期,数据驱动的车联网与跨行业融合,可衍生出多样的商业模式与创新服务;基于丰富的车联
展开阅读全文