书签 分享 收藏 举报 版权申诉 / 33
上传文档赚钱

类型大数据实时计算Flink-SQL架构介绍课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:2849331
  • 上传时间:2022-06-03
  • 格式:PPTX
  • 页数:33
  • 大小:1.45MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据实时计算Flink-SQL架构介绍课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 实时 计算 Flink SQL 架构 介绍 课件
    资源描述:

    1、大数据实时计算 Flink SQL 架构介绍技术创新 变革未来目目 录录1Background2Flink SQL 基本概念3Flink SQL 核心功能4Flink SQL 优化5阿里云流计算产品BackgroundAlibaba Blink阿里巴巴阿里巴巴Blink团队有团队有 20+ flinkcontributor,6 名名 committer,向社区贡向社区贡献了数百个献了数百个Commit+=Apache FlinkAlibabas ImprovementsBlinkAlibaba BlinkBlink Runtime+ Flink SQL=团队工作团队工作主导制定主导制定 Fli

    2、nk SQL 语义语义 DynamicTable 2016-2017 Retraction 2016-2017完完善善 Flink SQL 功能功能 Agg, Join, Window 2017 跑通全部 TPCH Query 2018性能提升性能提升 大量的查询优化 2017-2018资源配置自动化资源配置自动化 2018贡献社区贡献社区贡献社区贡献社区部分贡献社区部分贡献社区Flink SQLWhy SQL?DeclarativeOne Query, One ResultOptimizedUnderstandableStableUnifySQL 不是为流设计的不是为流设计的没有Retrac

    3、tion批计算查询返回一个结果并结束数据是有限的数据是有限的批处理批处理流数据是无穷的流数据是无穷的流上的查询不断产生结果且不会结束有对历史数据的修改(Retraction)流处理流处理动态表动态表(Dynamic Table)动态表(Dynamic Table):数据会随着时间变化的表动态表动态表 + 连续查询连续查询连续查询(Continuous Query):持续运行的查询StreamStreamStreamStream连连续续查查询询StreamStreamStreamStream连连续续查查询询连续查询连续查询StreamStream流计算流计算 Retraction流计算流计算 R

    4、etraction世界上不需要所谓的世界上不需要所谓的 Stream SQL标准的标准的 ANSI SQL 就可以用来定义流计算就可以用来定义流计算Flink SQL 核心功能核心功能DDL & DMLUDF/UDTF/UDAFWindow AggJoinGroup AggOver AggLoading Data- 定义数据源表定义数据源表CREATE TABLE clicks (VARCHAR, TIMESTAMP, VARCHARuser cTime url) WITH (type = kafka,topic = click_topic,);SELECT * FROM clicksuser

    5、cTimeurlMary12:00:00./homeBob12:00:00./cartMary12:00:05./prod?id=1Saving Data- 定义数据结果表定义数据结果表CREATE TABLE last_clicks (user cTime urlVARCHAR, TIMESTAMP, VARCHAR,PRIMARY KEY (user) WITH (type = mysql,);INSERT INTO last_clicksSELECT * FROM clicksMulti OutputCREATE VIEW taobao_clicks ASSELECT * FROM cl

    6、icks WHERE url LIKE http:/%INSERT INTO mysql_result SELECT * FROM taobao_clicksINSERT INTO hbase_resultSELECT * FROM taobao_clicksCREATE TABLE mysql_clicks (user cTime urlVARCHAR, TIMESTAMP, VARCHAR,PRIMARY KEY (user) WITH (type = mysql,);CREATE TABLE hbase_clicks (user cTime urlVARCHAR, TIMESTAMP,

    7、VARCHAR,PRIMARY KEY (user) WITH (type = hbase,);Group AggregateMary1Mary2resultusercntMary3Bob1SELECTuser,COUNT(url) as cnt FROM clicksGROUP BY userclicksusercTimeurlMary12:00:00./homeBob12:00:00./cartMary12:00:05./prod?id=1Mary12:01:45./prod?id=7从历史到现在每个用户点击的次数Window Aggregate每小时每个用户点击的次数resultuser

    8、endTcntMary13:00:003Bob13:00:001Bob14:00:001Liz14:00:002Bob13:01:00./prod?id=4Liz13:30:00./cartLiz13:59:00./homeSELECTuser, TUMBLE_END(cTime,INTERVAL 1 HOURS)AS endT, COUNT(url) AS cntFROM clicksGROUP BYuser, TUMBLE(cTime,INTERVAL 1 HOURS)clicksusercTimeurlMary12:00:00./homeBob12:00:00./cartMary12:0

    9、2:00./prod?id=2Mary12:55:00./home双双流流 JOIN:支持 INNER, LEFT, RIGHT, FULL, SEMI, ANTISELECTo.orderId, o.productId, o.orderTime, s.shipTim FROM Order JOIN ShipmON o.orderOrdersorderIdproductIdorderTime53010:17:0061010:17:0591011:02:00121011:24:11ShipmentsorderIdshipTime510:55:00610:20:00911:58:001211:44

    10、:00es AS oents AS sId = s.orderIdresultorderIdproductIdorderTimeshipTime53010:17:0010:55:0061010:17:0510:20:0091011:02:0011:58:00121011:24:1111:44:00维维表表 JOIN:支持 INNER, LEFTCREATE TABLE Products ( productId VARCHAR, productName VARCHAR, price DECIMAL,PRIMARY KEY (productId), PERIOD FOR SYSTEM_TIME)

    11、WITH (type = hbase);SELECT o.*, p.* FROM Orders AS oJOIN Products FOR SYSTEM_TIME AS OF PROCTIME() AS pON o.productId = p.productId聊几个优聊几个优化化awabwbDataBaseReduced ThroughputWait for ResponseadDataBaseabcbcdSend RequestReceive RequestWaitConcurrent ProcessingIncreased ThroughputSync. IOAsync. IO异步维表

    12、JOIN异步维表 JOINCREATE TABLE Products ( productId VARCHAR, productName VARCHAR, price DECIMAL,PRIMARY KEY (productId), PERIOD FOR SYSTEM_TIME) WITH (type = hbase,async = true);SELECT o.*, p.* FROM Orders AS oJOIN Products FOR SYSTEM_TIME AS OF PROCTIME()AS pON o.productId = p.productId一行配置的改动AggAggMapMapMap如何处理数据倾斜Data-Skew如何处理数据倾斜Data-SkewAggAggMapMapMapHot!反压反压反压如何处理数据倾斜Data-SkewLocal-Global Aggregation 优化优化如何处理数据倾斜Data-SkewLocal AggLocalAggLocalAggGlobal AggGlobal AggAggAggMapMapMapMapMapMapLocal-Global AggregationSimple AggregationLocal-Global带来带来 20X的性能提升的性能提升优化前优化后阿里云流计算产品阿里云流计算产品谢谢 谢!谢!

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据实时计算Flink-SQL架构介绍课件.pptx
    链接地址:https://www.163wenku.com/p-2849331.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库