Apache Pulsar-从消息系统到流原生数据平台.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《Apache Pulsar-从消息系统到流原生数据平台.pptx》由用户(无敌的果实)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Apache Pulsar-从消息系统到流原生数据平台 Pulsar 消息 系统 原生 数据 平台
- 资源描述:
-
1、从消息系统到流原数据平台-什么是Apache Pulsar20032010201220062011“Flexible Pub/Sub messagingbacked by durable log/stream storage”为什么要“造轮”没有系统能够解决遇到的问题和规模多租户百万Topics低延时持久化跨地域复制为什么要“造轮” (2)已有的系统存在问题分区模型紧耦合存储和计算,不是云原(Cloud Native)的设计存储模型过于简单,强依赖于件系统想开持久化保证数据不丢,或者,增加Topics的数量,性能下降太厉害IO不隔离:消费者在清除Backlog的时候会影响其他产者和消费者运维太
2、痛苦 - 替换机器、服务扩容都需要很漫的重新均衡数据的过程为什么要“造轮” (3)基础架构从物理机时代往容器化转型需要个新的向容器编排设计的原系统项状态2012在Yahoo内部启动,经历了数的迭代2016年九Yahoo将Pulsar开源2017年六Yahoo将Pulsar捐献给了Apache软件基会2018年九Pulsar毕业成为顶级项2353 commits - 22 Yahoo releases - 9 Apache releases23 committers from 7 companies, 59 contributors30+ companies on production简介不同在
3、哪灵活的、统的消息模型:队列 + 流云原:存储(storage)和计算(serving/messaging)分离降维:从物理分区到逻辑分Pulsar概念Pulsar概念 (2)队列 + 流流:独占式订阅流:灾备式订阅队列:共享式订阅例: Event Center例: Event Center (2)存储和计算分离分层架构: Broker s & Bookies独扩展灵活容错快速扩容分存储分区(Par tition)是逻辑上的个概念分区按照时间或者被切成分(Segment)分被打散存放到集群中的所有节点读写流程 (1)(1) 产者发送消息给Broker读写流程 (2)(2) Broker并发写N
4、个副本读写流程 (3)(3) Broker等待来于Bookies的Quorum Acks读写流程 (4)(4) Broker返回确认给产者,并投递给消费者Broker容错Bookie容错扩容分区 vs 分物理分区逻辑分区Segment 1Segment 2Segment nBrokerBrokerBrokerBrokerBrokerBroker存储和计算分离紧耦合分区(主副本)分区(拷)分布从拷)(Segment 1Segment 2Segment 2Segment 3Segment 3Segment 1. . . . . . .Segment 1Segment 2. . . .Segment
5、 nSegment nSegment nSegment n分区架构 物理分区 存储和计算紧耦合分架构 容错恢复需要拷物理分区 扩容需要迁移物理分区来达到负载均衡“ ”逻辑分区, 物理 分存储和计算分离 失效处理相互分离,快速、痛点 弹性扩容分区 vs 分https:/jack- Broker的硬盘,是不是也可以达到你要的存储和计算分离?”“多了层,是不是时延就了,性能就不好了”分区 vs 分 - Write逻辑分区物理分区BrokerBrokerBrokerBrokerBrokerBroker分区(主副本)分区拷分布从拷)()(分区 vs 分 - Tailing Read逻辑分区物理分区Bro
6、kerBrokerBrokerBrokerBrokerBroker分区(主副本)分区拷分布从拷)()(分区 vs 分 - Catch-up Read逻辑分区物理分区BrokerBrokerBrokerBrokerBrokerBroker分区(主副本)分区拷分布从拷)()(分区 vs 分 - IO隔离逻辑分区物理分区BrokerBrokerBrokerL1 CacheL2 CacheBrokerBrokerBroker分区(主副本)分区拷分布从拷)()(“太多的移动部件了,运维复杂了?”云原弹性计算和存储资源容器时代,Kubernetes化势不可挡云原架构不是为物理机设计的,是为容器化设计存储和
7、计算分离是云原的架构设计Pulsar + Kubernetes = 完美Pulsar其他特性丰富的客户端:Java, C, C+, Python, Go, WebSocket丰富的Policy:存储配额,流量控制,数据保留策略,TTL等灵活的租户控制:软件隔离,物理隔离多机房、跨地域复制:异步复制,同步复制机架感知、地域感知的数据放置策略Pulsar 2.0Pulsar是什么消息中间件 - MQ流存储、流平台 - Stream ComputingEvent CenterEvent BusEvent Gateway“实时时代的数据中台”Pulsar IOMySQLCassandraKinesis
8、MongoDBMessagingPulsar BrokersEvent ProcessingComplex StreamProcessingPulsar FunctionsStream StorageAnalyticsOtherFrameworksBookKeeperPresto SQLTiered StorageGoogle CloudStorageAzure BlobStorageAWS S3HDFSMessagingPulsar BrokersStream StorageBookKeeperTiered StorageGoogle CloudStorageAzure BlobStorag
9、eAWS S3HDFS层级存储Infinite Stream: 以“流”的式“永远”保存原始数据分区的容量不再受限充分利云存储或者现有的廉价存储(e.g. HDFS)数据统表征:客户端不需要关数据究竟存在哪层级存储Infinite Stream: 以“流”的式“永远”保存原始数据L1 Cache分区的容量不再受限充分利云存储或者现有的廉价存储(e.g. HDFS)数据统表征:客户端不需要关数据究竟存在哪L3 CacheL2 CacheSchema Registry数据是有结构的,结构也是在变化产者和消费者关于数据结构的个“合同”兼容性:向前、向后、全兼容、不兼容数据合法性的强制检查Type-S
10、afe客户端客户端与Schema Registr y进整合端到端Type Safety Broker进Schema的验证保证数据合法性Consumer consumer = clientProducer producer = client.newProducer(Schema.JSON(MyClass.class).topic(my-topic).newConsumer(Schema.JSON(MyClass.class).topic(my-topic).subscriptionName(my-subscription).subscribe();.create();producer.send(
展开阅读全文