ETL-开源ETL工具-KETTLE-介绍课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《ETL-开源ETL工具-KETTLE-介绍课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ETL 开源 工具 KETTLE 介绍 课件
- 资源描述:
-
1、北京久其软件股份有限公司2009年2月6日久其通用数据管理平台ETL开源工具介绍北京久其软件股份有限公司2009年2月6日Kettle介绍Kettle介绍Kettle是一个开源的ETL工具,包括了4个部分。Chef 任务(job)设计工具(GUI方式)Kitchen 任务(job)执行器(命令行方式)Spoon 转换(transform)设计工具(GUI方式)Span 转换(transform)执行器(命令行方式)目前的版本已经看不到Chef的影子了,因为在Spoon里面包含了设计Job的功能。看来Kettle是将设计工具全部集成在了Spoon上面。而Spoon也包括了Job和Transfor
2、m的执行功能。北京久其软件股份有限公司2009年2月6日北京久其软件股份有限公司2009年2月6日使用前的准备工作运行环境:JDK 1.5或更高下载安装:可访问http:/kettle.pentaho.org去下载最新版本。运行程序:Spoon.bat运行Spoon程序,包括了转换和任务的设计和执行。Spoon.sh是Linux等平台的运行命令。资 料 库:存储定义的转换和任务的数据库连接。关于资料库Kettle存储转换和任务有两种方式,一是利用xml存储成文件,二是直接存储到数据库,也就是Kettle的资料库中。在启动Spoon后,首先会弹出资料库的选择界面,在这个界面中可以选择要使用的资料
3、库,也可以创建或修改资料库。当然也可以选择不使用资料库。选择了资料库后,转移和任务将会被存储到数据库中。如果选择不使用资料库,则需要通过文件的方式对转换和任务进行读取和保存。北京久其软件股份有限公司2009年2月6日北京久其软件股份有限公司2009年2月6日定义转换定义北京久其软件股份有限公司2009年2月6日1.Value:Value 是行的一部分,并且是包含以下类型的的数据:Strings、floating point Numbers、unlimited precision BigNumbers、Integers、Dates、或者Boolean。2.Row:一行包含0 个或者多个Value
4、s。3.Output Stream:一个Output Stream 是离开一个步骤时的行的堆栈。4.Input Stream:一个Input Stream 是进入一个步骤时的行的堆栈。5.Step:转换的一个步骤,可以是一个Stream或是其他元素。6.Hop:一个Hop 代表两个步骤之间的一个或者多个数据流。一个Hop 总是代表着一个步骤的输出流和一个步骤的输入流。7.Note:一个Note 是一个转换附加的文本注释信息。定义任务定义北京久其软件股份有限公司2009年2月6日1.Job Entry:一个Job Entry 是一个任务的一部分,它执行某些内容。2.Hop:一个Hop 代表两个步
5、骤之间的一个或者多个数据流。一个Hop 总是代表着两个Job Entry 之间的连接,并且能够被原始的JobEntry 设置,无条件执行下一个Job Entry,直到执行成功或者失败。3.Note:一个Note 是一个任务附加的文本注释信息。北京久其软件股份有限公司2009年2月6日数据库连接Kettle支持目前主流的大多数数据库。在程序中可能用到数据库连接的地方有资料库,以及转换的输入输出流。数据库连接Kettle支持对数据库连接的可视化操作,即为数据库浏览器,可以通过图形界面的方式浏览大多数异构数据源。北京久其软件股份有限公司2009年2月6日数据库连接Preview first 100
6、rows of table(显示表最开始的100行)Preview first rows of table(根据你输入的行数展示表)Number of rows of table(显示表的行数)Show layout of the table(显示表结构)Generate DDL(生成该表的DDL语句)Generate DDL for other connection(在其它的数据库连接中生成该表的DDL 语句)Open SQL for table(在SQL 编辑器中生成读取该表的SQL 语法)Truncate table table:(生成“Truncate table”的语句)北京久其软件
展开阅读全文