《大数据专业英语》课件—04ETL.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《大数据专业英语》课件—04ETL.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据专业英语 数据 专业 英语 课件 04 ETL
- 资源描述:
-
1、大数据专业英语教程ETL Unit 4Contents New Words Abbreviations Phrases参考译文参考译文New WordsNew WordsNew WordsNew WordsPhrasesPhrasesAbbreviationsListening to Text AETLETL是一种数据集成,指用于整合来自多个源的数据的三个步骤(提取、转换、加载)。它通常用于构建数据仓库。在此过程中,从源系统获取(提取)数据,将其改变(转换)为可以分析的格式,并存储(加载)到数据仓库或其它系统中。提取、加载、转换(ELT)是一种替代而不是相关的方法,旨在将处理推送到数据库以提高
2、性能。参考译文参考译文1.为什么ETL很重要多年来,企业依靠ETL流程来获得数据的整合视图,以便做出更好的商业决策。如今,这种集成来自多个系统和源的数据的方法仍然是组织数据集成工具箱中的核心组件。与企业数据仓库(静态数据)一起使用时,ETL为业务提供深入的历史背景。通过提供整合视图,ETL使业务用户可以更轻松地分析与其计划相关的数据并形成报告。ETL可以提高数据专业人员的工作效率,因为它编写并重用了移动数据的流程,而无需编写代码或脚本的技术技能。随着时间的推移ETL不断发展,它可以支持像流数据这样的新集成需求。组织需要ETL和ELT将数据整合在一起,保持准确性并提供所需的审计,以便把数据入库、
3、对数据进行分析和形成报告。参考译文参考译文2.如何使用ETL核心ETL和ELT工具与其它数据集成工具以及数据管理的其它方面(例如数据质量、数据治理、虚拟化和元数据)协同工作。今天的流行用途包括以下几个方面。2.1 ETL和传统用途ETL是一种经过验证的方法,许多组织每天都依赖这种方法例如需要定期查看销售数据的零售商,或寻求准确描述索赔的医疗服务提供者。ETL可以组合并显示来自仓库或其它数据存储的交易数据,以便业务人员以他们能够理解的格式查看。ETL还用于将数据从老旧系统迁移到具有不同数据格式的现代系统。它通常用于整合来自业务合并的数据,以及从外部供应商或合作伙伴收集和加入数据。参考译文参考译文
4、2.2大数据的ETL转换和适配器获得最多数据的人获胜。虽然这不一定正确,但轻松访问广泛的数据可以为企业提供竞争优势。如今,企业需要访问各种大数据来自视频、社交媒体、物联网(IoT)、服务器日志、空间数据、开放或众包数据等。ETL供应商经常为其工具添加新变化,以支持这些新兴需求和新数据源。适配器允许访问各种各样的数据源,数据集成工具与这些适配器交互以便有效地提取和加载数据。参考译文参考译文2.3 用于Hadoop的ETL以及更多ETL已经发展到支持集成,而不仅仅是传统的数据仓库。高级ETL工具可以将结构化和非结构化数据加载并转换到Hadoop中。这些工具从Hadoop并行读取和写入多个文件,简化
5、了数据合并到公共转换过程。一些解决方案包含针对在Hadoop上运行的事务和交互数据的预构建ETL转换库。ETL还可以与跨事务系统、运营数据存储、BI平台、主数据管理(MDM)中心和云相集成。2.4 ETL和自助数据访问自助数据准备是一种快速发展的趋势,它将访问、混合和转换数据的能力交付给业务用户和其它非技术数据专业人员。这种方法可提高组织敏捷性,并使IT免于为业务用户以不同格式配置数据的负担。花费在数据准备上的时间更少,花费在洞察本质上的时间更多。因此,业务和IT数据专业人员都可以提高工作效率,组织可以扩展数据使用以做出更好的决策。参考译文参考译文2.5 ETL和数据质量ETL和其它数据集成软
展开阅读全文