Hadoop大数据处理技术基础与实践第十章-Sq课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《Hadoop大数据处理技术基础与实践第十章-Sq课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Hadoop 数据处理 技术 基础 实践 第十 Sq 课件
- 资源描述:
-
1、-Hadoop 与RDBMS数据迁移工具-什么是什么是Sqoop? Sqoop 是实现Hadoop 与关系型数据库(RDBMS)之间进行数据迁移的工具,通过Sqoop可以简单、快速地从诸如MySQL、Oracle 等传统关系型数据库中把数据导入(import)到诸如HDFS、HBase、Hive 等。 Hadoop 分布式存储环境下,使用Hadoop MapReduce 等分布式处理工具对数据进行加工处理,然后可以将最终处理结果导出(export)到RDBMS 中。1. Sqoop的基本安装的基本安装 Sqoop 的安装非常简单,在类UNIX 系统上需要预先安装好Java 6 及其后期版本,并
2、已部署Hadoop 稳定版本的集群环境。 从网站http:/sqoop.apache.org/下载最新的Sqoop 稳定版本。Sqoop 的Apache 发行包分为源码包和已经编译好的二进制包,下面只介绍Sqoop 的二进制包安装方法。 下载Sqoop 二进制包,并解压到相应安装目录,解压后会生成子目录sqoop-x.y.z.bin(x.y.z为版本号):$ tar -xzf sqoop-x.y.z.bin.tar.gz 把sqoop-x.y.z.bin 目录移动到sqoop-x.y.z 目录:$ mv sqoop-x.y.z.bin / sqoop-x.y.z/ 设置环境变量,编辑文件/.b
3、ashrc 或/.bash_profile 把Sqoop 的安装路径添加到PATH 变量中,方便Sqoop 的使用和管理:$ export SQOOP_HOME=/home/trucy/sqoop-x.y.z$ export PATH=$PATH:$SQOOP_HOME/bin2. Sqoop的配置的配置 Sqoop 获取Hadoop 平台各相关组件的配置信息是通过读取环境变量实现的, 如获取Hadoop 相关信息可以通过读取变量$HADOOP_HOME的值,获取Hive 相关信息可以通过读取变量$HIVE_HOME的值等。修改文件/.bashrc 或/.bash_profile 配置环境变量
4、使用export 命令将上述工具的根目录添加到文件末尾;同时Sqoop 连接RDBMS 需要使用相应的数据库驱动工具,如通过JDBC 连接MySQL 需要用到mysql-connector-java-x.y.z-bin.jar 驱动程序2. Sqoop的配置的配置将MySQL 的JDBC 驱动程序mysql-connector-java-x.y.z-bin.jar 复制到$ SQOOP_HOME /lib 目录下使用sqoop 的list-databases 命令测试Sqoop 连接MySQL 是否成功:$ sqoop list-databases -connect jdbc:mysql:/m
5、ysql.server.ip:3306/ -username root -PEnter password:(输入MySQL 中root 用户密码)information_schemaemployeeshiveDBmysqltesttrucyDB2. Sqoop的配置的配置2. Sqoop的配置的配置若配置好Hadoop 相应环境变量后使用Sqoop 仍无法连接MySQL,可以执行下述操作。(1)进入$ SQOOP_HOME /conf 目录(注意第一个$为Linux 命令提示符,第二个$为系统变量取值符):$ cd $SQOOP_HOME/conf(2)复制Sqoop 读取环境变量的模板文件到
6、自定义文件:$ cp sqoop-env-template.sh sqoop-env.sh(3)编辑文件sqoop-env.sh,修改相应属性值指向相关软件安装目录,如:#Set path to where bin/hadoop is availableexport HADOOP_COMMON_HOME=/usr/local/hadoop#Set path to where hadoop-*-core.jar is availableexport HADOOP_MAPRED_HOME=/usr/local/hadoop#set the path to where bin/hbase is av
7、ailableexport HBASE_HOME=/usr/local/hbase#Set the path to where bin/hive is availableexport HIVE_HOME=/usr/local/hive#Set the path for where zookeper config dir isexport ZOOCFGDIR=/usr/local/zk3.Sqoop相关功能相关功能 Sqoop 提供了一系列工具命令(tools command),包括导入操作(import)、导出操作(export)、导入所有表(import-all-tables)、列出所有数据
8、库实例(list-databases)和列出特定数据库实例中的所有表(list-tables)等,在Linux 命令提示符下输入sqoop help 会输出Sqoop所支持的所有工具命令下面分别详细介绍Sqoop 所支持的工具命令。3.Sqoop相关功能相关功能(1)使用root 用户登录MySQL 数据库:$ mysql -u root p(2)输入root 用户密码,创建MySQL 数据库SqoopDB:mysql create database sqoopDB;(3)使用root 用户登录MySQL 数据库,创建用户bear,密码为123456: $ mysql -u root -pmy
9、sql create user bear identified by 123456;(4)授权用户bear 拥有数据库sqoopDB 的所有权限:mysql grant all privileges on sqoopDB.* to bear% identified by 123456;(5)刷新系统权限表:mysqlflush privileges; 新建一个MySQL 数据库SqoopDB 和用户bear,并授予用户bear 拥有操作数据库SqoopDB 的所有权限。 下面使用bear 用户登录MySQL 数据库,在数据库实例sqoopDB 下创建一张employees表,后面所有的Sqoo
10、p 相关操作都在SqoopDB employees 表上进行:3.Sqoop相关功能相关功能(1)使用bear 用户登录MySQL 数据库:$ mysql -u bear p(2)输入密码,进入MySQL 数据库SqoopDB:mysql use sqoopDB;(3)创建employees 表: mysql CREATE TABLE employees ( - id int(11) NOT NULL AUTO_INCREMENT, - name varchar(100) NOT NULL, - age int(8) NOT NULL DEFAULT 0, - place varchar(40
11、0) NOT NULL, - entry_time timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP, - position varchar(500), - PRIMARY KEY (id) - )ENGINE=InnoDB DEFAULT CHARSET=utf8; Query OK, 0 rows affected (0.18 sec)(4)向employees 表中插入3 条数据:mysql INSERT INTO employees(name,age,place,position) VALUES(James,27,NewYork,Manager)
展开阅读全文