Sqoop —- 简介、原理、安装
- 1. Sqoop 简介
- 2. Sqoop 原理
- 3. Sqoop 安装
-
- 1. 下载并解压
- 2. 修改配置文件
- 3. 拷贝JDBC驱动
- 4. 验证Sqoop
- 5. 测试Sqoop是否能够成功连接数据库
1. Sqoop 简介
Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。
Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为一个Apache项目。
Sqoop2的最新版本是1.99.7。请注意,2与1不兼容,且特征不完整,它并不打算用于生产部署。
2. Sqoop 原理
将导入或导出命令翻译成mapreduce程序来实现。
在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。
3. Sqoop 安装
安装Sqoop的前提是已经具备Java和Hadoop的环境。
1. 下载并解压
- 下载地址:http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/
- 上传安装包sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz到虚拟机中
- 解压sqoop安装包到指定目录,如:
tar -zxf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/module/
2. 修改配置文件
Sqoop的配置文件与大多数大数据框架类似,在sqoop根目录下的conf目录中。
- 重命名配置文件
[fickler@hadoop102 conf]$ mv sqoop-env-template.sh sqoop-env.sh
- 修改配置文件
[fickler@hadoop102 conf]$ vim sqoop-env.sh
export HADOOP_COMMON_HOME=/opt/module/hadoop-3.1.3
export HADOOP_MAPRED_HOME=/opt/module/hadoop-3.1.3
export HIVE_HOME=/opt/module/hive
3. 拷贝JDBC驱动
拷贝jdbc驱动到sqoop的lib目录下,如:
[fickler@hadoop102 software]$ cp mysql-connector-java-5.1.37.jar /opt/module/sqoop-1.4.6.bin__hadoop-2.0.4-alpha/lib/
4. 验证Sqoop
我们可以通过某一个command来验证sqoop配置是否正确:
[fickler@hadoop102 sqoop-1.4.6.bin__hadoop-2.0.4-alpha]$ bin/sqoop help
出现一些Warning警告(警告信息已省略),并伴随着帮助命令的输出:
Available commands:
codegen Generate code to interact with database records
create-hive-table Import a table definition into Hive
eval Evaluate a SQL statement and display the results
export Export an HDFS directory to a database table
help List available commands
import Import a table from a database to HDFS
import-all-tables Import tables from a database to HDFS
import-mainframe Import datasets from a mainframe server to HDFS
job Work with saved jobs
list-databases List available databases on a server
list-tables List available tables in a database
merge Merge results of incremental imports
metastore Run a standalone Sqoop metastore
version Display version information
5. 测试Sqoop是否能够成功连接数据库
[fickler@hadoop102 sqoop-1.4.6.bin__hadoop-2.0.4-alpha]$ bin/sqoop list-databases --connect jdbc:mysql://hadoop102:3306/ --username root --password 123456
出现如下输出:
information_schema
metastore
mysql
oozie
performance_schema
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
情况描述:电脑主机有时候有声响,主要是磁盘输入输出是有声响,声音类似风扇被卡主的声音,转一会儿就卡主一下的感觉。打开d盘的文件有时候会卡主。开机自启动电脑会显示修复d盘,需要等待十几分钟才修复完毕。自动修复完毕后过一段时间还是会有磁盘的问题,拷贝磁盘文件到移动…