集群其它生态安装与配置:
Sqoop 安装包下载地址:Sqoop 官网
选择自己集群合适的版本。
tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /opt/module/
改个名称:
cd /opt/module
mv sqoop-1.4.7.bin__hadoop-2.6.0/ sqoop-1.4.7
vi /etc/profile
# 在文件末尾添加
#SQOOP_HOME
export SQOOP_HOME=/opt/module/sqoop-1.4.7
export PATH=$PATH:$SQOOP_HOME/bin
保存退出,使环境变量立即生效 source /etc/profile
。
1.切换到 Sqoop 配置文件目录
cd $SQOOP_HOME/conf
2.复制 Sqoop 环境变量模板文件
cp sqoop-env-template.sh sqoop-env.sh
3.编辑文件,指定相关路径
vi sqoop-env.sh
配置如下,根据自己的集群情况来看。
我没有装 HBase 和 Zookeper,所以只指定了 HADOOP 和 Hive 的路径,注意删掉前面的符号 #
,否则会被认为是一行注释。
拷贝 MySQL 驱动到 Sqoop 中的 lib
目录中。
cp /opt/software/mysql-connector-java-5.1.37-bin.jar $SQOOP_HOME/lib
为了后续方便操作 Hive,我们需要将 Hive 的驱动放入 Sqoop 的 lib
目录中。
cp hive-3.1.2/lib/hive-common-3.1.2.jar sqoop-1.4.7/lib/
输入 sqoop version
,出现如下版本信息表示安装成功。
现在来测试功能是否可以正常使用:
展示 MySQL 中 sys
库下的所有表。
sqoop list-tables \
--connect jdbc:mysql://localhost:3306/sys \
--username root \
--password 000000
注意改成你自己的数据库连接信息。
能查出表数据并且无报错则正常。
至此,我们的 Sqoop 就已经安装完成啦。
使用 Sqoop 时的一些警告信息真令人头大,我们可以手动去关闭掉这些警告信息。
# 切换到 Sqoop 目录
cd $SQOOP_HOME/bin
# 编辑文件
vi configure-sqoop
注释如下内容:
再次输入 sqoop version
查看:
瞬间就舒服多了,哈哈哈。
推荐看这位大佬总结的,个人觉得很详细:Sqoop基本原理及常用方法。