CentOS7 Sqoop 1.4.7 安装 (Hadoop 3.3.0)

CentOS7 Sqoop 1.4.7 安装 (Hadoop 3.3.0)

1、 Sqoop 1.4.7 官网链接下载:

https://archive.apache.org/dist/sqoop/1.4.7/

2、把压缩包用mobaxterm拖到 /tools文件夹
3、解压
bash 复制代码
tar -zvxf /tools/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /training/
4、进入 /training 文件夹
bash 复制代码
cd /training
5、重命名文件夹
bash 复制代码
mv sqoop-1.4.7.bin__hadoop-2.6.0 sqoop-1.4.7
6、查看一下重命名成功没,可以看到改名为sqoop-1.4.7了
bash 复制代码
ll
7、编辑环境变量
bash 复制代码
vi ~/.bash_profile

1)加进去这个

bash 复制代码
#sqoop
export SQOOP_HOME=/training/sqoop-1.4.7
export PATH=$PATH:$SQOOP_HOME/bin

2)按esc按钮后 :wq 保存并退出文件

3)生效环境变量

bash 复制代码
source ~/.bash_profile
8、Sqoop配置

1)进去配置文件路径

bash 复制代码
cd /training/sqoop-1.4.7/conf

2)复制一份

bash 复制代码
cp sqoop-env-template.sh sqoop-env.sh

3)更改文件sqoop-env.sh

bash 复制代码
vi sqoop-env.sh

4)看清楚自己的路径是啥,把以下加进去并更改

bash 复制代码
export HADOOP_COMMON_HOME=/training/hadoop-3.3.0
export HADOOP_MAPRED_HOME=/training/hadoop-3.3.0
export HIVE_HOME=/training/hive

5)加入mysql的jdbc驱动包到sqoop的lib文件夹

链接:https://pan.baidu.com/s/1gD2M8Gr9IFOkOA4EghfWLg?pwd=32r8

9、检查是否可用

1)sqoop版本号查询

bash 复制代码
sqoop version

2)sqoop帮助查询

bash 复制代码
sqoop-help
10、测试sqoop链接Linux Mysql
bash 复制代码
sqoop list-databases --connect jdbc:mysql://192.168.163.137:3306/ --username root --password Root123!
可能报错:

Exception in thread "main" java.lang.NoClassDefFoundError:

org/apache/commons/lang/StringUtils

a)原因:

找不到类,sqoop版本是1.4.7 而commons-lang3-3.4.jar版本是3.x

b)解决办法:

解决版本问题即可,commons-lang版本改为2.x

c)点击下载百度网盘链接:

commons-lang-2.6.jar

d)替换版本的commons-lang的jar包,将2.x版本的jar复制到sqoop的lib目录下,并删除3.x版本。
e)再尝试就可以了
bash 复制代码
sqoop list-databases --connect jdbc:mysql://192.168.163.137:3306/ --username root --password Root123!
11、测试sqoop链接Windows Mysql
bash 复制代码
sqoop list-databases --connect jdbc:mysql://192.168.163.1 --username root --password Root123!
相关推荐
勇往直前plus1 小时前
ElasticSearch详解(篇一)
大数据·elasticsearch·jenkins
一只小青团4 小时前
Hadoop之HDFS
大数据·hadoop·分布式
ITVV4 小时前
hadoop-3.4.1 单机伪部署
大数据·linux·hadoop
小杜谈数4 小时前
企业BI建议--数据治理平台
大数据
谅望者5 小时前
数据分析笔记07:Python编程语言介绍
大数据·数据库·笔记·python·数据挖掘·数据分析
中国国际健康产业博览会8 小时前
2026第35届中国国际健康产业博览会探索健康与科技的完美结合!
大数据·人工智能
Lansonli9 小时前
大数据Spark(七十三):Transformation转换算子glom和foldByKey使用案例
大数据·分布式·spark
中电金信9 小时前
2025新加坡金融科技节:看AI驱动的金融转型策略与“中国方案”
大数据·人工智能·金融
武子康12 小时前
Java-174 FastFDS 从单机到分布式文件存储:实战与架构取舍
java·大数据·分布式·性能优化·系统架构·dfs·fastdfs
aitoolhub12 小时前
重塑机器人未来:空间智能驱动产业智能化升级
大数据·人工智能·深度学习·机器学习·机器人·aigc