CentOS7 Sqoop 1.4.7 安装 (Hadoop 3.3.0)

CentOS7 Sqoop 1.4.7 安装 (Hadoop 3.3.0)

1、 Sqoop 1.4.7 官网链接下载:

https://archive.apache.org/dist/sqoop/1.4.7/

2、把压缩包用mobaxterm拖到 /tools文件夹
3、解压
bash 复制代码
tar -zvxf /tools/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /training/
4、进入 /training 文件夹
bash 复制代码
cd /training
5、重命名文件夹
bash 复制代码
mv sqoop-1.4.7.bin__hadoop-2.6.0 sqoop-1.4.7
6、查看一下重命名成功没,可以看到改名为sqoop-1.4.7了
bash 复制代码
ll
7、编辑环境变量
bash 复制代码
vi ~/.bash_profile

1)加进去这个

bash 复制代码
#sqoop
export SQOOP_HOME=/training/sqoop-1.4.7
export PATH=$PATH:$SQOOP_HOME/bin

2)按esc按钮后 :wq 保存并退出文件

3)生效环境变量

bash 复制代码
source ~/.bash_profile
8、Sqoop配置

1)进去配置文件路径

bash 复制代码
cd /training/sqoop-1.4.7/conf

2)复制一份

bash 复制代码
cp sqoop-env-template.sh sqoop-env.sh

3)更改文件sqoop-env.sh

bash 复制代码
vi sqoop-env.sh

4)看清楚自己的路径是啥,把以下加进去并更改

bash 复制代码
export HADOOP_COMMON_HOME=/training/hadoop-3.3.0
export HADOOP_MAPRED_HOME=/training/hadoop-3.3.0
export HIVE_HOME=/training/hive

5)加入mysql的jdbc驱动包到sqoop的lib文件夹

链接:https://pan.baidu.com/s/1gD2M8Gr9IFOkOA4EghfWLg?pwd=32r8

9、检查是否可用

1)sqoop版本号查询

bash 复制代码
sqoop version

2)sqoop帮助查询

bash 复制代码
sqoop-help
10、测试sqoop链接Linux Mysql
bash 复制代码
sqoop list-databases --connect jdbc:mysql://192.168.163.137:3306/ --username root --password Root123!
可能报错:

Exception in thread "main" java.lang.NoClassDefFoundError:

org/apache/commons/lang/StringUtils

a)原因:

找不到类,sqoop版本是1.4.7 而commons-lang3-3.4.jar版本是3.x

b)解决办法:

解决版本问题即可,commons-lang版本改为2.x

c)点击下载百度网盘链接:

commons-lang-2.6.jar

d)替换版本的commons-lang的jar包,将2.x版本的jar复制到sqoop的lib目录下,并删除3.x版本。
e)再尝试就可以了
bash 复制代码
sqoop list-databases --connect jdbc:mysql://192.168.163.137:3306/ --username root --password Root123!
11、测试sqoop链接Windows Mysql
bash 复制代码
sqoop list-databases --connect jdbc:mysql://192.168.163.1 --username root --password Root123!
相关推荐
阿里云大数据AI技术34 分钟前
ODPS 十五周年实录 | 为 AI 而生的数据平台
大数据·数据分析·开源
哈哈很哈哈2 小时前
Spark 运行流程核心组件(三)任务执行
大数据·分布式·spark
我星期八休息3 小时前
大模型 + 垂直场景:搜索/推荐/营销/客服领域开发新范式与技术实践
大数据·人工智能·python
最初的↘那颗心4 小时前
Flink Stream API - 源码开发需求描述
java·大数据·hadoop·flink·实时计算
白鲸开源4 小时前
收藏!史上最全 Apache SeaTunnel Source 连接器盘点 (2025版),一篇通晓数据集成生态
大数据·数据库·开源
爱疯生活4 小时前
车e估牵头正式启动乘用车金融价值评估师编制
大数据·人工智能·金融
Lx3525 小时前
MapReduce作业调试技巧:从本地测试到集群运行
大数据·hadoop
计算机程序员小杨5 小时前
计算机专业的你懂的:大数据毕设就选贵州茅台股票分析系统准没错|计算机毕业设计|数据可视化|数据分析
java·大数据
BYSJMG5 小时前
计算机大数据毕业设计推荐:基于Spark的气候疾病传播可视化分析系统【Hadoop、python、spark】
大数据·hadoop·python·信息可视化·spark·django·课程设计
励志成为糕手6 小时前
大数据MapReduce架构:分布式计算的经典范式
大数据·hadoop·mapreduce·分布式计算·批处理