Sqoop的安装与配置

1.上传解压Sqoop

bash 复制代码
tar -zxf ../software/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

1.1配置环境变量

bash 复制代码
export SQOOP_HOME=/opt/module/sqoop-1.4.7
export PATH=$PATH:$SQOOP_HOME/bin

使得环境生效

bash 复制代码
source /etc/profile

查看版本信息sqoop version

1.2 配置sqoop-env.sh

bash 复制代码
export HADOOP_COMMON_HOME=/opt/module/hadoop-3.1.4
export HADOOP_MAPRED_HOME=/opt/module/hadoop-3.1.4
export HIVE_HOME=/opt/module/hive-3.1.2
export HIVE_CONF_DIR=/opt/module/hive-3.1.2/conf
export HBASE_HOME=/opt/module/hbase-2.2.2
export HBASE_CONF_DIR=/opt/module/hbase-2.2.2/conf
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HIVE_HOME/lib/*:$HBASE_HOME/lib/hbase-*.jar:$HBASE_HOME/lib/zookeeper-*.jar

1,3配置sqoop需要的mysql驱动

mysql驱动程序

将mysql-connector-java-5.1.32-bin.jar放入sqoop的lib目录

bash 复制代码
cp /opt/software/mysql-connector-java-5.1.32-bin.jar /opt/module/sqoop-1.4.7/lib/

记得启动zookeeper(zkServer.sh start)也许会要用到

测试连接mysql数据库 列出mysql的所有数据库

8.0+

bash 复制代码
sqoop list-databases --connect jdbc:mysql://localhost:3306/?allowPublicKeyRetrieval=true --username root --password yourPassword1234!

5.7+

bash 复制代码
sqoop list-databases --connect jdbc:mysql://master:3306/ --username root -P	
password( yourPassword1234!)

上述需要免密登录测试连接数据库列出mysql的所有数据库就需要在./etc/my.cnf加上密码验证跳过验证[mysqld] skip-grant-tables 然后重启mysql服务即可 systemctl restart mysqld

sql 复制代码
GRANT ALL PRIVILEGES ON *.* TO 'root'@'master' IDENTIFIED BY 'yourPassword1234!' WITH GRANT OPTION;
FLUSH PRIVILEGES;

然后试试重新连接mysql数据库并列出mysql的所有数据库

bash 复制代码
sqoop list-databases --connect jdbc:mysql://master:3306/ --username root -P

输入自己密码(yourPassword1234!)即可列出mysql的所有数据库

2. Sqoop常用操作

2.1 数据迁移

确保启动了集群

bash 复制代码
[root@slave2 ~]# 
sqoop import \
>--connect jdbc:mysql://slave2:3306/sqoop_db \
>--username root \
>--password yourPassword1234! \
>--table emp \
>--columns id,name,deg,salary,dept \
>--target-dir /sqoop_demo1 \
>--num-mappers 1



进入mysql切换sqoop_db在emp插入一条数据

sql 复制代码
insert into sqoop_db.emp values ('1209','itcast','java dev','15000','AC');
bash 复制代码
[root@slave2 ~]# sqoop import \
> --connect jdbc:mysql://slave2:3306/sqoop_db \
> --username root \
> --password yourPassword1234! \
> --target-dir /sqoop \
>--table emp \
>--columns id,name,deg,salary,dept \
> --num-mappers 1 \
> --incremental append \
> --check-column id \
> --last-value 1205


2.2使用sqoop的where语句

bash 复制代码
sqoop import --connect jdbc:mysql://slave2:3306/sqoop_db --username root --password yourPassword1234! --table emp_add --columns id,hno,street,city --where "city='beijing'" --target-dir /sqoop/city_beijing --num-mappers 1

2.3 sqoop导出

进入mysql切换sqoop_db数据库

创建表

sql 复制代码
create table if not exists sqoop_db.emp_export
            (
               id int(11) not null ,
               name varchar(100) default null,
               deg varchar(100) default null,
               salary int(11) default null,
               dept varchar(10) default null,
               primary key (id)
            );
bash 复制代码
sqoop export --connect jdbc:mysql://slave2:3306/sqoop_db --username root --password yourPassword1234! --table emp_export --export-dir /sqoop/part-m-00000 --num-mappers 1 --columns "id,name,deg,salary,dept"
相关推荐
芯片智造1 天前
晶圆划片UV胶带的作用和构造是什么?
经验分享·半导体·芯片制造·光刻胶
Heart_to_Yang1 天前
Telnet 调试屏幕输出信息卡死问题解决
网络·windows·经验分享
我有医保我先冲1 天前
企业级会议管理工具选型指南:从需求分析到方案落地
人工智能·经验分享·自然语言处理·需求分析
AI科技星1 天前
统一场论质量定义方程:数学验证与应用分析
开发语言·数据结构·经验分享·线性代数·算法
我是宝库1 天前
Turnitin系统查英文AI率多少为正常?报告显示星号*%怎么办?
人工智能·经验分享·aigc·毕业论文·英文专业·turnitin系统·英文查重
weixin_537217061 天前
机器学习资源合集
经验分享
梦里不知身是客111 天前
hive中metastore 服务的意义
数据仓库·hive·hadoop
计算机毕业编程指导师1 天前
【Python大数据选题】基于Spark+Django的电影评分人气数据可视化分析系统源码 毕业设计 选题推荐 毕设选题 数据分析 机器学习
大数据·hadoop·python·计算机·spark·django·电影评分人气
梦里不知身是客111 天前
hiveserver2服务的作用和启动
hive
x***B4111 天前
Spring Boot 实战项目如何写进简历?经验分享
经验分享·spring boot·后端