Windows下安装Sqoop

Windows下安装Sqoop

  • 一、Sqoop简介
  • 二、Sqoop安装
    • 2.1、Sqoop官网下载
    • 2.2、Sqoop网盘下载
    • 2.3、Sqoop安装(以version:1.4.7为例)
      • [2.3.1、解压安装包到 D:\bigdata\sqoop\1.4.7 目录](#2.3.1、解压安装包到 D:\bigdata\sqoop\1.4.7 目录)
      • [2.3.2、新增环境变量 SQOOP_HOME](#2.3.2、新增环境变量 SQOOP_HOME)
      • [2.3.3、环境变量 Path 添加 %SQOOP_HOME%\bin](#2.3.3、环境变量 Path 添加 %SQOOP_HOME%\bin)
      • [2.3.4、验证 Sqoop 是否安装成功:sqoop version](#2.3.4、验证 Sqoop 是否安装成功:sqoop version)
      • [2.3.5、问题处理(找不到或无法加载主类 org.apache.sqoop.Sqoop)](#2.3.5、问题处理(找不到或无法加载主类 org.apache.sqoop.Sqoop))
        • [2.3.5.1、找不到或无法加载主类 org.apache.sqoop.Sqoop 问题处理](#2.3.5.1、找不到或无法加载主类 org.apache.sqoop.Sqoop 问题处理)
          • [2.3.5.1.1、下载 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz](#2.3.5.1.1、下载 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz)
          • [2.3.5.1.2、解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz](#2.3.5.1.2、解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz)
          • [2.3.5.1.3、把 sqoop-1.4.6.jar 文件拷贝到 D:\bigdata\sqoop\1.4.7\lib 目录中](#2.3.5.1.3、把 sqoop-1.4.6.jar 文件拷贝到 D:\bigdata\sqoop\1.4.7\lib 目录中)
      • [2.3.6、重新验证 Sqoop 是否安装成功:sqoop version](#2.3.6、重新验证 Sqoop 是否安装成功:sqoop version)

一、Sqoop简介

1.1、Sqoop是什么

Sqoop是一个用于Hadoop和结构化数据存储(如关系型数据库)之间进行高效传输大批量数据的工具。

它包括以下两个方面:

1.1.1、​可以使用Sqoop将数据从关系型数据库管理系统(如MySql)导入到Hadoop系统(如HDFS、Hive、HBase)中。

1.1.2、将数据从Hadoop系统中抽取并导出到关系型数据库(如MySql)。

1.2、底层实现原理

​ Sqoop的核心设计思想是利用MapReduce加快数据传输速度。也就是说Sqoop的导入和导出功能是通过基于Map Task(只有map)的MapReduce作业实现的。所以它是一种批处理方式进行数据传输,难以实现实时的数据进行导入和导出。

1.3、特点

优点:它可以将跨平台的数据进行整合。

缺点:它不是很灵活。

1.4、Sqoop的重要的几个关键词

import :从关系型数据库到Hadoop

export :从Hadoop到关系型数据库。

1.5、主要执行操作

Mysql-->HDFS:import
Mysql-->Hive:import
Mysql-->HBase:import
HDFS-->Mysql:export
Hive-->Mysql:export

二、Sqoop安装

本篇以 version:1.4.7 为例来演示Sqoop的安装步骤。

2.1、Sqoop官网下载

官网下载地址:http://archive.apache.org/dist/sqoop/

下载:sqoop-1.4.7.tar.gz 这个文件

2.2、Sqoop网盘下载

或者网盘下载:https://pan.baidu.com/s/1hL9ZuBxCxynRt-WCs6m6lQ?pwd=yyds

下载:sqoop-1.4.7.tar.gz 这个文件

2.3、Sqoop安装(以version:1.4.7为例)

2.3.1、解压安装包到 D:\bigdata\sqoop\1.4.7 目录

解压 sqoop-1.4.7.tar.gzD:\bigdata\sqoop\1.4.7

2.3.2、新增环境变量 SQOOP_HOME

2.3.3、环境变量 Path 添加 %SQOOP_HOME%\bin

2.3.4、验证 Sqoop 是否安装成功:sqoop version

管理员权限打开cmd命令窗口。输入:

powershell 复制代码
sqoop version

发现报错:找不到或无法加载主类 org.apache.sqoop.Sqoop

2.3.5、问题处理(找不到或无法加载主类 org.apache.sqoop.Sqoop)

2.3.5.1、找不到或无法加载主类 org.apache.sqoop.Sqoop 问题处理

解决办法:下载 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

2.3.5.1.1、下载 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
2.3.5.1.1.1、官网下载

sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 下载地址:http://archive.apache.org/dist/sqoop/1.4.6/sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

2.3.5.1.1.2、网盘下载

sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 网盘下载:https://pan.baidu.com/s/1Pb-esaxv2Rj9CwfqOwm9tA?pwd=yyds

2.3.5.1.2、解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz:

可以看到解压目录中有:sqoop-1.4.6.jar , 这个文件

2.3.5.1.3、把 sqoop-1.4.6.jar 文件拷贝到 D:\bigdata\sqoop\1.4.7\lib 目录中

将解压后的 sqoop-1.4.6.jar 文件拷贝到 D:\bigdata\sqoop\1.4.7\lib

2.3.6、重新验证 Sqoop 是否安装成功:sqoop version

至此,Windows下安装Sqoop,安装成功!

相关推荐
隔壁老登4 天前
sqoop抽数报错Every derived table must have its own alias
数据库·hadoop·sqoop
昨夜花落尽9 天前
sqoop导入hdfs,hive
hive·hdfs·sqoop
无奈ieq12 天前
Sqoop 指令语法手册
sqoop
无奈ieq15 天前
Sqoop导入数据(mysql---->>hive)
hive·mysql·sqoop
大数据魔法师17 天前
Hadoop生态圈框架部署 伪集群版(八)- Sqoop安装与配置
大数据·hadoop·sqoop
隔壁老登23 天前
sqoop import抽取数据到hdfs乱码问题
hdfs·npm·sqoop
隔壁老登25 天前
sqoop import报错java.lang.NullPointerException
java·hadoop·sqoop
在下不上天1 个月前
Sqoop的安装和配置,Sqoop的数据导入导出,MySQL对hdfs数据的操作
mysql·hdfs·sqoop
2401_890666131 个月前
(免费送源码)计算机毕业设计原创定制:Java+SSM+JSP+Ajax+MySQLSSM国外鞋服代购平台
java·javascript·ajax·课程设计·idea·sqoop·tornado
dogplays1 个月前
sqoop import将Oracle数据加载至hive,数据量变少,只能导入一个mapper的数据量
hive·oracle·sqoop