Windows下安装Sqoop

Windows下安装Sqoop

  • 一、Sqoop简介
  • 二、Sqoop安装
    • 2.1、Sqoop官网下载
    • 2.2、Sqoop网盘下载
    • 2.3、Sqoop安装(以version:1.4.7为例)
      • [2.3.1、解压安装包到 D:\bigdata\sqoop\1.4.7 目录](#2.3.1、解压安装包到 D:\bigdata\sqoop\1.4.7 目录)
      • [2.3.2、新增环境变量 SQOOP_HOME](#2.3.2、新增环境变量 SQOOP_HOME)
      • [2.3.3、环境变量 Path 添加 %SQOOP_HOME%\bin](#2.3.3、环境变量 Path 添加 %SQOOP_HOME%\bin)
      • [2.3.4、验证 Sqoop 是否安装成功:sqoop version](#2.3.4、验证 Sqoop 是否安装成功:sqoop version)
      • [2.3.5、问题处理(找不到或无法加载主类 org.apache.sqoop.Sqoop)](#2.3.5、问题处理(找不到或无法加载主类 org.apache.sqoop.Sqoop))
        • [2.3.5.1、找不到或无法加载主类 org.apache.sqoop.Sqoop 问题处理](#2.3.5.1、找不到或无法加载主类 org.apache.sqoop.Sqoop 问题处理)
          • [2.3.5.1.1、下载 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz](#2.3.5.1.1、下载 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz)
          • [2.3.5.1.2、解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz](#2.3.5.1.2、解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz)
          • [2.3.5.1.3、把 sqoop-1.4.6.jar 文件拷贝到 D:\bigdata\sqoop\1.4.7\lib 目录中](#2.3.5.1.3、把 sqoop-1.4.6.jar 文件拷贝到 D:\bigdata\sqoop\1.4.7\lib 目录中)
      • [2.3.6、重新验证 Sqoop 是否安装成功:sqoop version](#2.3.6、重新验证 Sqoop 是否安装成功:sqoop version)

一、Sqoop简介

1.1、Sqoop是什么

Sqoop是一个用于Hadoop和结构化数据存储(如关系型数据库)之间进行高效传输大批量数据的工具。

它包括以下两个方面:

1.1.1、​可以使用Sqoop将数据从关系型数据库管理系统(如MySql)导入到Hadoop系统(如HDFS、Hive、HBase)中。

1.1.2、将数据从Hadoop系统中抽取并导出到关系型数据库(如MySql)。

1.2、底层实现原理

​ Sqoop的核心设计思想是利用MapReduce加快数据传输速度。也就是说Sqoop的导入和导出功能是通过基于Map Task(只有map)的MapReduce作业实现的。所以它是一种批处理方式进行数据传输,难以实现实时的数据进行导入和导出。

1.3、特点

优点:它可以将跨平台的数据进行整合。

缺点:它不是很灵活。

1.4、Sqoop的重要的几个关键词

import :从关系型数据库到Hadoop

export :从Hadoop到关系型数据库。

1.5、主要执行操作

Mysql-->HDFS:import
Mysql-->Hive:import
Mysql-->HBase:import
HDFS-->Mysql:export
Hive-->Mysql:export

二、Sqoop安装

本篇以 version:1.4.7 为例来演示Sqoop的安装步骤。

2.1、Sqoop官网下载

官网下载地址:http://archive.apache.org/dist/sqoop/

下载:sqoop-1.4.7.tar.gz 这个文件

2.2、Sqoop网盘下载

或者网盘下载:https://pan.baidu.com/s/1hL9ZuBxCxynRt-WCs6m6lQ?pwd=yyds

下载:sqoop-1.4.7.tar.gz 这个文件

2.3、Sqoop安装(以version:1.4.7为例)

2.3.1、解压安装包到 D:\bigdata\sqoop\1.4.7 目录

解压 sqoop-1.4.7.tar.gzD:\bigdata\sqoop\1.4.7

2.3.2、新增环境变量 SQOOP_HOME

2.3.3、环境变量 Path 添加 %SQOOP_HOME%\bin

2.3.4、验证 Sqoop 是否安装成功:sqoop version

管理员权限打开cmd命令窗口。输入:

powershell 复制代码
sqoop version

发现报错:找不到或无法加载主类 org.apache.sqoop.Sqoop

2.3.5、问题处理(找不到或无法加载主类 org.apache.sqoop.Sqoop)

2.3.5.1、找不到或无法加载主类 org.apache.sqoop.Sqoop 问题处理

解决办法:下载 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

2.3.5.1.1、下载 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
2.3.5.1.1.1、官网下载

sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 下载地址:http://archive.apache.org/dist/sqoop/1.4.6/sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

2.3.5.1.1.2、网盘下载

sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 网盘下载:https://pan.baidu.com/s/1Pb-esaxv2Rj9CwfqOwm9tA?pwd=yyds

2.3.5.1.2、解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz:

可以看到解压目录中有:sqoop-1.4.6.jar , 这个文件

2.3.5.1.3、把 sqoop-1.4.6.jar 文件拷贝到 D:\bigdata\sqoop\1.4.7\lib 目录中

将解压后的 sqoop-1.4.6.jar 文件拷贝到 D:\bigdata\sqoop\1.4.7\lib

2.3.6、重新验证 Sqoop 是否安装成功:sqoop version

至此,Windows下安装Sqoop,安装成功!

相关推荐
lzhlizihang5 天前
使用DolphinScheduler调度实现sqoop增量导入时遇到 Caused by:Class QueryResult not found 错误解决
hadoop·报错·sqoop·ds
Hsu_kk11 天前
解决 Sqoop 导入 Hive 时时间字段精度丢失问题
hive·hadoop·sqoop
Yz987613 天前
使用sqoop报错
大数据·linux·数据库·hadoop·apache·big data·sqoop
lzhlizihang16 天前
使用sqoop将mysql数据导入到hive报错ClassNotFoundException、Zero date value prohibited等错误
hive·报错·sqoop
Casual_Lei23 天前
Sqoop
hive·hadoop·sqoop
slb1906231 个月前
Sqoop 数据迁移
hive·hadoop·sqoop·sqoop 数据迁移
无奈ieq1 个月前
Sqoop部署和基本操作
hadoop·sqoop
蜜獾云1 个月前
ClickHouse实时探索与实践 京东云
数据库·clickhouse·elasticsearch·database·数据库架构·sqoop·京东云
@听风吟1 个月前
大数据ETL工具(Sqoop, DataX, Kettle)对比
大数据·sqoop·etl·etl工程师
王小王-1232 个月前
基于大数据的气象数据分析与可视化系统设计与实现【爬虫海量数据,LSTM预测】
大数据·hive·爬虫·sqoop·hadoop气象分析·天气大数据分析·lstm天气预测