pig、sqoop安装

1.pig安装

1.解压安装包

bash 复制代码
sudo tar -zxvf pig-0.17.0.tar.gz -C /opt
//解压安装包

2.修改文件名,授权

bash 复制代码
cd /opt
sudo mv ./pig-0.17.0 pig
sudo chown -R hadoop pig
//修改文件名并授权

3.将pig-0.17.0-src.tar.gz解压到pig目录中

bash 复制代码
sudo tar -zxvf pig-0.17.0-src.tar.gz -C /opt/pig
//将pig-0.17.0-src.tar.gz解压到pig

4.配置pig

bash 复制代码
gedit pig.properties
//配置pig.properties文件
bash 复制代码
pig -h properties

5.配置环境变量

bash 复制代码
gedit ~/.bashrc
//打开环境配置文件
bash 复制代码
export PIG_HOME=/opt/pig
export PATH=$PATH:/opt/pig/bin
export PIG_CLASSPATH=$HADOOP_HOME/conf
//添加配置
bash 复制代码
source ~/.bashrc
//使环境生效

6.检查版本

bash 复制代码
pig -version
//版本

2.pig运行实例

1.本地模式操作

1.启动本地模式
bash 复制代码
pig -x local
//启动本地模式
2.在交互界面执行操作
bash 复制代码
grunt > sh ls
//查看当前目录下文件
grunt > clear
//清空屏幕
grunt > help
//查看帮助信息
3.批处理模式执行脚本
bash 复制代码
student = LOAD '/opt/pig/student.txt' USING PigStorage(',') AS (id:int,name:chararray,city:chararray);
Dump student;
//脚本文件

bash 复制代码
pig -x local stulocal.pig
//执行

2.MapReduce模式操作

bash 复制代码
start-dfs.sh
start-yarn.sh
//开启Hadoop服务
bash 复制代码
hdfs dfs -mkdir -p /user/hadoop/pig
//创建目录
hdfs dfs -put /opt/pig/student.txt /user/hadoop/pig/
//上传
bash 复制代码
hdfs dfs -ls /user/hadoop/pig/student.txt
//查看文件
bash 复制代码
pig -x mapreduce
//启动MapRduce模式
bash 复制代码
stu1 = LOAD 'hdfs://localhost:9000/user/hadoop/pig/student.txt' USING PigStorage(',') AS (id:int, name:chararray, city:chararray);
//数据处理
bash 复制代码
# 查看加载的数据内容
Dump stu1;

# 显示数据结构(字段名和类型)
Describe stu1;

# 显示执行计划(逻辑执行流程)
Explain stu1;

# 展示执行步骤(带示例数据的流程说明)
Illustrate stu1;
bash 复制代码
# 按city字段分组,结果保存到groupstu
groupstu = GROUP stu1 by city;

# 查看分组结果
Dump groupstu;

3.sqoop安装

1.解压安装包

bash 复制代码
sudo tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt
//解压安装包

2.修改文件名,授权

bash 复制代码
cd /opt
sudo mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha sqoop
sudo chown -R hadoop sqoop
//修改文件名,授权

3.修改配置文件sqoop-env.sh

bash 复制代码
cd /opt/sqoop/conf
cat sqoop-env-template.sh >> sqoop-env.sh
gedit sqoop-env.sh
//复制一个新文件并编辑
bash 复制代码
export HADOOP_COMMON_HOME=/opt/hadoop-3.1.3
export HADOOP_MAPRED_HOME=/opt/hadoop-3.1.3
export HBASE_HOME=/opt/hbase
export HIVE_HOME=/opt/hive
export ZOOCFGDIR=/opt/zookeeper/zoo1/conf
//配置(用自己的路径)

4.配置环境变量

bash 复制代码
gedit ~/.bashrc
//打开环境配置文件
bash 复制代码
export SQOOP_HOME=/opt/sqoop
export PATH=$PATH:$SBT_HOME/bin:$SQOOP_HOME/bin
export CLASSPATH=$CLASSPATH:$SQOOP_HOME/lib
bash 复制代码
source ~/.bashrc
//使环境生效

5.拷贝驱动包

bash 复制代码
cp /mysql-connector-java-5.1.40/mysql-connector-java-5.1.40-bin.jar /opt/sqoop/lib
//拷贝安装包到目录下

6.测试与MySQL连接

bash 复制代码
service mysql start
//开启MySQL服务
bash 复制代码
 sqoop list-databases --connect jdbc:mysql://127.0.0.1:3306/ --username root -P
//建立连接

结果:

4.sqoop实际运行实例

查看数据库和表

bash 复制代码
sqoop list-databases --connect jdbc:mysql://localhost:3306 -username root -password 111111
//查看数据库

可以创建一个测试库

bash 复制代码
create database test_db;
use test_db;
create table student(id int, name varchar(20));
insert into student values(1,'张三'),(2,'李四');
//创建一个测试库
bash 复制代码
sqoop list-tables --connect jdbc:mysql://localhost:3306/test_db -username root -password 111111
//查看表
相关推荐
老王熬夜敲代码6 分钟前
解决IP不够用的问题
linux·网络·笔记
zly350024 分钟前
linux查看正在运行的nginx的当前工作目录(webroot)
linux·运维·nginx
来自于狂人25 分钟前
华为云Stack服务实例创建失败通用排查对照表(备考+生产故障定位必备)
服务器·数据库·华为云
QT 小鲜肉29 分钟前
【Linux命令大全】001.文件管理之file命令(实操篇)
linux·运维·前端·网络·chrome·笔记
问道飞鱼1 小时前
【Linux知识】Linux 虚拟机磁盘扩缩容操作指南(按文件系统分类)
linux·运维·服务器·磁盘扩缩容
egoist20232 小时前
【Linux仓库】超越命令行用户:手写C语言Shell解释器,解密Bash背后的进程创建(附源码)
linux·c语言·bash·xshell·环境变量·命令行参数·内建命令
Lenyiin2 小时前
《 Linux 修炼全景指南: 八 》别再碎片化学习!掌控 Linux 开发工具链:gcc、g++、GDB、Bash、Python 与工程化实践
linux·python·bash·gdb·gcc·g++·lenyiin
莲华君2 小时前
Bash Shell:从入门到精通
linux
风雨飘逸2 小时前
【shell&bash进阶系列】(二十一)向脚本传递参数(shift和getopts)
linux·运维·服务器·经验分享·bash
zly35002 小时前
删除文件(rm 命令 删除目录)
linux·运维·服务器