Hive创建外部表详细步骤

① 在hive中执行HDFS命令:创建/data目录

sql 复制代码
hive命令终端输入:
hive> dfs -mkdir -p /data;
或者在linux命令终端输入:
hdfs dfs -mkdir -p /data;

② 在hive中执行HDFS命令:上传/emp.txt至HDFS的data目录下,并命名为emp_out

sql 复制代码
Hive命令终端输入:
hive> dfs -put /emp.txt /DATA/emp_out;
或者Linux命令终端输入:
hdfs dfs -put /emp.txt /DATA/emp_out;

③ 创建外部表:emp_out

sql 复制代码
create external table emp_out(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
row format delimited fields terminated by ','
location '/data';

④ 验证:

sql 复制代码
select * from emp_out;

查询结果如下:

注意: emp.txt文件内容为:

sql 复制代码
7369,SMITH,CLERK,7902,1980-12-17,800.00,,20
7499,ALLEN,SALESMAN,7698,1981-2-20,1600.00,300.00,30
7521,WARD,SALESMAN,7698,1981-2-22,1250.00,500.00,30
7566,JONES,MANAGER,7839,1981-4-2,2975.00,,20
7654,MARTIN,SALESMAN,7698,1981-9-28,1250.00,1400.00,30
7698,BLAKE,MANAGER,7839,1981-5-1,2850.00,,30
7782,CLARK,MANAGER,7839,1981-6-9,2450.00,,10
7839,KING,PRESIDENT,,1981-11-17,5000.00,,10
7844,TURNER,SALESMAN,7698,1981-9-8,1500.00,0.00,30
7900,JAMES,CLERK,7698,1981-12-3,950.00,,30
7902,FORD,ANALYST,7566,1981-12-3,3000.00,,20
7934,MILLER,CLERK,7782,1982-1-23,1300.00,,10
相关推荐
麦聪聊数据3 小时前
企业数据流通与敏捷API交付实战(一):ETL、CDC与API调用对比
数据库·数据仓库·低代码·restful·etl
Francek Chen7 小时前
【大数据存储与管理】分布式数据库HBase:06 HBase编程实践
大数据·数据库·hadoop·分布式·hbase
二进制_博客8 小时前
使用Datax批量将mysql数据导入hive
数据库·hive·mysql
RestCloud8 小时前
2026年数据管道可观测性:ETL监控从被动告警到主动预警
数据仓库·数据安全·etl·数据集成·数据同步·数据监控
talen_hx29611 小时前
《零基础入门Spark》学习笔记 Day 10
大数据·hive·笔记·学习·spark
二进制_博客11 小时前
Spark On Hive 系统整合
大数据·hive·spark
源码之家11 小时前
计算机毕业设计:基于Python的二手车数据分析可视化系统 Flask框架 可视化 时间序列预测算法 逻辑回归 requests 爬虫 大数据(建议收藏)✅
大数据·hadoop·python·算法·数据分析·flask·课程设计
QEasyCloud202211 小时前
企业数据仓库建设:架构设计与实施方法
数据仓库
泯仲1 天前
项目实践|ETL Pipeline 完整解析:从多源文档到向量库的全链路实现
数据仓库·agent·etl·rag
被摘下的星星1 天前
Hadoop伪分布式集群搭建实验原理概要
大数据·hadoop·分布式