大数据第五天(操作hive的方式)

文章目录

操作hive的方式

hive 存储位置

hive 操作语法

创建数据表的方式

-- 创建数据库

sql 复制代码
create database if not exists test

我们创建数据库表的时候,hive是将我们的数据自动添加到数据表中,但是需要我们注意,自动添加的方式我们需要按照特定格式添加到数据库中,\001添加到数据表中的方式

我们写一个案例的方式

我们这里可以看到SOH默认的制表是\001的方式,

我们这个soh是打不出来的,我们只能通过替换的方式

创建数据表

sql 复制代码
create table student(
    id int comment "id",
    name string comment "名字",
    age int comment "年龄"
) comment "学生表";

我们将数据库上传到hive中 ,查询数据库

上传hive中

shell 复制代码
 hadoop fs -put student.txt /user/hive/warehouse/test.db/student

查数据

sql 复制代码
select * from student;

本地加载数据

sql 复制代码
load data local inpath '/root/hivedata/student.txt' into table student;

2024-04-23 17:40:35\] org.apache.hadoop.hive.ql.parse.SemanticException:Line 1:23 Invalid path ''/root/hivedata/student.txt'': No files matching path file:/root/hivedata/student.txt ![在这里插入图片描述](https://file.jishuzhan.net/article/1785642731364683778/2047cf6862bdd298c7afc3802ff5ebb8.webp) 成功解决了 刚才问题有点尴尬是这样的一个问题 我们连接是hive的hadoop03的服务器但是我们操作hadoop01服务器哎

相关推荐
SelectDB15 小时前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康1 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes1 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康2 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台3 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康3 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台4 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术4 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康4 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康5 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive