【Hadoop】-Hive初体验[13]

Hive体验

预先确保已经完成部署Hive,并启动了Metastore服务

可以执行:bin/hive,进入到Hive Shell环境中,可以直接执行SQL语句。

  • 创建表

create table test(id int,name string,gender string);

  • 插入数据

INSERT INTO test values(1,'海员','男'),(2,'林芝零','女'),(3,'雷恩斯','男');

  • 查询数据

select * from test;

SELECT gender, COUNT(*) AS cnt FROM test GROUP BY gender;

  • 验证SQL语句启动的MapReduce程序

打开YARN的WEB UI页面查看任务情况:http://node1:8088

  • 验证Hive的数据存储

Hive的数据存储在HDFS的:/user/hive/warehouse中

相关推荐
电商API_180079052474 分钟前
数据驱动商品运营:电商 SKU 生命周期数据分析与优化策略
大数据·数据库·人工智能
syty20205 分钟前
flink为什么需要序列化数据传递到算子
大数据·flink
Elastic 中国社区官方博客8 分钟前
使用 Elasticsearch 的 Profile API 对比 dense vector 搜索性能
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
是Judy咋!8 分钟前
Elasticsearch---集群部署(SSL + X-Pack)
大数据·elasticsearch·ssl
Dxy12393102169 分钟前
Elasticsearch 8.13.4 常用搜索操作完全指南
大数据·elasticsearch
samFuB13 分钟前
【实证分析】数智化转型对企业新质生产力的影响研究(2015-2023年)
大数据
jiedaodezhuti16 分钟前
基于yarn的flink实时流模型内存使用率高问题处理
大数据·flink
潘达斯奈基~22 分钟前
spark性能优化4:数据倾斜
大数据·性能优化·spark
天远数科23 分钟前
Node.js Crypto 模块详解:如何处理金融借贷信用风险探查加密数据交互
大数据·金融·node.js·交互
Tezign_space25 分钟前
AI 时代内容增长:靠谱内容运营解决方案的选择逻辑
大数据·人工智能·内容运营