HBase的数据定义与操作

一、实验目的

  1. 理解分布式数据存储的基本概念和原理。

  2. 掌握HBase的基本操作,包括表的创建、删除、数据的查询、插入和删除等。

  3. 学习使用HBase的命令行shell工具进行数据操作。

  4. 理解HBase中的过滤查询机制。

二、实验环境准备

  1. JAVA环境准备:确保Java Development Kit (JDK) 已安装并配置好环境变量。

  2. Hadoop环境准备:安装并配置Hadoop环境,确保Hadoop的各个组件可以在伪分布式模式下运行。

三、实验教材参考

《大数据存储》,谭旭,人民邮电出版社,2022,ISBN 978-7-115-59414-3。

四、实验内容与步骤

1、创建表

设计一个简单的表结构,例如学生信息表(Students),包含两个列族:基本信息(info)和成绩信息(scores)。

使用 create 'Students', 'info', 'scores' 命令创建表

2、插入数据

向Students表中插入几条学生记录,插入至少3名学生的信息和成绩。

3、查询表数据

使用 scan 'Students' 命令查询并显示表中的所有数据。

使用 get 'Students', 'student1' 命令查询特定学生的信息。

4、过滤查询

使用过滤器查询特定条件的记录,例如查询数学成绩大于85分的学生:

scan 'Students', {COLUMNS => 'scores:math', FILTER => "ValueFilter( >, 'binary:85')"}

5、删除数据

删除一条学生记录,例如删除student1的记录:deleteall 'Students', 'student1'

6、删除表

在删除表之前,需要先禁用表:

disable 'Students'

使用 drop 'Students' 命令删除表。

相关推荐
财经资讯数据_灵砚智能5 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年4月8日
大数据·人工智能·信息可视化·自然语言处理·ai编程
JosieBook5 小时前
【数据库】为何“端边云”协同架构正在重塑大数据存储格局?
大数据·数据库·架构
SPC的存折5 小时前
3、MySQL数据库主从复制
linux·运维·服务器·数据库·mysql
眷蓝天5 小时前
MySQL数据库主从复制+MaxScale读写分离
数据库·mysql
实证小助手5 小时前
最新上市公司2011-2024年面板数据
数据库·论文笔记
一 乐5 小时前
非遗文化传承网站|基于springboot + vue非遗文化传承网站系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·论文·毕设·非遗文化传承网站
小真zzz5 小时前
搜极星:你的免费“AI内容验真器”
大数据·人工智能·ai·chatgpt·seo·geo
wanhengidc6 小时前
服务器租用的好处
大数据·运维·服务器·游戏·智能手机
祢真伟大6 小时前
TranswarpArgoDB9.4星环数据库部署
数据库
lifallen6 小时前
Flink Agents:Watermark 与事件时间 (Event Time) 在 Agent 算子中的演进分析
java·大数据·人工智能·语言模型·flink