hbase集成phoenix

1.环境

环境准备

  1. 三台节点
  2. zookeeper三节点
  3. hadoop三节点
  4. hbase三节点

2.pheonix集成

官网下载地址,需挂梯子,使用官网推荐的对应hbase版本即可

bash 复制代码
https://phoenix.apache.org/download.html

下载及解压

bash 复制代码
wget https://dlcdn.apache.org/phoenix/phoenix-5.2.0/phoenix-hbase-2.5.0-5.2.0-bin.tar.gz
tar -zxvf phoenix-hbase-2.5.0-5.2.0-bin.tar.gz
mv phoenix-hbase-2.5.0-5.2.0-bin phoenix-hbase

修改 /etc/profile 环境变量

bash 复制代码
export PHEONIX_HOME=/root/phoenix-hbase
export PHEONIX_CLASSPATH=$PHEONIX_HOME
export PATH=$PHEONIX_HOME/bin:$PATH

配置资源重载

bash 复制代码
source /etc/profile

拷贝解压包内服务端jar至hbase/lib目录

bash 复制代码
cp phoenix-server-hbase-2.5.0-5.2.0.jar ../hbase/lib/

三台节点均配置

3. 开启二级索引

修改 hbase-site.xml

bash 复制代码
<property>
	<name>hbase.regionserver.wal.codec</name>
	<value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value>
</property>

三台节点均配置

4.启动pheonix

重启hbase

bash 复制代码
./stop-hbase.sh
bash 复制代码
./start-hbase.sh

单机具体重启看上篇hbase文章

这里连接的是zookeeper地址,默认使用2181端口

bash 复制代码
sqlline.py node1,node2,node3

执行语句即可

bash 复制代码
CREATE TABLE IF NOT EXISTS "student"(
id VARCHAR primary key,
name VARCHAR,
age BIGINT,
addr VARCHAR
);

5.索引

5.1.全局索引

bash 复制代码
create index index_name on my_table(column);

在查询列只有column时快,在hbase中会单独开索引表使用一行存储,有其他列需回表

如 select columns from my_table where columns =xxx

5.2.包含索引

bash 复制代码
create index index_name on my_table(column1) include(column2);

在查询列只有 column1或column2 都快,在hbase中一条数据会使用两行存储

phoenix语法-官网

bash 复制代码
https://phoenix.apache.org/language/index.htm

5.3 本地索引

bash 复制代码
create local index index_name on my_table(columns);

columns可多个

适用于写操作频繁,会将所有信息放在一个影子列族中,读取也是范围扫描但是没有全局索引快,会直接在表中修改,不用单独创建索引表

后续命令行或者使用客户端连接即可

相关推荐
马克Markorg2 小时前
常见的向量数据库和具有向量数据库能力的数据库
数据库
Coder_Boy_4 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
2501_944934734 小时前
高职大数据技术专业,CDA和Python认证优先考哪个?
大数据·开发语言·python
helloworldandy4 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
九河云5 小时前
5秒开服,你的应用部署还卡在“加载中”吗?
大数据·人工智能·安全·机器学习·华为云
Gain_chance5 小时前
36-学习笔记尚硅谷数仓搭建-DWS层数据装载脚本
大数据·数据仓库·笔记·学习
数据知道6 小时前
PostgreSQL 故障排查:如何找出数据库中最耗时的 SQL 语句
数据库·sql·postgresql
每日新鲜事6 小时前
热销复盘:招商林屿缦岛203套售罄背后的客户逻辑分析
大数据·人工智能
qq_12498707536 小时前
基于SSM的动物保护系统的设计与实现(源码+论文+部署+安装)
java·数据库·spring boot·毕业设计·ssm·计算机毕业设计
枷锁—sha6 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全