Hue:一个大数据查询工具

Hue(Hadoop User Experience)是一个用于大数据平台、数据库以及数据仓库查询的开源工具,旨在通过 Web 界面简化用户与 Hadoop 生态系统以及各种数据存储的交互。

Hue 支持的数据源包括数据库(Apache Hive、Apache Impala、MySQL、Presto、Trino、Oracle、PostgreSQL、AWS Athena、Apache Phoenix、Apache Druid、Apache Flink、ksqlDB、Google BigQuery、Materialize、Teradata、DB2、Apache Spark SQL、Azure SQL Database、MS SQL Server、Vertica、AWS Redshift、Apache Drill、SAP Sybase、SAP Hana、Apache Solr、Apache Kylin、Dask SQL、Clickhouse、Apache Kyuubi、Elastic Search、Apache Pinot DB、Snowflake、Sqlite、Google Sheets、Greenplum)、存储(HDFS、Apache Ozone、S3、Azure File Systems、GCS、HBase)、元数据(Apache Atlas)、任务调度(Apache Spark、Apache Pig、Apache Oozie、Apache YARN、Apache Sentry、Apache Knox)等。

Hue 提供了简单易用的 SQL编辑器,包含智能语法补全、查询优化以及文档支持等功能。

面板(Dashboard)可以通过拖拽方式实现交互式分析。

Hue 支持查询结果的可视化图表,饼图、折线图、柱状图、时序图、散点图、地图等。

Hue 提供了数据浏览与管理,通过数据目录搜索表和存储,快速定位和分析海量数据。

Hue 支持任务调度与监控,集成 Oozie 工作流、YARN 任务监控等功能。

用户可以分享 SQL 查询、工作流、面板等内容。

使用 Docker 快速体验 Hue 方式如下:

bash 复制代码
docker run -it -p 8888:8888 gethue/hue:latest

然后在浏览器中输入以下地址:

http://localhost:8888/

首次使用需要创建一个超级管理员账号,输入用户名和密码,点击"Create Account"创建并登录。

官方文档:https://docs.gethue.com/

相关推荐
代码匠心1 天前
从零开始学Flink:Flink SQL四大Join解析
大数据·flink·flink sql·大数据处理
武子康2 天前
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
大数据·后端·apache hive
SelectDB3 天前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康3 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes3 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康4 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台5 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康5 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台6 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术6 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark