如何查看Impala集群的状态和日志

使用Impala Shell
- 登录到任何集群节点，通过Impala Shell可以查询集群状态。执行命令 invalidate metadata; 可以强制Impala重新加载元数据，有助于识别任何元数据同步问题。此外，可以运行简单的SQL查询（如 SELECT * FROM some_table LIMIT 1;）来测试连接和查询功能。
Impala Web UI
- 访问Impala的Web界面可以直观地查看集群状态、查询历史、性能指标等。
- 访问Catalogd UI ：在EMR控制台或直接通过集群IP和端口访问Catalogd组件的Web UI。通常端口号可能是25020，具体取决于你的集群配置。进入 /metrics 标签页查看详细信息。
- Impala Daemon UI：如果有配置，也可以通过Impalad的Web界面（通常端口是25000或25005）查看特定节点的运行状态。
Statestored状态
- 通过Statestored守护进程的状态可以了解所有Impalad实例的健康状况。尽管直接访问Statestored的Web UI不太常见，但可以通过Impala的管理命令或日志来间接判断其状态。

日志文件位置
- Impala的日志文件通常位于每个节点的特定目录下，例如 /var/log/impala/。具体路径可能因安装配置不同而有所差异。
- 主要有三类日志：Impalad（Impala守护进程）、Statestored（状态存储守护进程）和Catalogd（元数据服务）的日志。
查看日志内容
- 使用SSH登录到集群中的任一节点，然后使用文本编辑器（如vim或less）查看相关日志文件。
- 例如，查看Impalad的日志可以使用 less /var/log/impala/impalad.INFO，具体文件名可能包含日期和时间戳，如 impalad.INFO.20240614。
日志分析
- 日志中通常包含了查询执行的详细信息、错误消息、警告和其他诊断信息。如果遇到问题，可以搜索关键词如 "ERROR"、"WARN" 或具体的错误码来定位问题。
- 使用grep、awk等命令行工具可以帮助快速筛选和分析日志内容。

impala-admin 工具 ：Impala提供了一些管理命令，如 impala-admin 可以用来收集诊断信息，运行健康检查等。
impala-shell 的 SHOW 命令 ：在Impala Shell中使用 SHOW 命令可以查看集群的许多信息，如 SHOW DATABASES;, SHOW TABLES;, SHOW FUNCTIONS; 等。