hive在执行elect count(*) 没有数据显示为0(实际有数据)

set hive.compute.query.using.stats=false; 是 Hive 的一个配置选项。它的含义是禁用 Hive 在执行查询时使用统计信息。

在 Hive 中,统计信息用于优化查询计划和执行。当该选项设置为 false 时,Hive 将不会使用任何统计信息来帮助决定查询的执行计划。这可能会导致查询的执行效率下降,尤其是在处理大型数据集时。

禁用统计信息的主要原因是统计信息可能不准确或过时,或者在某些情况下,使用统计信息并不会带来明显的性能提升。因此,禁用统计信息可以使查询的执行计划更加稳定,而不会受到统计信息本身的影响。

但需要注意的是,禁用统计信息可能会导致查询的性能下降。如果你发现查询的执行速度变慢,你可以尝试重新启用统计信息来优化查询计划。

要启用统计信息,可以使用以下方式之一:

设置为 true:set hive.compute.query.using.stats=true;

使用 ANALYZE TABLE 命令生成和收集表的统计信息。

现象:

建表以location的方式加载数据,此时元数据还没有记录新的数据,当执行 count(*) 时,系统会自动到元数据中读取数据,此时元数据是没有数据的。

相关推荐
en-route10 小时前
维度建模之星型模式(Star Schema)
数据仓库
en-route12 小时前
深入理解数据仓库架构:ODS、DWD、DWS 和 ADS 层的定义与应用
大数据·数据仓库
張萠飛13 小时前
hive date_format函数有性能瓶颈,有个获取时区的逻辑影响性能,具体原因分析
数据仓库·hive·hadoop
r***113315 小时前
HDFS的架构优势与基本操作
hadoop·hdfs·架构
en-route15 小时前
深入理解数据仓库设计:事实表与事实宽表的区别与应用
大数据·数据仓库·spark
2509_9408802216 小时前
Spring Boot 从 2.7.x 升级到 3.3注意事项
数据库·hive·spring boot
chde2Wang17 小时前
datagrip访问远程hive库
hive
howard200517 小时前
7.2 Hive自定义函数实战
hive·自定义函数·udf
zhixingheyi_tian18 小时前
Hadoop 之 metrics
hadoop
第二只羽毛18 小时前
单例模式的初识
java·大数据·数据仓库·单例模式