hive在执行elect count(*) 没有数据显示为0（实际有数据）

墨卿风竹2023-12-29 15:51

set hive.compute.query.using.stats=false; 是 Hive 的一个配置选项。它的含义是禁用 Hive 在执行查询时使用统计信息。

在 Hive 中，统计信息用于优化查询计划和执行。当该选项设置为 false 时，Hive 将不会使用任何统计信息来帮助决定查询的执行计划。这可能会导致查询的执行效率下降，尤其是在处理大型数据集时。

禁用统计信息的主要原因是统计信息可能不准确或过时，或者在某些情况下，使用统计信息并不会带来明显的性能提升。因此，禁用统计信息可以使查询的执行计划更加稳定，而不会受到统计信息本身的影响。

但需要注意的是，禁用统计信息可能会导致查询的性能下降。如果你发现查询的执行速度变慢，你可以尝试重新启用统计信息来优化查询计划。

要启用统计信息，可以使用以下方式之一：

设置为 true：set hive.compute.query.using.stats=true;

使用 ANALYZE TABLE 命令生成和收集表的统计信息。

现象：

建表以location的方式加载数据，此时元数据还没有记录新的数据，当执行 count(*) 时，系统会自动到元数据中读取数据，此时元数据是没有数据的。