hive在执行elect count(*) 没有数据显示为0(实际有数据)

set hive.compute.query.using.stats=false; 是 Hive 的一个配置选项。它的含义是禁用 Hive 在执行查询时使用统计信息。

在 Hive 中,统计信息用于优化查询计划和执行。当该选项设置为 false 时,Hive 将不会使用任何统计信息来帮助决定查询的执行计划。这可能会导致查询的执行效率下降,尤其是在处理大型数据集时。

禁用统计信息的主要原因是统计信息可能不准确或过时,或者在某些情况下,使用统计信息并不会带来明显的性能提升。因此,禁用统计信息可以使查询的执行计划更加稳定,而不会受到统计信息本身的影响。

但需要注意的是,禁用统计信息可能会导致查询的性能下降。如果你发现查询的执行速度变慢,你可以尝试重新启用统计信息来优化查询计划。

要启用统计信息,可以使用以下方式之一:

设置为 true:set hive.compute.query.using.stats=true;

使用 ANALYZE TABLE 命令生成和收集表的统计信息。

现象:

建表以location的方式加载数据,此时元数据还没有记录新的数据,当执行 count(*) 时,系统会自动到元数据中读取数据,此时元数据是没有数据的。

相关推荐
B站计算机毕业设计超人8 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
B站计算机毕业设计超人8 天前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计
十月南城8 天前
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
大数据·数据库·数据仓库·hive·hadoop·spark
王九思8 天前
Hive Thrift Server 介绍
数据仓库·hive·hadoop
土拨鼠烧电路8 天前
笔记11:数据中台:不是数据仓库,是业务能力复用的引擎
数据仓库·笔记
Asher05098 天前
Hive核心知识:从基础到实战全解析
数据仓库·hive·hadoop
xhaoDream8 天前
Hive3.1.3 配置 Tez 引擎
大数据·hive·tez
yumgpkpm8 天前
AI视频生成:Wan 2.2(阿里通义万相)在华为昇腾下的部署?
人工智能·hadoop·elasticsearch·zookeeper·flink·kafka·cloudera
Asher05098 天前
Hadoop核心技术与实战指南
大数据·hadoop·分布式