spark读取hive表字段,区分大小写问题

背景

spark任务读取hive表,查询字段为小写,但Hive表字段为大写,无法读取数据

问题错误:
如何解决呢?
  • In version 2.3 and earlier, when reading from a Parquet data source table, Spark always returns null for any column whose column names in Hive metastore schema and Parquet schema are in different letter cases, no matter whether spark.sql.caseSensitive is set to true or false. Since 2.4, when spark.sql.caseSensitive is set to false, Spark does case insensitive column name resolution between Hive metastore schema and Parquet schema, so even column names are in different letter cases, Spark returns corresponding column values. An exception is thrown if there is ambiguity, i.e. more than one Parquet column is matched. This change also applies to Parquet Hive tables when spark.sql.hive.convertMetastoreParquet is set to true.
sql 复制代码
# 在程序或者sql中添加这个参数即可
set spark.sql.caseSensitive = false

参考地址:

Migration Guide: SQL, Datasets and DataFrame - Spark 3.2.0 Documentation

相关推荐
闹小艾17 分钟前
2026 知识付费线上课程小程序 SaaS制作平台深度评测:6 大维度拆解,教你选对不踩坑
大数据·小程序
数琨创享TQMS质量数智化30 分钟前
Sigmar TQMS: 车间质量数智化管控平台技术选型指南
大数据·人工智能·qms质量管理系统·tqms·质量管理工具
Rabbit_QL33 分钟前
【Git基础】02——分支:在不破坏主线的情况下做实验
大数据·git·elasticsearch
todoitbo33 分钟前
时序数据库选型指南:从大数据场景出发
大数据·数据库·时序数据库
fire-flyer38 分钟前
第 3 篇:ClickHouse 表结构设计的核心原则
大数据·数据库·clickhouse
切糕师学AI40 分钟前
Elasticsearch Learning to Rank 完全指南
大数据·elasticsearch·机器学习·搜索引擎
Justice Young1 小时前
Flink第一章:Flink概述
大数据·flink
教育知暖意1 小时前
2026年PPT生成工具实测,每款都适配不同需求
大数据·人工智能
talen_hx2961 小时前
《零基础入门Spark》学习笔记 Day 12
笔记·学习·spark
Elastic 中国社区官方博客12 小时前
通过自主 IT 平台和 Elastic 迈出可观测性的下一步
大数据·elasticsearch·搜索引擎·全文检索·可用性测试