在mac上面使用parquet-cli查看parquet文件

问题

需要在mac上面简单查看parquet文件,parquet格式是hadoop生态的文件格式。也就是说,这个是大数据这块领域的基础文件格式之一。

安装

bash 复制代码
brew install parquet-cli

使用

bash 复制代码
# 查看元数据
parquet meta run-1758765177209-part-block-0-0-r-00000-snappy.parquet
# 查看前面几条数据
parquet head run-1758765177209-part-block-0-0-r-00000-snappy.parquet
# 查看数据格式
parquet schema run-1758765177209-part-block-0-0-r-00000-snappy.parquet

问题

使用过程中出现了如下问题:

Argument error: INT96 is deprecated. As interim enable READ_INT96_AS_FIXED flag to read as byte array.

然后parquet-cli这个工具就死活打不开含有INT96类型字段的parquet文件。然后,在mac上面使用一个叫Parquet Viewer的工具,连接如下:
Parquet Viewer

参考

相关推荐
川川菜鸟4 小时前
Claude Code 安装与配置完整指南(Mac)
macos
WarmSword5 小时前
mac上用cursor/vscode调试root权限进程
c++·ide·vscode·macos·mac
大鳥5 小时前
数据仓库知识体系
hive·hadoop
计算机毕业编程指导师6 小时前
大数据可视化毕设:Hadoop+Spark交通分析系统从零到上线 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·spark·毕业设计·城市交通
Magnum Lehar6 小时前
macos的信息采集器appledataHarvester-2
macos·网络安全·系统安全
计算机毕业编程指导师6 小时前
【计算机毕设选题】基于Spark的车辆排放分析:2026年热门大数据项目 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·spark·毕业设计·车辆排放
talle20216 小时前
Hive | 行列转换
数据仓库·hive·hadoop
echo-niuben7 小时前
macOS 端已如何正常安装并配置XcodeBuildMCP ?
macos
刘某某.8 小时前
Mac上缺失宋体字体,只有宋体-简
macos
talle20218 小时前
Hive | json数据处理
hive·hadoop·json