在mac上面使用parquet-cli查看parquet文件

问题

需要在mac上面简单查看parquet文件,parquet格式是hadoop生态的文件格式。也就是说,这个是大数据这块领域的基础文件格式之一。

安装

bash 复制代码
brew install parquet-cli

使用

bash 复制代码
# 查看元数据
parquet meta run-1758765177209-part-block-0-0-r-00000-snappy.parquet
# 查看前面几条数据
parquet head run-1758765177209-part-block-0-0-r-00000-snappy.parquet
# 查看数据格式
parquet schema run-1758765177209-part-block-0-0-r-00000-snappy.parquet

问题

使用过程中出现了如下问题:

Argument error: INT96 is deprecated. As interim enable READ_INT96_AS_FIXED flag to read as byte array.

然后parquet-cli这个工具就死活打不开含有INT96类型字段的parquet文件。然后,在mac上面使用一个叫Parquet Viewer的工具,连接如下:
Parquet Viewer

参考

相关推荐
转战英雄枫19 小时前
Mac上打开安卓虚拟机BlueStacks Air闪退问题解决
macos·bluestacks
泰克教育官方账号1 天前
泰涨知识 | Hadoop的IO操作——压缩/解压缩
大数据·hadoop·分布式
liliangcsdn1 天前
mac m1安装homebrew和iterm2示例
macos
墨&白.1 天前
如何卸载/更新Mac上的R版本
开发语言·macos·r语言
游戏开发爱好者81 天前
苹果 App 上架流程,结合 Xcode、CI 等常见工具
macos·ios·ci/cd·小程序·uni-app·iphone·xcode
qq_381454991 天前
大数据时代的分布式基石Hadoop
hadoop
科技智驱1 天前
Mac废纸篓清空的东西能还原吗?找回Mac废纸篓数据的教程
macos·数据恢复
满目山河•2 天前
二、复制三台虚拟机
hive·hadoop·hbase
猫头虎2 天前
GoLand 2025.3 最新变化:值得更新吗?
ide·windows·macos·pycharm·编辑器·intellij-idea·idea
_可乐无糖2 天前
内网穿透工具使用指南:ngrok 和 cpolar
安全·macos·云计算