R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
YangYang9YangYan11 小时前
2026中专大数据与会计专业数据分析发展路径
大数据·数据挖掘·数据分析
YangYang9YangYan13 小时前
2026大专大数据技术专业学数据分析指南
大数据·数据挖掘·数据分析
Aloudata19 小时前
指标平台选型的关键——无宽表下的查询性能如何保障?
大数据·数据库·数据分析·etl·指标平台
莽撞的大地瓜20 小时前
新浪舆情通秒级预警筑牢舆情应急第一防线
大数据·数据库·数据仓库·数据分析
莽撞的大地瓜21 小时前
信息覆盖广 内容识别全 新浪舆情通让舆情洞察更高效
大数据·数据库·数据分析
databook1 天前
表格设计:结构与美感并重
python·数据分析·数据可视化
wang_yb1 天前
表格设计:结构与美感并重
数据分析·databook
岱宗夫up1 天前
Python数据分析:领域专精
大数据·开发语言·python·信息可视化·数据挖掘·数据分析
星辰徐哥1 天前
人工智能从入门到精通:NumPy 与 Pandas 数据分析基础
人工智能·ai·数据分析·numpy·pandas
玄同7651 天前
NumPy 与 Pandas 中「有无返回值函数」的易错点整理
人工智能·python·机器学习·数据挖掘·数据分析·numpy·pandas