R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
Omics Pro11 分钟前
斯坦福:强化学习生物约束型虚拟细胞建模
人工智能·深度学习·算法·机器学习·计算机视觉·数据挖掘·数据分析
databook16 小时前
从写代码到问问题:2026年,AI如何重构数据科学工作流
人工智能·后端·数据分析
wang_yb16 小时前
从写代码到问问题:2026年,AI如何重构数据科学工作流
数据分析·databook
城数派17 小时前
2025年全国地级市间驾车出行距离和出行时间矩阵数据
数据库·arcgis·信息可视化·数据分析
周纠纠1 天前
【无标题】
数据分析
迦南的迦 亚索的索1 天前
PYTHON_DAY21_数据分析
开发语言·python·数据分析
数厘2 天前
2.11 约束的使用(主键、外键、非空、唯一、默认值约束)
sql·mysql·数据分析
城数派2 天前
2025年南京市全类别POI(55W+数据)
数据库·arcgis·信息可视化·数据分析·excel
Omics Pro2 天前
上海AI Lab+复旦大学:双轨协同实现自动化虚拟细胞建模
运维·人工智能·语言模型·自然语言处理·数据挖掘·数据分析·自动化
SelectDB2 天前
AI 成为主流负载后,数据基础设施将如何演进?|Apache Doris 2026 Roadmap
人工智能·数据分析