R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
weixin_4462608515 分钟前
揭开数据分析的新篇章:OpenBB金融数据平台
金融·数据挖掘·数据分析
YangYang9YangYan1 小时前
2026年大专大数据与会计专业核心证书推荐
大数据·学习·数据分析
wang_yb10 小时前
前注意加工:让你的图表抓住读者的眼球
数据分析·databook
databook11 小时前
前注意加工:让你的图表抓住读者的眼球
python·数据分析·数据可视化
computersciencer20 小时前
用动态和微观的观点理解微分
数学建模·数据分析·微积分·高等数学
B站计算机毕业设计之家21 小时前
大数据毕业设计:基于python图书数据分析可视化系统 书籍大屏 爬虫 清洗 可视化 当当网书籍数据分析 Django框架 图书推荐 大数据
大数据·爬虫·python·机器学习·自然语言处理·数据分析·课程设计
hk11241 天前
【Adversarial/Forensics】2026年度对抗性攻击防御与持久化内存取证基准索引 (Benchmark Index)
人工智能·网络安全·数据分析·系统架构·数据集
人大博士的交易之路1 天前
第三章 市场的分析体系
大数据·数学建模·数据挖掘·数据分析·缠论·道琼斯结构·人大博士的交易之路
YangYang9YangYan1 天前
2026届中专电商生学数据分析的可行性分析
数据挖掘·数据分析
爱喝可乐的老王1 天前
数据分析实战——数据清洗常用流程
数据挖掘·数据分析·pandas