R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
学术小白人1 小时前
会议第一轮投稿!2026年物联网、数据科学与先进计算国际学术会议(IDSAC2026)
人工智能·物联网·数据分析·能源·制造·教育·rdlink研发家
X***E4639 小时前
前端数据分析应用
前端·数据挖掘·数据分析
毕设源码-邱学长9 小时前
【开题答辩全过程】以 海鲜市场销售数据分析与预测系统为例,包含答辩的问题和答案
数据挖掘·数据分析
最晚的py16 小时前
Python Matplotlib
python·数据分析
麦烤楽鸡翅19 小时前
简单迭代法求单根的近似值
java·c++·python·数据分析·c·数值分析
咚咚王者19 小时前
人工智能之数据分析 numpy:第十五章 项目实践
人工智能·数据分析·numpy
B站计算机毕业设计之家20 小时前
基于Python音乐推荐系统 数据分析可视化 协同过滤推荐算法 大数据(全套源码+文档)建议收藏✅
python·数据分析·推荐算法
得物技术21 小时前
从数字到版面:得物数据产品里数字格式化的那些事
前端·数据结构·数据分析
百度Geek说1 天前
破局复杂业务场景:百度数据分析平台(TDA)分析增强与性能优化的双轮驱动
数据分析