R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
叫我:松哥9 小时前
基于scrapy的网易云音乐数据采集与分析设计实现
python·信息可视化·数据分析·beautifulsoup·numpy·pandas
花月mmc12 小时前
CanMV K230 波形识别——数据分析(2)
python·数据挖掘·数据分析·信号处理
happyboy198621113 小时前
2026 中专财务专业考证书门槛低的有哪些?
数据分析
Mikhail_G16 小时前
Mysql数据库操作指南(零基础篇二)
大数据·数据库·sql·mysql·数据分析
叫我:松哥16 小时前
spark+flask的新能源车数据分析与智能推荐系统,融合大数据分析、机器学习和人工智能技术
人工智能·机器学习·信息可视化·数据分析·spark·flask·bootstrap
_Soy_Milk18 小时前
【算法工程师】—— Python 数据分析
python·数据分析·numpy·pandas·matplotlib
wjykp1 天前
5.脑电信号的预处理及数据分析要点
数据挖掘·数据分析
wang_yb1 天前
折线图的奇妙变奏:四种创意可视化方法
数据分析·databook
Aloudata1 天前
破局 AI 幻觉:构建以 NoETL 语义编织为核心的 AI 就绪数据架构
人工智能·架构·数据分析·dataagent
Python毕设指南1 天前
基于深度学习的旅游推荐系统
python·深度学习·数据分析·django·毕业设计·课程设计