R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
SelectDB4 小时前
Agent 时代,为什么传统的可观测方案不适用了?
大数据·数据库·数据分析
kejiayuan4 小时前
FineBI组件制作-构成分析类图表
数据分析·数据可视化·finebi
kejiayuan4 小时前
FineBI组件制作-流向分析类图表
数据分析·数据可视化·finebi
YangYang9YangYan6 小时前
2026产品专员学习数据分析的价值与路径
学习·数据挖掘·数据分析
babe小鑫6 小时前
2026职场进阶:数据分析技能的价值与应用
数据挖掘·数据分析
babe小鑫7 小时前
2026职场新人学数据分析的价值
数据挖掘·数据分析
小白学大数据8 小时前
深度探索:Python 爬虫实现豆瓣音乐全站采集
开发语言·爬虫·python·数据分析
Cloud_Shy6188 小时前
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十一章 Python 包跟踪器 下篇)
前端·后端·python·数据分析·excel
德昂信息dataondemand10 小时前
BI平台助力连锁餐饮外卖与活动高效管理
数据分析·连锁餐饮
BGD1045017311 小时前
datagear(7)-期末作业:综合数据分析
数据库·数据分析