R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
KaMeidebaby5 小时前
卡梅德生物技术快报|原核表达系统工艺优化:包涵体重折叠 + 分子筛纯化实现功能 RBD 高效制备,附全参数配置
前端·人工智能·算法·数据挖掘·数据分析
左心房的默白,,,11 小时前
17:FDC数据采集与数据分析基础(EAP进阶)
运维·数据分析·自动化
小白学大数据11 小时前
AI 智能爬虫实战:Selenium+Python 自动绕反爬、一键提取数据
爬虫·python·selenium·数据分析
YangYang9YangYan13 小时前
2026运营岗位学数据分析的价值分析
数据挖掘·数据分析
babe小鑫13 小时前
2026大专学历进入互联网行业学数据分析的价值
数据挖掘·数据分析
YangYang9YangYan13 小时前
2026会计岗位学数据分析的技术价值分析
数据挖掘·数据分析
babe小鑫14 小时前
2026经管领域学数据分析的价值
数据挖掘·数据分析
装不满的克莱因瓶1 天前
实现矩阵的转置:从数学原理到 NumPy 实战
线性代数·机器学习·矩阵·数据分析·numpy·特征分解
不知名的老吴1 天前
Minitab 22中文版安装教程及全流程下载步骤指南
数据分析
m0_641889292 天前
2026好用的GEO优化监测系统,排名监测、数据分析、品牌诊断优化
人工智能·数据分析·geo·ai搜索·智能营销·geo优化