R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
AIFQuant32 分钟前
如何快速接入贵金属期货实时行情 API:python 实战分享
开发语言·python·金融·数据分析·restful
大闲在人1 小时前
24. 连续盘点库存系统:Q-R策略(再订货量-再订货点策略)的核心逻辑与应用
数据分析·供应链管理·智能制造·库存管理·工业工程
灰鲸广告联盟2 小时前
APP广告变现数据分析:关键指标与优化策略
大数据·网络·数据分析
JEECG低代码平台3 小时前
积木报表:一键导出 Word,让报表办公更高效
数据分析·导出word·积木报表·财务报表·企业报表
大闲在人3 小时前
26. 库存模型向随机提前期的扩展:理论、方法与实践应用
数据分析·供应链管理·智能制造·库存管理·工业工程
大闲在人3 小时前
25. 连续盘点系统(Q-R 策略):总成本优化与基于缺货成本的再订货点设定
开发语言·数据分析·供应链管理·智能制造·工业工程
大厂技术总监下海3 小时前
为Claude注入“执行力”:Awesome Claude Skills——打开AI助手的开关矩阵
人工智能·数据分析·开源
QQ12958455044 小时前
SSAS - 步骤一:通过VS2022新建项目
数据仓库·数据分析
少林码僧19 小时前
2.30 传统行业预测神器:为什么GBDT系列算法在企业中最受欢迎
开发语言·人工智能·算法·机器学习·ai·数据分析
YangYang9YangYan1 天前
2026大专计算机专业学数据分析的价值分析
数据挖掘·数据分析