R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
UR的出不克1 小时前
基于Django的智能职位推荐系统设计与实现:从数据爬取到协同过滤推荐
运维·爬虫·python·数据分析·自动化
davawang1 小时前
字符串分割并展开成表格的SQL实现方法
sql·数据分析
renhongxia11 小时前
数据可视化实战:用AI工具制作专业数据分析图表
人工智能·信息可视化·语言模型·自然语言处理·数据分析·制造
babe小鑫20 小时前
中专学历转行招聘数据分析的可行性分析
数据挖掘·数据分析
智航GIS1 天前
11.13 Pandas进阶:掌握多级分组与高级聚合,解锁数据分析新维度
数据挖掘·数据分析·pandas
YangYang9YangYan1 天前
2026高职大数据与会计专业学数据分析的价值分析
大数据·数据挖掘·数据分析
UR的出不克1 天前
Python实现SMZDM数据处理系统:从爬虫到数据分析的完整实践
爬虫·python·数据分析
瑞华丽PLM1 天前
工业大数据背景下的PLM数据分析:驱动产品创新新范式
大数据·数据挖掘·数据分析·plm·国产plm·瑞华丽plm·瑞华丽
大闲在人1 天前
22. EOQ 扩展模型:有限生产率场景下的库存优化
数据分析·供应链管理·智能制造·库存管理·工业工程
YangYang9YangYan1 天前
2026大专财务专业学数据分析的价值分析
数据挖掘·数据分析