R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
YangYang9YangYan5 分钟前
2026中专大数据管理与应用专业学数据分析的技术价值分析
数据挖掘·数据分析
YangYang9YangYan1 小时前
2026大专计算机专业学生学数据分析的实用性分析
数据挖掘·数据分析
大数据基础1 小时前
基于 Hadoop MapReduce + Spring Boot + Vue 3 的每日饮水数据分析平台
大数据·vue.js·hadoop·spring boot·数据分析·maven·mapreduce
小王毕业啦14 小时前
2010-2024年 上市公司-突破性创新和渐进性创新(数据+代码+文献)
大数据·人工智能·数据挖掘·数据分析·数据统计·社科数据·经管数据
babe小鑫16 小时前
企业客户数据分级防护发展指南
大数据·信息可视化·数据分析
追风少年ii1 天前
多组学顶刊--肿瘤源性氨可被调节性T细胞代谢利用,进而强化对机体抗肿瘤免疫反应的抑制效应
python·分类·数据分析·空间·单细胞
啊辉的科研1 天前
植物单细胞RNA-seq分析教程4-2025年版
数据分析·r语言
-To be number.wan1 天前
Python数据分析:pyecharts可视化
python·信息可视化·数据分析
量子-Alex1 天前
【大模型智能体】人工智能宇宙学家 I:自动数据分析的智能体系统
人工智能·数据挖掘·数据分析
电商API_180079052471 天前
电商评论数据爬虫:情感分析与数据可视化实战
大数据·人工智能·爬虫·信息可视化·数据分析