R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
电商API_1800790524720 分钟前
B站视频列表与详情数据API调用完全指南
大数据·人工智能·爬虫·数据分析
jiaozi_zzq2 小时前
中专大数据专业学生如何规划证书考取与职业发展路径
大数据·职场和发展·数据分析·证书
醉卧考场君莫笑3 小时前
PowerBI(上)
信息可视化·数据分析·powerbi
沐墨染3 小时前
大型数据分析组件前端实践:多维度检索与实时交互设计
前端·elementui·数据挖掘·数据分析·vue·交互
Zoey的笔记本15 小时前
金融行业数据可视化平台:破解数据割裂与决策迟滞的系统性方案
大数据·信息可视化·数据分析
佛祖让我来巡山1 天前
Numpy
机器学习·数据分析·numpy·矢量运算
CS创新实验室1 天前
正态分布的深入学习:从数学发现到自然法则的演变
学习·数据挖掘·数据分析·统计学·正态分布
dear_bi_MyOnly1 天前
数据分析常用操作汇总
大数据·python·数据挖掘·数据分析·学习方法
YangYang9YangYan1 天前
2026高职大数据专业:数据分析学习的价值与前景
大数据·学习·数据分析