R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
点金石游戏出海1 天前
玩家为何退出、不付费?读懂这些关键的“行为数据”,解锁增长密码!
游戏·数据分析·用户分析·游戏运营
咚咚王1 天前
人工智能之数据分析 Matplotlib:第四章 图形类型
人工智能·数据分析
咚咚王者1 天前
人工智能之数据分析 Matplotlib:第三章 基本属性
人工智能·数据分析·matplotlib
人大博士的交易之路1 天前
龙虎榜——20251128
大数据·数学建模·数据挖掘·数据分析·缠论·龙虎榜·道琼斯结构
空影星1 天前
轻量日记神器RedNotebook,高效记录每一天
python·数据挖掘·数据分析·音视频
databook1 天前
告别盲人摸象,数据分析的抽样方法总结
后端·python·数据分析
咚咚王者2 天前
人工智能之数据分析 numpy:第十三章 工具衔接与迁移
人工智能·数据分析·numpy
咚咚王者2 天前
人工智能之数据分析 numpy:第九章 数组运算(二)
人工智能·数据分析·numpy
数据科学小丫2 天前
数据分析与FineBI介绍
大数据·数据分析·finebi
可观测性用观测云2 天前
采集华为云 CCI 日志到观测云最佳实践
数据分析