R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
派可数据BI可视化1 小时前
商业智能BI 浅谈数据孤岛和数据分析的发展
大数据·数据库·数据仓库·信息可视化·数据挖掘·数据分析
kida_yuan4 小时前
【Java】基于 Tabula 的 PDF 合并单元格内容提取
java·数据分析
Juchecar10 小时前
冷知识:“撞音”化学元素知多少
数据分析
我要学习别拦我~19 小时前
热力图:从逸出数据到宏观模式识别
信息可视化·数据分析
SirLancelot11 天前
StarRocks-基本介绍(一)基本概念、特点、适用场景
大数据·数据库·数据仓库·sql·数据分析·database·数据库架构
阿里云大数据AI技术1 天前
云栖实录|Hologres 4.0全新发布:AI时代的一站式多模态分析平台
数据分析
hhhLLyi1 天前
营销人职业成长路径:从执行到战略的能力进阶与知识体系构建
信息可视化·数据挖掘·数据分析
bmcyzs2 天前
【展厅多媒体】触摸查询一体机实现数据可视化
经验分享·科技·信息可视化·数据挖掘·数据分析·设计规范
jarreyer2 天前
常见分析方法与对应图表汇总
python·信息可视化·数据分析
m***记2 天前
Python 数据分析入门:Pandas vs NumPy 全方位对比
python·数据分析·pandas