R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
葡萄城技术团队1 小时前
AI 重构数据分析:技术突破与价值释放
人工智能·重构·数据分析
不剪发的Tony老师4 小时前
SOFA:一款免费开源的统计分析和报表工具
数据分析·统计
wyiyiyi4 小时前
【数据结构+算法】非递归遍历二叉树的理解
大数据·数据结构·笔记·算法·leetcode·数据分析
Brduino脑机接口技术答疑5 小时前
脑机接口数据处理连载(二) 数据源头解析:脑电信号的采集原理与数据特性
人工智能·python·算法·数据分析·脑机接口
咚咚王者7 小时前
人工智能之数据分析 Matplotlib:第一章 简介和安装
人工智能·数据分析·matplotlib
咚咚王者9 小时前
人工智能之数据分析 Matplotlib:第五章 常见函数
人工智能·数据分析·matplotlib
语落心生10 小时前
流式数据湖Paimon探秘之旅 (一) Paimon整体架构概览
数据分析
梦里不知身是客1110 小时前
帆软的图标类型介绍
python·信息可视化·数据分析
咚咚王者11 小时前
人工智能之数据分析 Matplotlib:第六章 知识总结
人工智能·数据分析·matplotlib
a***592612 小时前
爬虫基础之爬取某基金网站+数据分析
爬虫·数据挖掘·数据分析