R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
熠熠仔1 天前
QGIS 3.34+ 网络分析基础数据自动化生成:从脚本到应用
python·数据分析
追风少年ii1 天前
单细胞空间联合分析新贵--iStar
python·数据分析·空间·单细胞
Yeats_Liao2 天前
时序数据库系列(五):InfluxDB聚合函数与数据分析
java·后端·数据分析·时序数据库
on_pluto_2 天前
【推荐系统14】数据分析:以阿里天池新闻推荐为例学习
人工智能·学习·数据挖掘·数据分析·推荐算法
数学难2 天前
数据分析学习路线
学习·数据挖掘·数据分析
databook2 天前
数据分析师的基本功总结
后端·数据分析·求职
生信大杂烩2 天前
Xenium数据分析 | 使用Xenium Ranger重新分析数据
python·数据分析
husterlichf2 天前
pandas__unstack方法与set_index详解
数据挖掘·数据分析·pandas
陈辛chenxin3 天前
【大数据技术01】数据科学的基础理论
大数据·人工智能·python·深度学习·机器学习·数据挖掘·数据分析
点云SLAM3 天前
方差的迭代计算公式
大数据·深度学习·数据分析·概率论·数学原理·概论率