R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
我是哈哈hh几秒前
【Python数据分析】Numpy总结
开发语言·python·数据挖掘·数据分析·numpy·python数据分析
咚咚王者5 小时前
人工智能之数据分析 Pandas:第五章 文件处理
人工智能·数据分析·pandas
小飞象—木兮5 小时前
【产品运营必备】数据分析实战宝典:从入门到精通,驱动业务增长(附相关材料下载)
大数据·数据挖掘·数据分析·产品运营
databook6 小时前
用样本猜总体的秘密武器,4大抽样分布总结
后端·python·数据分析
kong79069287 小时前
大数据的特征和数据分析
大数据·数据挖掘·数据分析
sensen_kiss9 小时前
INT303 Big Data Analysis 大数据分析 Pt.10 分析模型和混合模型
大数据·学习·机器学习·数据挖掘·数据分析
咚咚王者12 小时前
人工智能之数据分析 Pandas:第四章 常用函数
人工智能·数据分析·pandas
人大博士的交易之路12 小时前
龙虎榜——20251204
数学建模·数据挖掘·数据分析·缠论·龙虎榜·道琼斯结构
FIT2CLOUD飞致云12 小时前
支持术语、SQL示例、自定义提示词导入导出,SQLBot开源智能问数系统v1.4.0版本发布
ai·数据分析·开源·智能问数·sqlbot
计算机学姐13 小时前
基于Python的旅游数据分析及可视化系统【2026最新】
vue.js·python·数据挖掘·数据分析·django·旅游·推荐算法