R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
计算机学姐9 小时前
基于Python的旅游数据分析可视化系统【2026最新】
vue.js·后端·python·数据分析·django·flask·旅游
阿里云大数据AI技术10 小时前
淘宝闪购实时分析黑科技:StarRocks + Paimon撑起秋天第一波奶茶自由
数据分析
饼干哥哥11 小时前
Vibe Marketing|用Claude code+kimi k2爬取了120个 b站视频做内容选题数据分析
数据分析·aigc
Re_Yang0914 小时前
2025年统计与数据分析领域专业认证发展指南
服务器·人工智能·数据分析
华科云商xiao徐14 小时前
Linux环境下爬虫程序的部署难题与系统性解决方案
爬虫·数据挖掘·数据分析
木木子999915 小时前
不同行业视角下的数据分析
数据挖掘·数据分析
没有梦想的咸鱼185-1037-166315 小时前
基于R语言机器学习方法在生态经济学领域中的实践技术应用
开发语言·机器学习·数据分析·r语言
Webb Yu15 小时前
Azure Databricks 实践:数据分析、机器学习、ETL 与 Delta Lake
机器学习·数据分析·azure
亚马逊云开发者17 小时前
基于 Amazon Q Developer+Remote MCP 访问 Amazon Redshift
数据分析
用户Taobaoapi20141 天前
京东店铺所有商品API技术开发文档
大数据·数据挖掘·数据分析