R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
数说故事14 分钟前
如何采集游戏行业数据,实现全球游戏数据分析
数据分析·游戏数据·数据洞察
爱思德学术16 分钟前
中国计算机学会(CCF)推荐学术会议-A(数据库/数据挖掘/内容检索):SIGKDD 2026
大数据·人工智能·数据分析
AC赳赳老秦37 分钟前
华为昇腾适配DeepSeek实战:FP8转BF16权重与FlashMLA加速配置详解
大数据·人工智能·机器学习·数据分析·kafka·etl工程师·deepseek
地瓜伯伯14 小时前
elasticsearch性能调优方法原理与实战
人工智能·elasticsearch·语言模型·数据分析
YangYang9YangYan18 小时前
2026大专大数据专业学习数据分析的价值与应用
大数据·学习·数据分析
liangdabiao19 小时前
开源基于claude code skills搭建互联网数据分析Agent全自动化
数据挖掘·数据分析·自动化
TGITCIC19 小时前
2026数据分析Agent最新落地方向解析
数据库·数据分析·ai大模型·ai智能体·ai数据·ai问数·ai sql
Aloudata21 小时前
企业落地 AI 数据分析,如何做好敏感数据安全防护?
人工智能·安全·数据挖掘·数据分析·chatbi·智能问数·dataagent
牛猫Data1 天前
Power BI为什么不能完全取代Excel?
microsoft·数据分析·excel·database·数据可视化·powerbi
2501_944934731 天前
大专学历从运营转市场调研的路径
数据分析