R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
Aloudata技术团队11 小时前
完美应对千亿级明细数据计算:Aloudata CAN 双引擎架构详解
数据库·数据分析·数据可视化
YangYang9YangYan13 小时前
2026高职大数据与财务管理专业学数据分析的技术价值分析
大数据·数据挖掘·数据分析
桓峰基因13 小时前
桓峰基因临床数据分析及机器学习预测模型构建教程
人工智能·机器学习·数据挖掘·数据分析
Aloudata技术团队14 小时前
企业落地 AI 数据分析,如何做好敏感数据安全防护?
数据分析
Tezign_space15 小时前
深度解析:GEA架构——生成与进化技术的融合
人工智能·数据分析·生成式ai·技术创新·内容生成·内容科技·gea
computersciencer18 小时前
机器学习前的准备:划分数据集
人工智能·机器学习·数据分析
橙露18 小时前
大数据分析入门:Hadoop 生态系统与 Python 结合的分布式数据处理实践
hadoop·分布式·数据分析
YangYang9YangYan1 天前
2026高职大数据管理与应用专业学数据分析的价值分析
数据挖掘·数据分析
一只爱学习的小鱼儿2 天前
在QT中使用饼状图进行数据分析
开发语言·qt·数据分析
反向跟单策略2 天前
期货反向跟单-贵金属牛市中的反向跟单密码
大数据·人工智能·学习·数据分析·区块链