R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
Aloudata2 分钟前
根据业务角色创建 AI 数据分析助手,满足集团型企业多部门个性化需求
人工智能·数据挖掘·数据分析·chatbi·data agent
qq_27049009610 分钟前
基于大数据的民宿数据分析及可视化平台的设计与实现
大数据·数据挖掘·数据分析
谈笑也风生28 分钟前
统计发现 | JMP Pro软件官方正式版详细下载教程
数据分析
clarance201519 小时前
2025主流BI工具可信能力评估报告:从合规到智能的架构解析
数据库·人工智能·信息可视化·架构·数据挖掘·数据分析
davawang21 小时前
BI报表及可视化分析类工具使用经验总结(上)
数据分析·报表·bi
没有梦想的咸鱼185-1037-166321 小时前
【降尺度】基于统计方法与机器学习技术在气候降尺度中的实践应用
人工智能·机器学习·数据分析
Are you manufacturer1 天前
Tetuan的电力消耗数据进行时间序列预测
数据分析·lstm
雷电法拉珑1 天前
Alpha158因子初步介绍
数据分析
代码洲学长1 天前
文本数据分析的基础知识
python·自然语言处理·数据分析
熊猫比分管理员1 天前
开源代码/直播系统免费源码/支持二开/直播、赛事与数据分析一体化解决方案
数据挖掘·数据分析