R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
韩立学长13 小时前
【开题答辩实录分享】以《重庆旅游景点数据分析与可视化》为例进行答辩实录分享
数据挖掘·数据分析
G***T69113 小时前
Docker数据分析实战
docker·容器·数据分析
qqxhb13 小时前
零基础MCP——第5章编程实战基础(网页、数据分析、调试与重构)
重构·数据挖掘·数据分析·多模态·mcp
EAIReport13 小时前
通过数据分析自动化产品实现AI生成PPT的完整流程
人工智能·数据分析·自动化
数据智研21 小时前
【数据分享】太湖及周边地区1985-2010年耕地空间分布TIF数据
信息可视化·数据分析
源码之家1 天前
基于python新闻数据分析可视化系统 Hadoop 新闻平台 爬虫 情感分析 舆情分析 可视化 Django框架 vue框架 机器学习 大数据毕业设计✅
大数据·爬虫·python·数据分析·毕业设计·情感分析·新闻
以梦为马mmky1 天前
25中国矿业大学通信考情数据分析
数据分析·通信考研·信号与系统·中国矿业大学
EAIReport1 天前
企业人力资源管理数据分析:离职因素与群体特征研究
人工智能·数据挖掘·数据分析
咚咚王者1 天前
人工智能之数据分析 numpy:第八章 数组广播
人工智能·数据分析·numpy
源码之家2 天前
基于Python房价预测系统 数据分析 Flask框架 爬虫 随机森林回归预测模型、链家二手房 可视化大屏 大数据毕业设计(附源码)✅
大数据·爬虫·python·随机森林·数据分析·spark·flask