R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
赵钰老师2 小时前
基于多案例系统学习防洪评价报告编制方法与水流数学模型建模
数据分析
生态博士的R笔记4 小时前
R语言相关性分析完整教程:从Pearson/Spearman方法选择到corrplot可视化
数据分析
AllData公司负责人6 小时前
亲测丝滑,体验跃迁|AllData通过集成开源项目RustFS,多模态数据存储新范式
java·大数据·数据库·算法·数据分析·rustfs
SelectDB技术团队6 小时前
97% 召回率、900 QPS:Apache Doris 4.1 生产级向量检索的工程实践
数据库·人工智能·数据分析·apache doris·selectdb
chasdream8 小时前
Doris批量导入慢?Spring Boot整合Doris Routine Load是如何提升数据导入性能
后端·数据分析
码界筑梦坊9 小时前
153-基于FLask的英国希思罗机场天气数据可视化分析系统
python·信息可视化·数据分析·flask
纪伊路上盛名在9 小时前
Github 命令行搜索工具
人工智能·数据分析·github
码界筑梦坊1 天前
149-基于Python的数据分析岗位招聘数据可视化分析系统
python·信息可视化·数据分析·毕业设计
生信大杂烩1 天前
从 Seurat 到 AnnData:用 anndataR 打通 R 与 Python 单细胞数据生态
python·算法·数据分析·r语言
生信小白菜儿1 天前
学术论文的数据分析怎么选择统计方法
人工智能·数据挖掘·数据分析