R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
数据科学小丫2 小时前
数据操作案例:RFM 分析
大数据·数据分析·finebi
易海聚大数据4 小时前
开源情报系统与网络舆情监测系统的核心差异在哪里
数据分析·智能分析·舆情监测系统·开源情报分析系统
Data-Miner4 小时前
Excel-Agent:你的专属 AI 数据分析助手
人工智能·数据分析·excel
guoyunsky4 小时前
Ins爬虫可以抓取到国家,性别和年龄吗?
爬虫·数据分析·rpa
北极九章ArcticData5 小时前
销售管理团队如何用ChatBI实现数据驱动管理?
大数据·人工智能·数据分析·chatbi
李昊哲小课1 天前
matplotlib多子图与复杂布局实战
python·数据分析·matplotlib·数据可视化
vx_biyesheji00011 天前
计算机毕业设计:Python多源新闻数据智能舆情挖掘平台 Flask框架 爬虫 SnowNLP ARIMA 可视化 数据分析 大数据(建议收藏)✅
爬虫·python·机器学习·数据分析·django·flask·课程设计
电商API_180079052471 天前
电商平台公开数据采集实践:基于合规接口的数据分析方案
开发语言·数据库·人工智能·数据挖掘·数据分析·网络爬虫
deepdata_cn1 天前
什么是规范性分析(Prescriptive Analytics)
数据分析·规范性分析
Simon_lca2 天前
突破合规瓶颈:ZDHC Supplier to Zero(工厂零排放 - 进阶型)体系全攻略
大数据·网络·人工智能·分类·数据挖掘·数据分析·零售