R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
Aloudata14 小时前
数据工程实践:智能制造企业如何通过NoETL指标平台为数据资产“瘦身”,实现TCO最优?
sql·数据分析·etl·指标平台
wang_yb15 小时前
数据“显微镜”:蜂群图让每个数据点都发声
数据分析·databook
UI设计兰亭妙微18 小时前
兰亭妙微实战:B 端数据可视化设计,让枯燥数据变身业务决策支撑
信息可视化·数据分析·b端设计
德昂信息dataondemand20 小时前
电商全平台销售运营分析体系
数据分析
Mikhail_G20 小时前
Mysql数据库操作指南——分组查询(零基础篇十三)
大数据·数据库·sql·mysql·数据分析
地球资源数据云20 小时前
【最新更新】中国2000-2025平均值合成白天地表温度(LST)年度数据集
数据分析·数据集·遥感数据
软件派2 天前
Tableau:数据可视化的终极引擎,重塑企业决策新范式
大数据·信息可视化·数据分析
老吴学AI2 天前
第 3 节 | 视觉魔术:Excel 如何用颜色和位置“控制”读者视线
信息可视化·数据分析·excel·职场·数据可视化·报表制作·用数据讲故事
郝学胜-神的一滴2 天前
特征选择利器:深入理解SelectKBest与单变量特征选择
人工智能·python·程序人生·机器学习·数据分析·scikit-learn·sklearn
Mikhail_G2 天前
Mysql数据库操作指南——排序(零基础篇十)
大数据·数据库·sql·mysql·数据分析