R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
追风少年ii6 小时前
顶刊分享--由细菌-癌细胞相互作用决定的差异性肿瘤免疫
人工智能·算法·数据分析·空间·单细胞
workflower6 小时前
发现原子需求
数据分析·测试用例·需求分析·软件需求
weixin_440401696 小时前
Python数据分析(Series+DataFrame+部分运算+groupby)
开发语言·python·数据分析
码界筑梦坊7 小时前
332-基于XGBoost与SHAP的可穿戴设备亚健康风险识别系统
python·数据分析·flask·vue·毕业设计
追风少年ii9 小时前
CosMx文献分享--空间同型聚类对癌细胞可塑性的抑制
大数据·数据挖掘·数据分析·空间·单细胞
babe小鑫10 小时前
高职统计与会计核算专业学数据分析的价值分析
数据挖掘·数据分析
babe小鑫11 小时前
大专数据可视化技术专业学习数据分析的价值
学习·信息可视化·数据分析
Dxy123931021613 小时前
DataFrame窗口函数:数据分析中的滑动窗口魔法
数据挖掘·数据分析
sensen_kiss20 小时前
INT303 Coursework2 贷款批准预测模型(对整个大数据知识的应用)
大数据·机器学习·数据分析