R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
谅望者2 小时前
数据分析笔记07:Python编程语言介绍
大数据·数据库·笔记·python·数据挖掘·数据分析
谅望者4 小时前
数据分析笔记03:概率分布理论
笔记·数据分析·概率论
FIT2CLOUD飞致云4 小时前
支持CAS身份认证,支持接入Oracle11数据源,SQLBot开源智能问数系统v1.3.0版本发布
ai·数据分析·开源·智能问数·sqlbot
谅望者4 小时前
数据分析笔记09:Python条件语循环
笔记·python·数据分析
YangYang9YangYan12 小时前
中专生学历提升与职业发展指南
大数据·人工智能·学习·数据分析
qq_4369621820 小时前
数据中台:打破企业数据孤岛,实现全域资产化的关键一步
数据库·人工智能·信息可视化·数据挖掘·数据分析
毕设源码-邱学长1 天前
【开题答辩全过程】以 基于Python的Bilibili平台数据分析与可视化实现为例,包含答辩的问题和答案
开发语言·python·数据分析
Tiger Z1 天前
《R for Data Science (2e)》免费中文翻译 (第12章) --- Logical vectors(2)
数据分析·r语言·数据科学·免费书籍
YangYang9YangYan1 天前
职业本科发展路径与规划指南
大数据·人工智能·学习·数据分析
程序员小羊!1 天前
电商项目练习实操(二)
大数据·数据分析·etl·flume