R读写parquet文件

什么是parquet文件

Apache Parquet是一个开源的,列存储的数据文件格式。

https://parquet.apache.org/

在R里面,我们可以通过arrow包来读写它。

我们先安装一下arrow包,并加载它。

复制代码
install.packages("arrow")
library(arrow)

读写parquet文件

我们目前没有parquet的文件在本地,先用arrow包里面的write_parquet写一个。

复制代码
write_parquet(
  x,
  sink,
  chunk_size = NULL,
  version = "2.4",
  compression = default_parquet_compression(),
  compression_level = NULL,
  use_dictionary = NULL,
  write_statistics = NULL,
  data_page_size = NULL,
  use_deprecated_int96_timestamps = FALSE,
  coerce_timestamps = NULL,
  allow_truncated_timestamps = FALSE
)

我们写一下cars,然后读取它。

复制代码
 write_parquet(cars, "cars.parquet")
df_from_parquet <- read_parquet("cars.parquet")
相关推荐
人大博士的交易之路4 小时前
龙虎榜——20251203
数学建模·数据挖掘·数据分析·缠论·龙虎榜·道琼斯结构
数据智研7 小时前
【数据分享】古丝绸之路路线矢量数据
大数据·信息可视化·数据分析
泰迪智能科技8 小时前
分享|高校商务数据分析实验室建设项目资源+实训软件+产融服务
信息可视化·数据挖掘·数据分析
星云数灵8 小时前
机器学习入门实战:使用Scikit-learn完成鸢尾花分类
人工智能·python·机器学习·ai·数据分析·pandas·python数据分析
生信大杂烩8 小时前
空间转录组数据分析环境搭建:使用 Conda 和 VSCode 实现本地/远程无缝开发
python·数据分析
咚咚王者8 小时前
人工智能之数据分析 Pandas:第三章 DataFrame
人工智能·数据分析·pandas
人大博士的交易之路11 小时前
今日行情明日机会——20251203
数学建模·数据挖掘·数据分析·缠论·道琼斯结构
AI-嘉文哥哥11 小时前
ADAS自动驾驶-前车碰撞预警(追尾预警、碰撞检测)系统
人工智能·深度学习·yolo·目标检测·数据分析·课程设计·qt5
星云数灵21 小时前
使用Anaconda管理Python环境:安装与验证Pandas、NumPy、Matplotlib
开发语言·python·数据分析·pandas·教程·环境配置·anaconda
AI_56781 天前
Finereport如何重塑数据驱动管理
信息可视化·数据分析·云计算