dataframe保存excel格式比csv格式小很多很多

问题描述:

一个3万行的数据保存成csv大概10个G,但保存成excel格式只有100多M

原因分析:

因为xlsx 实际上就是 zip 压缩包,同时,如果有大量重复的数据,XLSX 会提取文本值,将其存储在查找表中,这意味着每个文本字符串只需要使用一次空间。数据量大了压缩的优势才体现出来。如图所示:压缩后的csv文档仍然有1G多,但xlsx只有100M

而且csv压缩后的大小也远远大于xlsx格式,如图所示:

相关推荐
angushine18 小时前
Python将Word转换为Excel
python·word·excel
封奚泽优1 天前
使用Python绘制金融数据可视化工具
python·信息可视化·excel·pandas·pyplot·qtwidgets·qtcore
木木子99992 天前
Excel——重复值处理
excel
UrbanJazzerati2 天前
Excel 函数 `SUBSTITUTE` 用法详解:替换文本中的字符
excel
何中应2 天前
EasyExcel使用(二:写出)
java·后端·maven·excel
m0_462185112 天前
VB解除excel保护工作表
excel
qq_463944862 天前
如何把Excel文件导入Navicat?
数据库·excel
不太厉害的程序员2 天前
Excel 将数据导入到SQLServer数据库
数据库·sqlserver·excel
开开心心_Every2 天前
多线程语音识别工具
javascript·人工智能·ocr·excel·语音识别·symfony
Goona_3 天前
拒绝SQL恐惧:用Python+pyqt打造任意Excel数据库查询系统
数据库·python·sql·excel·pyqt