dataframe保存excel格式比csv格式小很多很多

问题描述:

一个3万行的数据保存成csv大概10个G,但保存成excel格式只有100多M

原因分析:

因为xlsx 实际上就是 zip 压缩包,同时,如果有大量重复的数据,XLSX 会提取文本值,将其存储在查找表中,这意味着每个文本字符串只需要使用一次空间。数据量大了压缩的优势才体现出来。如图所示:压缩后的csv文档仍然有1G多,但xlsx只有100M

而且csv压缩后的大小也远远大于xlsx格式,如图所示:

相关推荐
XYX的Blog2 天前
Pandas基础07(Csv/Excel/Mysql数据的存储与读取)
mysql·excel·pandas
东京老树根2 天前
Excel 技巧23 - 在Excel中用切片器做出查询效果(★★★)
笔记·学习·excel
东京老树根3 天前
Excel 技巧22 - Ctrl+D 向下复制(★★),复制同间距图形
笔记·学习·excel
如意机反光镜裸3 天前
如何批量导入竖版Excel表到数据库
数据库·excel
NiNg_1_2344 天前
FastExcel使用详解
开发语言·excel·fastexcel
小奥超人5 天前
EXCEL教程:如何打开Excel隐藏部分?
windows·经验分享·microsoft·excel·办公技巧
Eiceblue5 天前
C# 添加、替换、提取、或删除Excel中的图片
开发语言·c#·excel·visual studio
ynrainy5 天前
Excel分区间统计分析(等步长、不等步长、多维度)
excel
扎量丙不要犟6 天前
excel如何查找一个表的数据在另外一个表是否存在
rust·excel
xun-ming7 天前
Excel中LOOKUP函数的使用
excel·xlookup·vlookup·lookup·hlookup