dataframe保存excel格式比csv格式小很多很多

问题描述:

一个3万行的数据保存成csv大概10个G,但保存成excel格式只有100多M

原因分析:

因为xlsx 实际上就是 zip 压缩包,同时,如果有大量重复的数据,XLSX 会提取文本值,将其存储在查找表中,这意味着每个文本字符串只需要使用一次空间。数据量大了压缩的优势才体现出来。如图所示:压缩后的csv文档仍然有1G多,但xlsx只有100M

而且csv压缩后的大小也远远大于xlsx格式,如图所示:

相关推荐
芒果很香2 小时前
MFC中使用EXCEL的方法之一
excel·mfc
y1y1z4 小时前
EasyExcel篇
java·excel
CHENFU_JAVA6 小时前
EasyExcel 合并单元格最佳实践:基于注解的自动合并与样式控制
java·excel
cxyll12346 小时前
从接口自动化测试框架设计到开发(三)主流程封装、返回数据写入excel
前端·python·excel
QuZhengRong1 天前
【数据库】Navicat 导入 Excel 数据乱码问题的解决方法
android·数据库·excel
没有羊的王K2 天前
随想记-excel报表美化
excel
Full Stack Developme3 天前
Java后台生成多个Excel并用Zip打包下载
java·开发语言·excel
芦骁骏4 天前
自动处理考勤表——如何使用Power Query,步步为营,一点点探索自定义函数
数据分析·excel·powerbi
用户8356290780515 天前
使用 C# 将 DataTable 写入 Excel(基于 Spire.XLS for .NET)
excel
迪尔~6 天前
Apache POI中通过WorkBook写入图片后出现导出PDF文件时在不同页重复写入该图片问题,如何在通过sheet获取绘图对象清除该图片
java·pdf·excel