dataframe保存excel格式比csv格式小很多很多

问题描述:

一个3万行的数据保存成csv大概10个G,但保存成excel格式只有100多M

原因分析:

因为xlsx 实际上就是 zip 压缩包,同时,如果有大量重复的数据,XLSX 会提取文本值,将其存储在查找表中,这意味着每个文本字符串只需要使用一次空间。数据量大了压缩的优势才体现出来。如图所示:压缩后的csv文档仍然有1G多,但xlsx只有100M

而且csv压缩后的大小也远远大于xlsx格式,如图所示:

相关推荐
梦幻通灵1 天前
Excel序列生成的4种方案实战
excel
2501_930707782 天前
使用C#代码将 Excel 转换为 ODS,或将 ODS 转换为 Excel
excel
缺点内向2 天前
如何在 C# .NET 中将 Markdown 转换为 PDF 和 Excel:完整指南
pdf·c#·.net·excel
m5655bj2 天前
如何通过 Python 在 Excel 中添加或删除图片
python·excel
伍一512 天前
芋道框架下的进销存升级(三):Yudao-ERP2异步导出/导入Excel的设计与实现
java·excel·异步导出excel
CodeCraft Studio2 天前
Excel处理控件Aspose.Cells教程:使用C#在Excel中创建旭日图
c#·excel·aspose·excel旭日图·excel库·excel开发控件·excel api库
过期的秋刀鱼!2 天前
Excel-数据分析开发心得(工具PQ,PP)与开发经验
大数据·数据分析·excel·模型搭建·数据优化·powerquery·powerpivot
凯子坚持 c2 天前
CodeRider-Kilo 驱动下的 Python Excel 自动化开发全流程深度解析
python·自动化·excel
啊哈哈哈哈啊有3 天前
导出树形结构,excel
java·windows·excel
Dxy12393102163 天前
Elasticsearch 聚合入门:像 Excel 透视表一样分析数据
elasticsearch·excel