dataframe保存excel格式比csv格式小很多很多

问题描述:

一个3万行的数据保存成csv大概10个G,但保存成excel格式只有100多M

原因分析:

因为xlsx 实际上就是 zip 压缩包,同时,如果有大量重复的数据,XLSX 会提取文本值,将其存储在查找表中,这意味着每个文本字符串只需要使用一次空间。数据量大了压缩的优势才体现出来。如图所示:压缩后的csv文档仍然有1G多,但xlsx只有100M

而且csv压缩后的大小也远远大于xlsx格式,如图所示:

相关推荐
asdzx673 小时前
Python 优雅解析 Excel:从原生行列到强类型对象的三层数据结构演进
数据结构·python·excel
罗政4 小时前
AI工作流实现Excel自动化+SQL,零 VBA ,零公式,电商订单分析案例 | DTBot
sql·自动化·excel
AC赳赳老秦19 小时前
OpenClaw+Power Apps 实战:自动生成 Power Apps 应用、连接 Excel 数据源
大数据·开发语言·python·serverless·excel·deepseek·openclaw
tsfy20031 天前
Python批量调整Excel格式,并排版导出PDF
python·pdf·excel
快乐的哈士奇1 天前
Gmail-邮件自动处理系统
node.js·自动化·excel
123的故事2 天前
工具分享(7)-多Excel文件内容查询工具
c#·excel·实用工具
hikktn2 天前
Excel 导出 OOM 预防实战:30 万行从堆溢出到 50MB 的演进
java·excel·easyexcel
yunceqing2 天前
从Excel调度到TMS平台:物流软件开发避坑清单
大数据·前端·网络·人工智能·excel·推荐算法
什仙2 天前
Mathcad Prime 对比 Excel/MATLAB/Mathematica:核心优势速览
excel
快乐的哈士奇2 天前
【Next.js实战②】Excel 派送表动态解析:表头识别与 FIELD_ALIASES 映射
前端·javascript·excel