dataframe保存excel格式比csv格式小很多很多

问题描述:

一个3万行的数据保存成csv大概10个G,但保存成excel格式只有100多M

原因分析:

因为xlsx 实际上就是 zip 压缩包,同时,如果有大量重复的数据,XLSX 会提取文本值,将其存储在查找表中,这意味着每个文本字符串只需要使用一次空间。数据量大了压缩的优势才体现出来。如图所示:压缩后的csv文档仍然有1G多,但xlsx只有100M

而且csv压缩后的大小也远远大于xlsx格式,如图所示:

相关推荐
rannn_1111 天前
【学以致用|python自动化办公】OCR批量识别自动存为Excel(批量识别发票)
python·ocr·excel·财务
小钱c71 天前
Python使用 pandas操作Excel文件并新增列数据
python·excel·pandas
Shi_haoliu1 天前
Vue2 + Office Add-in关于用vue项目于加载项控制excel单元格内容(Demo版)
前端·javascript·vue.js·node.js·html·excel·office
njsgcs1 天前
json转excel python pd
python·json·excel·pd
RECRUITGUY1 天前
Excel中将毫秒时间戳转换为标准时间格式
excel
SunkingYang1 天前
详细介绍C++中捕获异常类型的方式有哪些,分别用于哪些情形,哪些异常捕获可用于通过OLE操作excel异常
c++·excel·mfc·异常捕获·comerror
lied16636348062 天前
List导出到Excel文件
servlet·list·excel
ZhengEnCi2 天前
Excel 文件结构完全指南-从基础概念到 Python 读取的实用宝典
python·excel
核桃杏仁粉2 天前
excel拼接数据库
数据库·oracle·excel
cx330上的猫2 天前
价值1w的数据分析课知识点汇总-excel使用(第一篇)
数据挖掘·数据分析·excel