Pandas取代Excel?

有人在知乎上提问:为什么大公司不用pandas取代excel?

而且列出了几个理由:Pandas功能比Excel强大,运行速度更快,Excel除了简单和可视化界面外,没有其他更多的优势。

有个可怕的现实是,对比Excel,光是运行成功print('hello world')已经劝退95%的人了。

Excel的核心优势就是操作方便,哪个Top级产品不是把用户路径优化到极致的,某种意义上来说Python也是编程语言里的Excel、WeChat。

何况Pandas和Excel不存在竞争关系,反而是合作关系。

Pandas是基于Python的数据处理编程语言,能支持Excel格式文件的导入导出,Excel是商业图形化表格软件,使用场景不一样,用户对象不一样。

Excel的最大的特点在于操作足够简单、功能足够实用、传播足够便捷,这是任何其他同类工具替代不了的,很难想象你不用xlsx,而是发个py文件给老板。

所以Pandas的优势对于Excel用户来说形同虚设,你总不能要求财务的人放弃Excel,哼哧哼哧的用Pandas整理账单报表。

问题里提到几点pandas可以替代的Excel的理由,但其实都站不住脚。

1、Pandas功能远比Excel多?

这绝对是Excel小白用户的错觉。

现实情况是Pandas能做的事,Excel都可以做,Pandas不能做的事,Excel也可以做。

大众常用的Excel功能占不到全部功能的5%,多数情况下你无非是拿Excel来存储数据、制作表格、可视化图表,稍复杂一点可能会用到透视表、vlookup等,但这些只是Excel的开胃小菜。

Excel的Power Query是数据清洗处理的神器,可以做各种数据的合并、组合、透视等操作,对比pandas丝毫不含糊。

Excel中的​​Power Pivot是大数据处理和建模神器,支持千万级数据的快速处理,以及各种模型搭建,还有DAX函数应用。

Excel的VBA和宏是自动化数据处理神器,不光能编写自动化动作,还能结合各种API实现商业级系统的数据对接和产品开发,什么BI报表、财务系统、量化系统、订单系统等,都可以开发。

这里不一一例举,可能咨询公司和金融领域的人对Excel的功能之强大感受更明显。

其实对于大众来说,Excel里5%的常用功能已经能满足日常工作95%的需求了,这是事实,所以Excel的流行不是它功能多,而是产品设计真的符合用户需求。

Pandas的功能强大不在于比Excel数据处理能力强,而是能力边界更广,整个Python生态都可以为它所用,能结合sklearn、matplotlib、numpy、tensorflow等各种框架,处理多样化复杂任务、跨领域任务、重复性任务等数据问题。

2、Excel运行速度远不是Pandas对手?

这个确实这样,在处理数据清洗、数据建模、大数据时,Excel运行速度比Pandas慢,因为Excel是图形化软件,依赖电脑性能,且多数情况下需要手工点点点操作,而Pandas直接跑Python代码,而且有并行优化机制,能快速处理数据。

但是,使用Excel的人对速度其实要求很低,日常拉个销售日报、透视下产品利润、绘制个走势图,几分钟能做的事,何必写pandas来处理。

真正需要Pandas处理是重复性高、数据量大、过程复杂的任务,比如量化策略,要实时处理几百万行日线数据,这就要用到pandas,写个脚本,放在服务器上跑。

再比如算法开发,需要不断更改数据、调试模型,Pandas就很适合这样的任务,只需要更新一些代码,便可以重跑整个过程。

3、Pandas除了不能搞出Excel这么多种颜色,字体,格式,别的真没什么了?

Excel本身就是可视化的表格软件,格式和可视化的多元化也是其产品特点,做好表截个图就能发给领导交差,多么方便的事。

Pandas本身就不是干可视化表格的事,它是数据处理语言,其在notebook渲染的表格样式,也是方便对数据做处理,而是用于可视化展示。

Excel和Pandas其实各有所长,谁也替代不了谁,对用户来说,应该根据需求来选择工具,让工具更好的服务自己。

相关推荐
Coding_Doggy2 小时前
苍穹外卖Day12 | Apache POI、导出Excel报表、HttpServletResponse、工作台
excel
Calihen的学习日志2 小时前
【Pandas】3.1-数据预处理:列的基本操作
python·pandas
l1t19 小时前
张泽鹏先生手搓的纯ANSI处理UTF-8与美团龙猫调用expat库读取Excel xml对比测试
xml·人工智能·excel·utf8·expat
Source.Liu1 天前
【Python自动化】 21.2 Pandas 读取 Excel 时的 dtype 参数完全指南
python·自动化·pandas
Source.Liu1 天前
【Python自动化】 21 Pandas Excel 操作完整指南
python·excel·pandas
Source.Liu1 天前
【Python自动化】 21.1 Pandas 读取 Excel 文件的完整指南
python·自动化·pandas
会飞的小菠菜1 天前
如何根据Excel数据表生成多个合同、工作证、录取通知书等word文件?
word·excel·模板·数据表·生成文件
Access开发易登软件2 天前
Access开发导出PDF的N种姿势,你get了吗?
后端·低代码·pdf·excel·vba·access·access开发
課代表2 天前
VBA 中的 Excel 工作表函数
excel·vba·函数·对象·属性·range·静态变量
UrbanJazzerati2 天前
掌握 xlwings 的 used_range:高效处理 Excel 数据区域
python·面试·excel