
大家好,我是张大鹏,欢迎来到大鹏AI教育。 在 AI 时代,我们一起学编程、做项目,把技术真正用起来。
Pandas 是 Python 中非常重要的一个数据分析库。 它最早由 Wes McKinney(韦斯·麦金尼) 在 2008 年左右开发。 当时,Wes McKinney 在一家量化投资公司 AQR Capital Management(AQR 资本管理公司) 工作。

在工作中,他经常需要用 Python 处理大量金融数据,比如股票价格、交易记录、行情数据和时间序列数据。 但是那个时候,Python 虽然已经很好用,却缺少一个专门处理表格数据和数据分析的工具。 比如: 一份金融数据里,可能有日期、股票代码、开盘价、收盘价、成交量等字段。 这些数据看起来很像 Excel 表格,但如果数据量很大,用普通 Python 代码处理起来就会比较麻烦。
于是,Wes McKinney 开始开发一个新的工具。 这个工具的目标很明确: 让 Python 更方便、更高效地处理表格数据。 这就是后来我们熟悉的 Pandas。

Pandas 最早主要用于金融行业。 因为金融行业每天都会产生大量数据,而且这些数据经常需要进行清洗、筛选、统计和分析。 Pandas 正好解决了这些问题,所以很快受到量化分析师、交易员和研究人员的欢迎。 后来,随着 Python 越来越流行,Pandas 也逐渐走出金融行业,被应用到更多数据分析场景中。

这一节我们只需要记住一句话: Pandas 最早诞生于金融数据分析场景,它的出现,是为了解决 Python 处理表格数据不够方便的问题。 后面我们学习 Pandas,其实就是学习如何用 Python 高效地处理表格数据。
好了,这节课我们就先讲到这里。 我是张大鹏,关注大鹏AI教育,我们一起在 AI 时代学编程、做项目。