看到Pandas我可就不困了,这是我用的最多的工具。
Pandas作为Python数科领域最顶级的库之一,就像excel之于office,是处理数据必备工具。
Pandas的学习教程自然不会少,在Github上搜索Pandas,会出现超过6万个项目,可见其受众之多。
如果说学习Pandas最好的教程是什么,那毫无疑问是官方文档,从小白到高手,它都给你安排的妥妥的,这个后面详细介绍。
下面我会从入门、进阶、练习四个三面给你们推荐相应的教程和资源。
如果你对Pandas还不了解,可以先看我这篇介绍
朱卫军:为什么Pandas是最流行的Python数据分析库?
一、入门教程
这是Pandas官网专门为新手写的入门引导,大概就几千字,包括对Pandas的简要介绍,和一些基本的功能函数。
主要的内容有:数据的创建、查看、筛选、拼接、连接、分组、变形、可视化等等。
而且这个小册子包含了很多代码示例,如果你能完整过一遍,入门Pandas基本没啥问题。
中文版似乎也有,但翻译的准确性大家自己识别斟酌下。
这本书不用了说了,可能是你入门python数据分析的第一本书,它的作者是Pandas库的核心开发者,也就是说这本书相当于是Pandas的官方出版教程。
为什么它适合入门pandas,因为整本书的编排是从数据分析的角度切入的,由浅入深将pandas对数据的处理讲的很透彻。
当然这本书也存在知识点过于零碎,翻译不到位的问题,但整体来说是本好书。
w3school的pandas文档, 逻辑比较清晰,也是从数据分析角度去讲pandas。
数据科学平台kaggle提供的pandas入门教程,共六大节涵盖了pandas数据处理各种方法。
国内小伙伴写的Pandas笔记,挺详细的,大家可以去下载项目里的notebook,放到自己电脑里练习。
二、进阶教程
这是pandas官网的教程,非常详细,主要从数据处理的角度介绍相应的pandas函数,方便用户查阅。
如果你的英文还不错,也喜欢阅读技术文档,我是建议花时间把这份指南看一遍,配合练习。
我把整个pandas文档下载下来,发现足足有3000多页。
官网的pandas api集合,也就是pandas所有函数方法的使用规则,是字典式的教程,建议多查查。
这是一个开源文档,作者不光介绍了Pandas的基本语法,还给出了大量的数据案例,让你在分析数据的过程中熟悉pandas各种操作。
数据科学书册,不光有pandas,还有ipython、numpy、matplotlib、sklearn,这些都是深入学习pandas不可缺少的工具。
三、练习资源
github上一个练习项目,针对pandas每个功能都有对应的真实数据练习。
一位国外博主总结的100多个pandas练习题,非常全面。
数据科学教程网站,里面有大量pandas的练习题,还提供了详细的速查表。
四、小结
pandas的教程主要还是以英文为主,国内翻译的质量参差不齐,还是建议你在入门后多去看英文文档,这是第一手资料,也是最靠谱的。