1.Numpy:
Numpy是python科学计算的基础包,它提供以下功能(不限于此):
(1)快速高效的多维数组对象ndarray
(2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数
(3)用于读写硬盘上基于数组的数据集的工具
(4)线性代数运算、傅里叶变换,以及随机数生成
(5)用于将C、C++、Fortran代码集成到python的工具
2.pandas
pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据(如SQL)灵活的数据处理能力。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。
对于金融行业的用户,pandas提供了大量适用于金融数据的高性能时间序列功能和工具。
DataFrame是pandas的一个对象,它是一个面向列的二维表结构,且含有行标和列标。
ps.引用一段网上的话说明DataFrame的强大之处:
Excel 2007及其以后的版本的最大行数是1048576,最大列数是16384,超过这个规模的数据Excel就会弹出个框框“此文本包含多行文本,无法放置在一个工作表中”。Pandas处理上千万的数据是易如反掌的事情,同时随后我们也将看到它比SQL有更强的表达能力,可以做很多复杂的操作,要写的code也更少。 说了一大堆它的好处,要实际感触还得动手码代码。
3.matplotlib
matplotlib是最流行的用于绘制数据图表的python库。
4.Scipy
Scipy是一组专门解决科学计算中各种标准问题域的包的集合。
5.statsmodels: https://github.com/statsmodels/statsmodels
6.scikit-learn: http://scikit-learn.org/stable/
各种和数据分析相关python库的介绍
天地沧海2025-12-03 8:06
相关推荐
Pyeako5 小时前
深度学习--卷积神经网络(下)OPEN-Source5 小时前
大模型实战:搭建一张“看得懂”的大模型应用可观测看板廖圣平5 小时前
从零开始,福袋直播间脚本研究【七】《添加分组和比特浏览器》B站_计算机毕业设计之家5 小时前
豆瓣电影数据可视化分析系统 | Python Flask框架 requests Echarts 大数据 人工智能 毕业设计源码(建议收藏)✅mr_LuoWei20096 小时前
python工具:python代码知识库笔记weixin_395448916 小时前
cursor日志天天爱吃肉82186 小时前
【跨界封神|周杰伦×王传福(陶晶莹主持):音乐创作与新能源NVH测试,底层逻辑竟完全同源!(新人必看入行指南)】岱宗夫up6 小时前
Python 数据分析入门码界筑梦坊6 小时前
325-基于Python的校园卡消费行为数据可视化分析系统asheuojj6 小时前
2026年GEO优化获客效果评估指南:如何精准衡量TOP5关