数据分析基础之《pandas(1)—pandas介绍》

一、pandas介绍

1、2008年Wes McKinney(韦斯·麦金尼)开发出的库

2、专门用于数据分析的开源python库

3、以numpy为基础,借力numpy模块在计算方面性能高的优势

4、基于matplotlib能够简便的画图

5、独特的数据结构

6、也是三个单词组合而成:panel + data + analysis

面板数据 - 来源于计量经济学,通常用来存储三维的数据

二、为什么使用pandas

1、numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas用在什么地方

2、便捷的数据处理能力

3、读取文件方便

4、封装了matplotlib、numpy的画图和计算

三、核心数据结构

1、pandas三大数据结构

DataFrame、Panel、Series

四、DataFrame

1、DataFrame结构

既有行索引,又有列索引的二维数组

2、如何创建更有意义的数据

python 复制代码
import numpy as np
# 创建一个符合正态分布的10个股票5天的涨跌幅数据
stock_change = np.random.normal(0, 1, (10, 5))

stock_change

import pandas as pd
# 加上行列索引
pd.DataFrame(stock_change)

# 添加行索引
stock = ["股票%s" %str(i) for i in range (10)]

pd.DataFrame(stock_change, index=stock)

# 添加列索引
data = pd.date_range(start="20180101", periods=5, freq="B")

data

pd.DataFrame(stock_change, index=stock, columns=data)

3、DataFrame对象既有行索引,又有列索引

行索引:表明不同行,横向索引,叫index

列索引:表明不同列,纵向索引,叫columns

4、DataFrame的属性

常用属性:

(1)shape

(2)index:DataFrame的行索引列表

(3)columns:DataFrame的列索引列表

(4)values:直接获取其中array的值(排除行索引列索引后的值,就是ndarray)

(5)T:行列的转置

常用方法:

head():前几行

tail():后几行

相关推荐
TechWayfarer11 分钟前
营销数据分析:如何利用IP归属地识别和规避虚假流量
网络·数据库·python·tcp/ip·数据分析
容智信息42 分钟前
不写SQL,不拉Excel:数据分析用“问”的
数据库·人工智能·笔记·数据分析·excel·知识图谱·知识库
Non-existent98717 小时前
TableGIS的WPS扩展项插件-通信网优规划相关地理空间数据处理
数据分析·excel·wps
纪伊路上盛名在19 小时前
机器学习中常见的距离度量函数 Distance metrics
人工智能·算法·机器学习·数据分析·统计
纪伊路上盛名在19 小时前
聊一聊关于gene的富集分析
算法·数据分析·统计分析·计算生物·gene
鹧鸪云光伏20 小时前
光储一体化:相关功能深度解析
信息可视化·数据分析·光伏·光储·储能设计方案
生物信息与育种21 小时前
实战总结:用 rMVP 做植物 GWAS 的标准工作流与避坑指南
人工智能·深度学习·职场和发展·数据分析·r语言
下次再写21 小时前
2026年Java开发者Python学习全攻略:从入门到实战
python·数据分析·web开发·ai应用·学习路径·java开发者·2026技术趋势
2601_954971131 天前
没有SQL基础能学数据分析吗?先学什么更合适
数据库·sql·数据分析
SelectDB1 天前
AI Agent 场景下,万级 JSON 字段的性能挑战与优化实践
数据库·人工智能·数据分析