数据分析基础之《pandas(1)—pandas介绍》

一、pandas介绍

1、2008年Wes McKinney(韦斯·麦金尼)开发出的库

2、专门用于数据分析的开源python库

3、以numpy为基础,借力numpy模块在计算方面性能高的优势

4、基于matplotlib能够简便的画图

5、独特的数据结构

6、也是三个单词组合而成:panel + data + analysis

面板数据 - 来源于计量经济学,通常用来存储三维的数据

二、为什么使用pandas

1、numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas用在什么地方

2、便捷的数据处理能力

3、读取文件方便

4、封装了matplotlib、numpy的画图和计算

三、核心数据结构

1、pandas三大数据结构

DataFrame、Panel、Series

四、DataFrame

1、DataFrame结构

既有行索引,又有列索引的二维数组

2、如何创建更有意义的数据

python 复制代码
import numpy as np
# 创建一个符合正态分布的10个股票5天的涨跌幅数据
stock_change = np.random.normal(0, 1, (10, 5))

stock_change

import pandas as pd
# 加上行列索引
pd.DataFrame(stock_change)

# 添加行索引
stock = ["股票%s" %str(i) for i in range (10)]

pd.DataFrame(stock_change, index=stock)

# 添加列索引
data = pd.date_range(start="20180101", periods=5, freq="B")

data

pd.DataFrame(stock_change, index=stock, columns=data)

3、DataFrame对象既有行索引,又有列索引

行索引:表明不同行,横向索引,叫index

列索引:表明不同列,纵向索引,叫columns

4、DataFrame的属性

常用属性:

(1)shape

(2)index:DataFrame的行索引列表

(3)columns:DataFrame的列索引列表

(4)values:直接获取其中array的值(排除行索引列索引后的值,就是ndarray)

(5)T:行列的转置

常用方法:

head():前几行

tail():后几行

相关推荐
没有梦想的咸鱼185-1037-16632 小时前
AI大模型支持下的:R-Meta分析核心技术:从热点挖掘到高级模型、助力高效科研与论文发表
开发语言·人工智能·机器学习·chatgpt·数据分析·r语言·ai写作
B站计算机毕业设计超人15 小时前
计算机毕业设计Python+大模型音乐推荐系统 音乐数据分析 音乐可视化 音乐爬虫 知识图谱 大数据毕业设计
人工智能·hadoop·爬虫·python·数据分析·知识图谱·课程设计
德昂信息dataondemand15 小时前
销售分析中的痛点与解决之道
大数据·数据分析
weixin_4624462318 小时前
Python 解析 Excel 图表(Chart)信息实战:从 xlsx 中提取标题、字体和数据
python·数据分析·excel·报表自动化
反向跟单策略20 小时前
如何正确看待期货反向跟单策略?
大数据·人工智能·学习·数据分析·区块链
徐先生 @_@|||20 小时前
数据分析体系全览导图综述
大数据·hadoop·分布式·数据分析
q_354888515320 小时前
机器学习:Python地铁人流量数据分析与预测系统 基于python地铁数据分析系统+可视化 时间序列预测算法 ✅
大数据·人工智能·python·算法·机器学习·信息可视化·数据分析
rgb2gray20 小时前
AI 的“诚实”指南:一文详解 Conformal Prediction (共形预测) 与 Split Conformal
人工智能·python·机器学习·数据分析·可解释·共性预测·一致性预测
叫我:松哥1 天前
基于YOLO深度学习算法的人群密集监测与统计分析预警系统,实现人群密集度的实时监测、智能分析和预警功能,支持图片和视频流两种输入方式
人工智能·深度学习·算法·yolo·机器学习·数据分析·flask
AIFQuant1 天前
2026 全球股市实时行情数据 API 对比指南
python·websocket·金融·数据分析·restful