数据分析基础之《pandas(1)—pandas介绍》

一、pandas介绍

1、2008年Wes McKinney(韦斯·麦金尼)开发出的库

2、专门用于数据分析的开源python库

3、以numpy为基础,借力numpy模块在计算方面性能高的优势

4、基于matplotlib能够简便的画图

5、独特的数据结构

6、也是三个单词组合而成:panel + data + analysis

面板数据 - 来源于计量经济学,通常用来存储三维的数据

二、为什么使用pandas

1、numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas用在什么地方

2、便捷的数据处理能力

3、读取文件方便

4、封装了matplotlib、numpy的画图和计算

三、核心数据结构

1、pandas三大数据结构

DataFrame、Panel、Series

四、DataFrame

1、DataFrame结构

既有行索引,又有列索引的二维数组

2、如何创建更有意义的数据

python 复制代码
import numpy as np
# 创建一个符合正态分布的10个股票5天的涨跌幅数据
stock_change = np.random.normal(0, 1, (10, 5))

stock_change

import pandas as pd
# 加上行列索引
pd.DataFrame(stock_change)

# 添加行索引
stock = ["股票%s" %str(i) for i in range (10)]

pd.DataFrame(stock_change, index=stock)

# 添加列索引
data = pd.date_range(start="20180101", periods=5, freq="B")

data

pd.DataFrame(stock_change, index=stock, columns=data)

3、DataFrame对象既有行索引,又有列索引

行索引:表明不同行,横向索引,叫index

列索引:表明不同列,纵向索引,叫columns

4、DataFrame的属性

常用属性:

(1)shape

(2)index:DataFrame的行索引列表

(3)columns:DataFrame的列索引列表

(4)values:直接获取其中array的值(排除行索引列索引后的值,就是ndarray)

(5)T:行列的转置

常用方法:

head():前几行

tail():后几行

相关推荐
云天徽上4 小时前
【数据可视化-94】2025 亚洲杯总决赛数据可视化分析:澳大利亚队 vs 中国队
python·信息可视化·数据挖掘·数据分析·数据可视化·pyecharts
我要学习别拦我~18 小时前
读《精益数据分析》:规模化(Scale)—— 复制成功,进军新市场
经验分享·数据分析
阿里云大数据AI技术1 天前
ODPS 十五周年实录 | 为 AI 而生的数据平台
大数据·数据分析·开源
SelectDB技术团队1 天前
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
数据库·数据仓库·数据分析·apache doris·菜鸟技术
一个处女座的程序猿1 天前
DataAnalytics之Tool:Metabase的简介、安装和使用方法、案例应用之详细攻略
数据分析
喂完待续2 天前
【Tech Arch】Spark为何成为大数据引擎之王
大数据·hadoop·python·数据分析·spark·apache·mapreduce
源码宝2 天前
【智慧工地源码】智慧工地云平台系统,涵盖安全、质量、环境、人员和设备五大管理模块,实现实时监控、智能预警和数据分析。
java·大数据·spring cloud·数据分析·源码·智慧工地·云平台
SelectDB2 天前
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
数据库·人工智能·数据分析
数据超市2 天前
香港数据合集:建筑物、手机基站、POI、职住数据、用地类型
大数据·人工智能·智能手机·数据挖掘·数据分析
SelectDB2 天前
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
大数据·数据分析·开源