数据分析基础之《pandas(2)—基本数据操作》

一、读取一个真实的股票数据

1、读取数据

python 复制代码
# 基本数据操作
data = pd.read_csv("./stock_day.csv")

data

# 删除一些列,使数据简洁点
data = data.drop(['ma5','ma10','ma20','v_ma5','v_ma10','v_ma20'], axis=1)

data

二、索引操作

1、numpy当中我们已经讲过使用索引选取序列和切片选择,pandas也支持类似操作

2、直接使用行列索引(先列后行)

因为dataframe带了行列索引,所以可以直接用它的,要注意先列后行

python 复制代码
data['open']['2018-02-26']

3、按名字索引

结合loc函数使用,通过行标签索引行数据,可以多行,可以[行标签, 列标签]

python 复制代码
data.loc['2018-02-26','open']

4、按数字索引

结合iloc函数使用,通过行号索引行数据

python 复制代码
data.iloc[1, 0]

5、组合索引

结合ix函数使用,注意ix函数在0.20.0版本已经废弃

获取行第1天到第4天,['open','close','high','low']这四个指标的结果

data.ix[0:4, ['open','close','high','low']]

组合索引目前已经整合到iloc里,直接用iloc进行组合索引

python 复制代码
# 推荐使用loc和iloc方式获取
data.loc[data.index[0:4], ['open','close','high','low']]

data.iloc[0:4, data.columns.get_indexer(['open','close','high','low'])]

三、赋值操作

1、修改一整列

data.open = 100

2、赋值某一个字段

用上面索引方法找到这一个值,然后赋值

修改第2行第1列

data.iloc[1, 0] = 222

四、排序

1、排序有两种形式,一种对内容进行排序,一种对索引进行排序

2、DataFrame

sort_values(by=, ascending=)

对内容进行排序

说明:

(1)by:单个键或者多个键进行排序,默认升序

(2)ascending=False,降序

(3)ascending=True,升序

python 复制代码
# 按照涨跌幅大小进行排序,使用ascending指定
data.sort_values(by='p_change', ascending=False)
python 复制代码
# 按多个字段进行排序
data.sort_values(by=['high','p_change'], ascending=False)

sort_index()

对索引进行排序

python 复制代码
# 对索引进行排序
data.sort_index()

3、Series

sort_values(ascending=)

对内容进行排序

sort_index()

对索引进行排序

python 复制代码
# Series排序
sr = data['price_change']

sr

sr.sort_values(ascending=False)

sr.sort_index()
相关推荐
D11_1 小时前
Pandas缺失值处理
python·机器学习·数据分析·numpy·pandas
Kenneth風车4 小时前
【机器学习(五)】分类和回归任务-AdaBoost算法-Sentosa_DSML社区版
人工智能·算法·低代码·机器学习·数据分析
知识分享小能手4 小时前
mysql学习教程,从入门到精通,SQL DISTINCT 子句 (16)
大数据·开发语言·sql·学习·mysql·数据分析·数据库开发
阡之尘埃7 小时前
Python数据分析案例59——基于图神经网络的反欺诈交易检测(GCN,GAT,GIN)
python·神经网络·数据挖掘·数据分析·图神经网络·反欺诈·风控大数据
环能jvav大师7 小时前
基于R语言的统计分析基础:使用dplyr包进行数据操作
大数据·开发语言·数据分析·r语言
惟长堤一痕9 小时前
医学数据分析实训 项目三 关联规则分析作业--在线购物车分析--痹症方剂用药规律分析
python·数据分析
经纬恒润9 小时前
应用案例分享 | 智驾路试数据分析及 SiL/HiL 回灌案例介绍
数据挖掘·数据分析·智能驾驶·ai智能体
eeee~~9 小时前
GeoPandas在地理空间数据分析中的应用
python·jupyter·信息可视化·数据分析·geopandas库
数分大拿的Statham10 小时前
PostgreSQL中的regexp_split_to_table函数详解,拆分字段为多行
大数据·数据库·postgresql·数据分析·数据清洗
Kenneth風车13 小时前
【第十三章:Sentosa_DSML社区版-机器学习聚类】
人工智能·低代码·机器学习·数据分析·聚类