一、读取一个真实的股票数据
1、读取数据
python
# 基本数据操作
data = pd.read_csv("./stock_day.csv")
data
# 删除一些列,使数据简洁点
data = data.drop(['ma5','ma10','ma20','v_ma5','v_ma10','v_ma20'], axis=1)
data
data:image/s3,"s3://crabby-images/e30bf/e30bf6e0b853ae379d4805d18209a0e9fa001cc4" alt=""
二、索引操作
1、numpy当中我们已经讲过使用索引选取序列和切片选择,pandas也支持类似操作
2、直接使用行列索引(先列后行)
因为dataframe带了行列索引,所以可以直接用它的,要注意先列后行
python
data['open']['2018-02-26']
data:image/s3,"s3://crabby-images/5ecc3/5ecc360948e564793495647152c81ecc3d52aede" alt=""
3、按名字索引
结合loc函数使用,通过行标签索引行数据,可以多行,可以[行标签, 列标签]
python
data.loc['2018-02-26','open']
data:image/s3,"s3://crabby-images/143e3/143e39c875824b69902209aa82c8849d4616dc7d" alt=""
4、按数字索引
结合iloc函数使用,通过行号索引行数据
python
data.iloc[1, 0]
data:image/s3,"s3://crabby-images/cacf6/cacf63b0a764c5d08892905650d9164fdfe35acb" alt=""
5、组合索引
结合ix函数使用,注意ix函数在0.20.0版本已经废弃
获取行第1天到第4天,['open','close','high','low']这四个指标的结果
data.ix[0:4, ['open','close','high','low']]
组合索引目前已经整合到iloc里,直接用iloc进行组合索引
python
# 推荐使用loc和iloc方式获取
data.loc[data.index[0:4], ['open','close','high','low']]
data.iloc[0:4, data.columns.get_indexer(['open','close','high','low'])]
data:image/s3,"s3://crabby-images/ca1c3/ca1c37921b25a3bc362b2ac6fd816784b820484e" alt=""
三、赋值操作
1、修改一整列
data.open = 100
2、赋值某一个字段
用上面索引方法找到这一个值,然后赋值
修改第2行第1列
data.iloc[1, 0] = 222
四、排序
1、排序有两种形式,一种对内容进行排序,一种对索引进行排序
2、DataFrame
sort_values(by=, ascending=)
对内容进行排序
说明:
(1)by:单个键或者多个键进行排序,默认升序
(2)ascending=False,降序
(3)ascending=True,升序
python
# 按照涨跌幅大小进行排序,使用ascending指定
data.sort_values(by='p_change', ascending=False)
data:image/s3,"s3://crabby-images/2c312/2c3126cfc741eba229f3d45614675ddc574ece4f" alt=""
python
# 按多个字段进行排序
data.sort_values(by=['high','p_change'], ascending=False)
data:image/s3,"s3://crabby-images/e6b60/e6b609d948fec039b6354c6ae281da9e87e5d756" alt=""
sort_index()
对索引进行排序
python
# 对索引进行排序
data.sort_index()
data:image/s3,"s3://crabby-images/1a18b/1a18b93d4b2ba44ffeb5693b31085f6dfd58958e" alt=""
3、Series
sort_values(ascending=)
对内容进行排序
sort_index()
对索引进行排序
python
# Series排序
sr = data['price_change']
sr
sr.sort_values(ascending=False)
sr.sort_index()
data:image/s3,"s3://crabby-images/dcfb7/dcfb7975fd729277f5d3f711a33c719e1e52b64d" alt=""