Pandas进阶修炼120题-第三期(金融数据处理,51-80题)

目录

自己再写一遍的pandas习题,相比于标准答案添加了自己的理解与注释,也可直接下载链接上的习题
链接:https://pan.baidu.com/s/1arrqcBFZKqJngzRzUB2QfA?pwd=29eb
提取码:29eb
--来自百度网盘超级会员V3的分享

往期内容:

第一期:Pandas基础(1-20题)

第二期:Pandas数据处理(21-50题)

第三期 金融数据处理

python 复制代码
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

51.使用绝对路径读取本地Excel数据

方法一:双反斜杠绝对路径

python 复制代码
data = pd.read_excel('pandas120_51_80.xlsx')
python 复制代码
data = pd.read_excel('C:\\Users\\XXX\\Desktop\\DataAnalyse\\组内出数任务\\data1\\pandas120\\pandas120_51_80.xlsx')

方法二:r' '

python 复制代码
![请添加图片描述](https://img-blog.csdnimg.cn/4972169546374a668c2d253927c331b1.png)
data = pd.read_excel(r'C:\Users\XXX\Desktop\DataAnalyse\组内出数任务\data1\pandas120\pandas120_51_80.xlsx')

拓展:关于正斜杠(' / ')和反斜杠(' \ ')

关于正斜杠(' / ')和反斜杠(' \ '):

在文件路径中使用正斜杠(' / ')还是反斜杠(' \ ')取决于所使用的操作系统。这里有一个简短的概述:

  1. 正斜杠(' / '):这是Unix和类Unix系统(如Linux和macOS)的标准。例如,Unix系统中的路径可能看起来像' /home/user/documents/file.txt '。

  2. 反斜杠(' \ '):这是Windows的标准。例如,Windows系统中的路径可能看起来像"C:\Users\Username\Documents\file.txt"。

然而,有几件事要记住:

  • 在许多编程语言中,反斜杠(' \ ')是一个转义字符,这意味着它用于引入特殊字符序列。例如,' \n '是换行符,' \t '是制表符。因此,如果您在Python或Java等语言的路径中使用反斜杠,则需要转义它们(' \ ')或使用原始字符串字面量(例如,在Python中,'r ' c:\path\to\file' ')。

  • 现代版本的Windows在某种程度上是宽容的,并且会接受正斜杠,尽管这有时会导致意想不到的行为,如果一个程序不期望它。通常最好使用您的操作系统的标准格式。

  • 处理url或uri时,无论您的操作系统如何,始终使用正斜杠。这是网址的标准格式。

  • 如果你正在编写一个程序,需要在不同的操作系统之间移植,考虑使用一个函数或库,以一种平台独立的方式处理文件路径。例如,在Python中,你可以使用' os.path.join() '来构造路径,它将使用当前操作系统的正确分隔符。

python 复制代码
# 示例
import os

# This will use the correct separator for the current OS
path = os.path.join('home', 'user', 'documents', 'file.txt')
path
'home\\user\\documents\\file.txt'

52.查看数据前三行

python 复制代码
data.head(3)

| | 代码 | 简称 | 日期 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 0 | 600000.SH | 浦发银行 | 2016-01-04 | 16.1356 | 16.1444 | 16.1444 | 15.4997 | 15.7205 | 42240610 | 754425783 | -0.4151 | -2.5725 | 17.8602 | 0.2264 | 3.320318e+11 | 3.320318e+11 | 1.865347e+10 | 6.5614 |
| 1 | 600000.SH | 浦发银行 | 2016-01-05 | 15.7205 | 15.4644 | 15.9501 | 15.3672 | 15.8618 | 58054793 | 1034181474 | 0.1413 | 0.8989 | 17.8139 | 0.3112 | 3.350163e+11 | 3.350163e+11 | 1.865347e+10 | 6.6204 |

2 600000.SH 浦发银行 2016-01-06 15.8618 15.8088 16.0208 15.6234 15.9855 46772653 838667398 0.1236 0.7795 17.9307 0.2507 3.376278e+11 3.376278e+11 1.865347e+10 6.6720

53.查看每列数据缺失值情况

使用df.isnull().any()只能判断每列有无空值,如果想要输出空值的数量,需要使用df.isnull().sum()

sum():此方法在df.isnull()的结果上调用。由于True等于1,False等于0,因此求和操作将计算每列中True值(即null或NaN值)的数量。

因此,总而言之,df.isnull().sum()是一个方便的一行代码,它将返回DataFrame df的每列中缺失或NaN值的数量。

python 复制代码
data.isnull().any()
代码           True
简称           True
日期           True
前收盘价(元)      True
开盘价(元)       True
最高价(元)       True
最低价(元)       True
收盘价(元)       True
成交量(股)       True
成交金额(元)      True
涨跌(元)        True
涨跌幅(%)       True
均价(元)        True
换手率(%)       True
A股流通市值(元)    True
总市值(元)       True
A股流通股本(股)    True
市盈率          True
dtype: bool
python 复制代码
data.isnull().sum()
代码           1
简称           2
日期           2
前收盘价(元)      2
开盘价(元)       2
最高价(元)       2
最低价(元)       2
收盘价(元)       2
成交量(股)       2
成交金额(元)      2
涨跌(元)        2
涨跌幅(%)       2
均价(元)        2
换手率(%)       2
A股流通市值(元)    2
总市值(元)       2
A股流通股本(股)    2
市盈率          2
dtype: int64

54.提取日期列含有空值的行

python 复制代码
data[data['日期'].isnull()]

| | 代码 | 简称 | 日期 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 327 | NaN | NaN | NaT | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |

328 数据来源:Wind资讯 NaN NaT NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN

55.输出每列缺失值具体行数

方法一:根据列名遍历,直接打印空缺值的行

python 复制代码
for name in data.columns:
    print('{}列,空缺值的行为{}'.format(name,data[data[name].isnull()].index.tolist()))
代码列,空缺值的行为[327]
简称列,空缺值的行为[327, 328]
日期列,空缺值的行为[327, 328]
前收盘价(元)列,空缺值的行为[327, 328]
开盘价(元)列,空缺值的行为[327, 328]
最高价(元)列,空缺值的行为[327, 328]
最低价(元)列,空缺值的行为[327, 328]
收盘价(元)列,空缺值的行为[327, 328]
成交量(股)列,空缺值的行为[327, 328]
成交金额(元)列,空缺值的行为[327, 328]
涨跌(元)列,空缺值的行为[327, 328]
涨跌幅(%)列,空缺值的行为[327, 328]
均价(元)列,空缺值的行为[327, 328]
换手率(%)列,空缺值的行为[327, 328]
A股流通市值(元)列,空缺值的行为[327, 328]
总市值(元)列,空缺值的行为[327, 328]
A股流通股本(股)列,空缺值的行为[327, 328]
市盈率列,空缺值的行为[327, 328]

方法二:标准答案

相比自己写的方法在遍历时多了一步对于该列有无空缺值的判断,代码写的比较清晰

python 复制代码
for name in data.columns:
    if data[name].isnull().any():
        location = data[data[name].isnull() == True].index.to_list()
    print('列名:"{}", 第{}行位置有缺失值'.format(name, location))
列名:"代码", 第[327]行位置有缺失值
列名:"简称", 第[327, 328]行位置有缺失值
列名:"日期", 第[327, 328]行位置有缺失值
列名:"前收盘价(元)", 第[327, 328]行位置有缺失值
列名:"开盘价(元)", 第[327, 328]行位置有缺失值
列名:"最高价(元)", 第[327, 328]行位置有缺失值
列名:"最低价(元)", 第[327, 328]行位置有缺失值
列名:"收盘价(元)", 第[327, 328]行位置有缺失值
列名:"成交量(股)", 第[327, 328]行位置有缺失值
列名:"成交金额(元)", 第[327, 328]行位置有缺失值
列名:"涨跌(元)", 第[327, 328]行位置有缺失值
列名:"涨跌幅(%)", 第[327, 328]行位置有缺失值
列名:"均价(元)", 第[327, 328]行位置有缺失值
列名:"换手率(%)", 第[327, 328]行位置有缺失值
列名:"A股流通市值(元)", 第[327, 328]行位置有缺失值
列名:"总市值(元)", 第[327, 328]行位置有缺失值
列名:"A股流通股本(股)", 第[327, 328]行位置有缺失值
列名:"市盈率", 第[327, 328]行位置有缺失值

56.删除所有存在缺失值的行

python 复制代码
"""
备注
axis:0-行操作(默认),1-列操作
how:any-只要有空值就删除(默认),all-全部为空值才删除
inplace:False-返回新的数据集(默认),True-在原数据集上操作
"""
data.dropna(axis = 0,how = 'any',inplace = True)

57.绘制收盘价的折线图

方法一:直接使用.plot绘制

python 复制代码
data['收盘价(元)'].plot(kind = 'line')

python 复制代码
# 等价于
plt.plot(data['收盘价(元)'])

58.同时绘制开盘价与收盘价

python 复制代码
data[['开盘价(元)','收盘价(元)']].plot()

59.绘制涨跌幅的直方图

python 复制代码
data['涨跌幅(%)'].plot(kind = 'hist')

60.让直方图更细致

python 复制代码
# import matplotlib.pyplot as plt # 如果之前运行过就不要再执行,可能会重置设置导致汉字不显示

n, bins, patches = plt.hist(data['涨跌幅(%)'],bins = 30,edgecolor = 'black')

'''
print(n) # [  1.   0.   0.   0.   0.   0.   0.   0.   1.   0.   4.   3.   4.  10. 18.  42. 109.  73.  31.  12.  10.   3.   1.   1.   1.   1.   0.   0.0.   2.]
print(bins) # [-8.0217     -7.54621667 -7.07073333 -6.59525    -6.11976667 -5.64428333
            #  -5.1688     -4.69331667 -4.21783333 -3.74235    -3.26686667 -2.79138333
            #  -2.3159     -1.84041667 -1.36493333 -0.88945    -0.41396667  0.06151667
            #   0.537       1.01248333  1.48796667  1.96345     2.43893333  2.91441667
            #   3.3899      3.86538333  4.34086667  4.81635     5.29183333  5.76731667
            #   6.2428    ]
print(patches) # <BarContainer object of 30 artists>
'''

# Add labels to each bin
for i in range(len(patches)):
    plt.text(
        patches[i].get_x()+patches[i].get_width()/2.,
        patches[i].get_height(),
        f'{n[i]:.0f}',
        ha = 'center'
    )
plt.title('Frequency Distribution of 涨跌幅 Levels')
plt.xlabel('涨跌幅')
plt.ylabel('Frequency')
plt.show()

61.以data的列名创建一个DataFrame

python 复制代码
temp = pd.DataFrame(columns = data.columns)
temp
代码 简称 日期 前收盘价(元) 开盘价(元) 最高价(元) 最低价(元) 收盘价(元) 成交量(股) 成交金额(元) 涨跌(元) 涨跌幅(%) 均价(元) 换手率(%) A股流通市值(元) 总市值(元) A股流通股本(股) 市盈率

62.打印所有换手率不是数字的行

python 复制代码
for i in range(len(data)):
    if type(data.loc[i,'换手率(%)'])!=float:
        temp = temp.append(data.loc[i])

temp

| | 代码 | 简称 | 日期 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 26 | 600000.SH | 浦发银行 | 2016-02-16 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 27 | 600000.SH | 浦发银行 | 2016-02-17 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 28 | 600000.SH | 浦发银行 | 2016-02-18 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 29 | 600000.SH | 浦发银行 | 2016-02-19 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 30 | 600000.SH | 浦发银行 | 2016-02-22 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 31 | 600000.SH | 浦发银行 | 2016-02-23 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 32 | 600000.SH | 浦发银行 | 2016-02-24 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 33 | 600000.SH | 浦发银行 | 2016-02-25 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 34 | 600000.SH | 浦发银行 | 2016-02-26 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 35 | 600000.SH | 浦发银行 | 2016-02-29 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 36 | 600000.SH | 浦发银行 | 2016-03-01 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 37 | 600000.SH | 浦发银行 | 2016-03-02 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 38 | 600000.SH | 浦发银行 | 2016-03-03 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 39 | 600000.SH | 浦发银行 | 2016-03-04 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 40 | 600000.SH | 浦发银行 | 2016-03-07 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 41 | 600000.SH | 浦发银行 | 2016-03-08 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 42 | 600000.SH | 浦发银行 | 2016-03-09 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |

43 600000.SH 浦发银行 2016-03-10 00:00:00 16.2946 16.2946 16.2946 16.2946 16.2946 -- -- 0.0 0.0 -- -- 344156547606.75 344156547606.75 18653471415.0 6.801
python 复制代码
data.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 327 entries, 0 to 326
Data columns (total 18 columns):
 #   Column     Non-Null Count  Dtype         
---  ------     --------------  -----         
 0   代码         327 non-null    object        
 1   简称         327 non-null    object        
 2   日期         327 non-null    datetime64[ns]
 3   前收盘价(元)    327 non-null    float64       
 4   开盘价(元)     327 non-null    float64       
 5   最高价(元)     327 non-null    float64       
 6   最低价(元)     327 non-null    float64       
 7   收盘价(元)     327 non-null    float64       
 8   成交量(股)     327 non-null    object        
 9   成交金额(元)    327 non-null    object        
 10  涨跌(元)      327 non-null    float64       
 11  涨跌幅(%)     327 non-null    float64       
 12  均价(元)      327 non-null    object        
 13  换手率(%)     327 non-null    object        
 14  A股流通市值(元)  327 non-null    float64       
 15  总市值(元)     327 non-null    float64       
 16  A股流通股本(股)  327 non-null    float64       
 17  市盈率        327 non-null    float64       
dtypes: datetime64[ns](1), float64(11), object(6)
memory usage: 56.6+ KB

63.打印所有换手率为--的行

方法一:逐一判断保存
python 复制代码
for i in range(len(data)):
    if data.loc[i,'换手率(%)']=="--":
        temp = temp.append(data.loc[i])

temp

| | 代码 | 简称 | 日期 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 26 | 600000.SH | 浦发银行 | 2016-02-16 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 27 | 600000.SH | 浦发银行 | 2016-02-17 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 28 | 600000.SH | 浦发银行 | 2016-02-18 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 29 | 600000.SH | 浦发银行 | 2016-02-19 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 30 | 600000.SH | 浦发银行 | 2016-02-22 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 31 | 600000.SH | 浦发银行 | 2016-02-23 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 32 | 600000.SH | 浦发银行 | 2016-02-24 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 33 | 600000.SH | 浦发银行 | 2016-02-25 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 34 | 600000.SH | 浦发银行 | 2016-02-26 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 35 | 600000.SH | 浦发银行 | 2016-02-29 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 36 | 600000.SH | 浦发银行 | 2016-03-01 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 37 | 600000.SH | 浦发银行 | 2016-03-02 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 38 | 600000.SH | 浦发银行 | 2016-03-03 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 39 | 600000.SH | 浦发银行 | 2016-03-04 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 40 | 600000.SH | 浦发银行 | 2016-03-07 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 41 | 600000.SH | 浦发银行 | 2016-03-08 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 42 | 600000.SH | 浦发银行 | 2016-03-09 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 43 | 600000.SH | 浦发银行 | 2016-03-10 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 26 | 600000.SH | 浦发银行 | 2016-02-16 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 27 | 600000.SH | 浦发银行 | 2016-02-17 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 28 | 600000.SH | 浦发银行 | 2016-02-18 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 29 | 600000.SH | 浦发银行 | 2016-02-19 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 30 | 600000.SH | 浦发银行 | 2016-02-22 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 31 | 600000.SH | 浦发银行 | 2016-02-23 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 32 | 600000.SH | 浦发银行 | 2016-02-24 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 33 | 600000.SH | 浦发银行 | 2016-02-25 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 34 | 600000.SH | 浦发银行 | 2016-02-26 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 35 | 600000.SH | 浦发银行 | 2016-02-29 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 36 | 600000.SH | 浦发银行 | 2016-03-01 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 37 | 600000.SH | 浦发银行 | 2016-03-02 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 38 | 600000.SH | 浦发银行 | 2016-03-03 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 39 | 600000.SH | 浦发银行 | 2016-03-04 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 40 | 600000.SH | 浦发银行 | 2016-03-07 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 41 | 600000.SH | 浦发银行 | 2016-03-08 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |
| 42 | 600000.SH | 浦发银行 | 2016-03-09 00:00:00 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 344156547606.75 | 344156547606.75 | 18653471415.0 | 6.801 |

43 600000.SH 浦发银行 2016-03-10 00:00:00 16.2946 16.2946 16.2946 16.2946 16.2946 -- -- 0.0 0.0 -- -- 344156547606.75 344156547606.75 18653471415.0 6.801
方法二:根据 isin() 判断是否具有包含关系
python 复制代码
data[data['换手率(%)'].isin(["--"])] # 注意传入的值是列表类型的数据

| | 代码 | 简称 | 日期 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 26 | 600000.SH | 浦发银行 | 2016-02-16 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 27 | 600000.SH | 浦发银行 | 2016-02-17 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 28 | 600000.SH | 浦发银行 | 2016-02-18 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 29 | 600000.SH | 浦发银行 | 2016-02-19 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 30 | 600000.SH | 浦发银行 | 2016-02-22 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 31 | 600000.SH | 浦发银行 | 2016-02-23 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 32 | 600000.SH | 浦发银行 | 2016-02-24 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 33 | 600000.SH | 浦发银行 | 2016-02-25 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 34 | 600000.SH | 浦发银行 | 2016-02-26 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 35 | 600000.SH | 浦发银行 | 2016-02-29 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 36 | 600000.SH | 浦发银行 | 2016-03-01 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 37 | 600000.SH | 浦发银行 | 2016-03-02 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 38 | 600000.SH | 浦发银行 | 2016-03-03 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 39 | 600000.SH | 浦发银行 | 2016-03-04 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 40 | 600000.SH | 浦发银行 | 2016-03-07 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 41 | 600000.SH | 浦发银行 | 2016-03-08 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |
| 42 | 600000.SH | 浦发银行 | 2016-03-09 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | 16.2946 | -- | -- | 0.0 | 0.0 | -- | -- | 3.441565e+11 | 3.441565e+11 | 1.865347e+10 | 6.801 |

43 600000.SH 浦发银行 2016-03-10 16.2946 16.2946 16.2946 16.2946 16.2946 -- -- 0.0 0.0 -- -- 3.441565e+11 3.441565e+11 1.865347e+10 6.801

64.重置data的行号

python 复制代码
data.reset_index(drop = True)
data.head()

| | 代码 | 简称 | 日期 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 0 | 600000.SH | 浦发银行 | 2016-01-04 | 16.1356 | 16.1444 | 16.1444 | 15.4997 | 15.7205 | 42240610 | 754425783 | -0.4151 | -2.5725 | 17.8602 | 0.2264 | 3.320318e+11 | 3.320318e+11 | 1.865347e+10 | 6.5614 |
| 1 | 600000.SH | 浦发银行 | 2016-01-05 | 15.7205 | 15.4644 | 15.9501 | 15.3672 | 15.8618 | 58054793 | 1034181474 | 0.1413 | 0.8989 | 17.8139 | 0.3112 | 3.350163e+11 | 3.350163e+11 | 1.865347e+10 | 6.6204 |
| 2 | 600000.SH | 浦发银行 | 2016-01-06 | 15.8618 | 15.8088 | 16.0208 | 15.6234 | 15.9855 | 46772653 | 838667398 | 0.1236 | 0.7795 | 17.9307 | 0.2507 | 3.376278e+11 | 3.376278e+11 | 1.865347e+10 | 6.6720 |
| 3 | 600000.SH | 浦发银行 | 2016-01-07 | 15.9855 | 15.7205 | 15.8088 | 15.3672 | 15.4644 | 11350479 | 199502702 | -0.5211 | -3.2597 | 17.5766 | 0.0608 | 3.266223e+11 | 3.266223e+11 | 1.865347e+10 | 6.4545 |

4 600000.SH 浦发银行 2016-01-08 15.4644 15.6675 15.7912 14.9345 15.4467 71918296 1262105060 -0.0177 -0.1142 17.5492 0.3855 3.262492e+11 3.262492e+11 1.865347e+10 6.4471
python 复制代码
data.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 327 entries, 0 to 326
Data columns (total 18 columns):
 #   Column     Non-Null Count  Dtype         
---  ------     --------------  -----         
 0   代码         327 non-null    object        
 1   简称         327 non-null    object        
 2   日期         327 non-null    datetime64[ns]
 3   前收盘价(元)    327 non-null    float64       
 4   开盘价(元)     327 non-null    float64       
 5   最高价(元)     327 non-null    float64       
 6   最低价(元)     327 non-null    float64       
 7   收盘价(元)     327 non-null    float64       
 8   成交量(股)     327 non-null    object        
 9   成交金额(元)    327 non-null    object        
 10  涨跌(元)      327 non-null    float64       
 11  涨跌幅(%)     327 non-null    float64       
 12  均价(元)      327 non-null    object        
 13  换手率(%)     327 non-null    object        
 14  A股流通市值(元)  327 non-null    float64       
 15  总市值(元)     327 non-null    float64       
 16  A股流通股本(股)  327 non-null    float64       
 17  市盈率        327 non-null    float64       
dtypes: datetime64[ns](1), float64(11), object(6)
memory usage: 56.6+ KB

65.删除所有换手率为非数字的行

python 复制代码
k = []
for i in range(len(data)):
    if type(data.loc[i,'换手率(%)']) != float:
       k.append(i)
data = data.drop(k)
data.head()

| | 代码 | 简称 | 日期 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 0 | 600000.SH | 浦发银行 | 2016-01-04 | 16.1356 | 16.1444 | 16.1444 | 15.4997 | 15.7205 | 42240610 | 754425783 | -0.4151 | -2.5725 | 17.8602 | 0.2264 | 3.320318e+11 | 3.320318e+11 | 1.865347e+10 | 6.5614 |
| 1 | 600000.SH | 浦发银行 | 2016-01-05 | 15.7205 | 15.4644 | 15.9501 | 15.3672 | 15.8618 | 58054793 | 1034181474 | 0.1413 | 0.8989 | 17.8139 | 0.3112 | 3.350163e+11 | 3.350163e+11 | 1.865347e+10 | 6.6204 |
| 2 | 600000.SH | 浦发银行 | 2016-01-06 | 15.8618 | 15.8088 | 16.0208 | 15.6234 | 15.9855 | 46772653 | 838667398 | 0.1236 | 0.7795 | 17.9307 | 0.2507 | 3.376278e+11 | 3.376278e+11 | 1.865347e+10 | 6.6720 |
| 3 | 600000.SH | 浦发银行 | 2016-01-07 | 15.9855 | 15.7205 | 15.8088 | 15.3672 | 15.4644 | 11350479 | 199502702 | -0.5211 | -3.2597 | 17.5766 | 0.0608 | 3.266223e+11 | 3.266223e+11 | 1.865347e+10 | 6.4545 |

4 600000.SH 浦发银行 2016-01-08 15.4644 15.6675 15.7912 14.9345 15.4467 71918296 1262105060 -0.0177 -0.1142 17.5492 0.3855 3.262492e+11 3.262492e+11 1.865347e+10 6.4471

66.绘制换手率的密度曲线

python 复制代码
data['换手率(%)'].plot(kind = 'kde')

67.计算前一天与后一天收盘价的差值

方法一:基于业务上的理解,直接使用收盘价-前一天的收盘价
python 复制代码
data['收盘价(元)'] - data['前收盘价(元)']
0     -0.4151
1      0.1413
2      0.1237
3     -0.5211
4     -0.0177
        ...  
322   -0.0800
323   -0.1000
324   -0.0600
325   -0.0600
326   -0.1000
Length: 309, dtype: float64
方法二:直接使用.diff() 计算

diff() :计算Series中的元素与同一个Series中另一个元素的差值(默认为上一行中的元素)。

python 复制代码
# 计算Series中的元素与Series中另一个元素的差值(默认为上一行中的元素)。

data['收盘价(元)'].diff()
0         NaN
1      0.1413
2      0.1237
3     -0.5211
4     -0.0177
        ...  
322   -0.0800
323   -0.1000
324   -0.0600
325   -0.0600
326   -0.1000
Name: 收盘价(元), Length: 309, dtype: float64

68.计算前一天与后一天收盘价变化率

方法一:根据业务知识计算变化率
python 复制代码
(data['收盘价(元)'] - data['前收盘价(元)']) / data['前收盘价(元)']
0     -0.025726
1      0.008988
2      0.007799
3     -0.032598
4     -0.001145
         ...   
322   -0.005277
323   -0.006631
324   -0.004005
325   -0.004021
326   -0.006729
Length: 309, dtype: float64
方法二:直接使用pct_change() 计算

pct_change():这是对pandas Series对象的方法调用。

pct_change()方法计算当前元素与系列中前一个元素之间的变化百分比。默认情况下,它计算紧跟前一个元素的变化百分比(lag=1)。这通常用于时间序列分析,以创建从一个时期到下一个时期的一系列百分比变化。

python 复制代码
data['收盘价(元)'].pct_change()
0           NaN
1      0.008988
2      0.007799
3     -0.032598
4     -0.001145
         ...   
322   -0.005277
323   -0.006631
324   -0.004005
325   -0.004021
326   -0.006729
Name: 收盘价(元), Length: 309, dtype: float64

69.设置日期为索引

python 复制代码
data = data.set_index('日期')
data

| | 代码 | 简称 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 日期 | | | | | | | | | | | | | | | | | |
| 2016-01-04 | 600000.SH | 浦发银行 | 16.1356 | 16.1444 | 16.1444 | 15.4997 | 15.7205 | 42240610 | 754425783 | -0.4151 | -2.5725 | 17.8602 | 0.2264 | 3.320318e+11 | 3.320318e+11 | 1.865347e+10 | 6.5614 |
| 2016-01-05 | 600000.SH | 浦发银行 | 15.7205 | 15.4644 | 15.9501 | 15.3672 | 15.8618 | 58054793 | 1034181474 | 0.1413 | 0.8989 | 17.8139 | 0.3112 | 3.350163e+11 | 3.350163e+11 | 1.865347e+10 | 6.6204 |
| 2016-01-06 | 600000.SH | 浦发银行 | 15.8618 | 15.8088 | 16.0208 | 15.6234 | 15.9855 | 46772653 | 838667398 | 0.1236 | 0.7795 | 17.9307 | 0.2507 | 3.376278e+11 | 3.376278e+11 | 1.865347e+10 | 6.6720 |
| 2016-01-07 | 600000.SH | 浦发银行 | 15.9855 | 15.7205 | 15.8088 | 15.3672 | 15.4644 | 11350479 | 199502702 | -0.5211 | -3.2597 | 17.5766 | 0.0608 | 3.266223e+11 | 3.266223e+11 | 1.865347e+10 | 6.4545 |
| 2016-01-08 | 600000.SH | 浦发银行 | 15.4644 | 15.6675 | 15.7912 | 14.9345 | 15.4467 | 71918296 | 1262105060 | -0.0177 | -0.1142 | 17.5492 | 0.3855 | 3.262492e+11 | 3.262492e+11 | 1.865347e+10 | 6.4471 |
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 2017-05-03 | 600000.SH | 浦发银行 | 15.1600 | 15.1600 | 15.1600 | 15.0500 | 15.0800 | 14247943 | 215130847 | -0.0800 | -0.5277 | 15.0991 | 0.0659 | 3.260037e+11 | 3.260037e+11 | 2.161828e+10 | 6.1395 |
| 2017-05-04 | 600000.SH | 浦发银行 | 15.0800 | 15.0700 | 15.0700 | 14.9000 | 14.9800 | 19477788 | 291839737 | -0.1000 | -0.6631 | 14.9832 | 0.0901 | 3.238418e+11 | 3.238418e+11 | 2.161828e+10 | 6.0988 |
| 2017-05-05 | 600000.SH | 浦发银行 | 14.9800 | 14.9500 | 14.9800 | 14.5200 | 14.9200 | 40194577 | 592160198 | -0.0600 | -0.4005 | 14.7323 | 0.1859 | 3.225447e+11 | 3.225447e+11 | 2.161828e+10 | 6.0744 |
| 2017-05-08 | 600000.SH | 浦发银行 | 14.9200 | 14.7800 | 14.9000 | 14.5100 | 14.8600 | 43568576 | 638781010 | -0.0600 | -0.4021 | 14.6615 | 0.2015 | 3.212476e+11 | 3.212476e+11 | 2.161828e+10 | 6.0500 |

2017-05-09 600000.SH 浦发银行 14.8600 14.6900 14.8400 14.6600 14.7600 19225492 283864640 -0.1000 -0.6729 14.765 0.0889 3.190858e+11 3.190858e+11 2.161828e+10 6.0093

309 rows × 17 columns

70.以5个数据作为一个数据滑动窗口,在这个5个数据上取均值(收盘价)

.rolling(window=5):这将创建数据的滚动视图,窗口大小为5。这意味着对于数据中的每个点,它考虑当前点和之前的四个点。

.mean():计算每个滚动窗口的平均值。

结果将是一个pandas series,其中每个点是当天和前四个交易日的平均收盘价。请注意,结果中的前四个点将是NaN(表示"Not a Number"),因为它们在滚动窗口中只有不到5个点。

python 复制代码
data['收盘价(元)'].rolling(window = 5).mean()
日期
2016-01-04         NaN
2016-01-05         NaN
2016-01-06         NaN
2016-01-07         NaN
2016-01-08    15.69578
                ...   
2017-05-03    15.14200
2017-05-04    15.12800
2017-05-05    15.07000
2017-05-08    15.00000
2017-05-09    14.92000
Name: 收盘价(元), Length: 309, dtype: float64

71.以5个数据作为一个数据滑动窗口,计算这五个数据总和(收盘价)

python 复制代码
data['收盘价(元)'].rolling(window = 5).sum()
日期
2016-01-04        NaN
2016-01-05        NaN
2016-01-06        NaN
2016-01-07        NaN
2016-01-08    78.4789
               ...   
2017-05-03    75.7100
2017-05-04    75.6400
2017-05-05    75.3500
2017-05-08    75.0000
2017-05-09    74.6000
Name: 收盘价(元), Length: 309, dtype: float64

72.将收盘价5日均线、20日均线与原始数据绘制在同一个图上

python 复制代码
data['收盘价(元)'].rolling(window = 5).mean().plot()
data['收盘价(元)'].rolling(window = 5).mean().plot()
data['收盘价(元)'].plot()

73.按周为采样规则,取一周收盘价最大值

方法一:使用滑动窗口以7天为采样

这种方法从实际效果上看,确实可以取到每个滑动窗口的最大值,由于滑动窗口的步长为1,所以不具有业务意义

python 复制代码
data['收盘价(元)'].rolling(window = 7).max()
日期
2016-01-04      NaN
2016-01-05      NaN
2016-01-06      NaN
2016-01-07      NaN
2016-01-08      NaN
              ...  
2017-05-03    15.21
2017-05-04    15.21
2017-05-05    15.21
2017-05-08    15.21
2017-05-09    15.21
Name: 收盘价(元), Length: 309, dtype: float64
方法二(正解):按周重采样

.resample('W'):按周重新采样数据。"W"代表"周"。此操作按周对数据进行分组。

.max():计算每周组的最大值。

结果,是一个pandas Series,其中每个点是相应周的最大收盘价。注意,您需要确保DataFrame的索引是DatetimeIndex,否则重新示例操作将无法工作。如果DataFrame的索引不是DatetimeIndex,则可以使用pd.to_datetime()函数对其进行转换。

python 复制代码
week_max = data['收盘价(元)'].resample('W').max()
week_max
日期
2016-01-10    15.9855
2016-01-17    15.8265
2016-01-24    15.6940
2016-01-31    15.0405
2016-02-07    16.2328
               ...   
2017-04-16    15.9700
2017-04-23    15.5600
2017-04-30    15.2100
2017-05-07    15.1600
2017-05-14    14.8600
Freq: W-SUN, Name: 收盘价(元), Length: 71, dtype: float64

值得注意的是,与方法一滑动窗口采样不同,如果一个采样周内无数据,还是可能出现空值。

去除空值的方法是使用函数 dropna()

python 复制代码
week_max[week_max.isnull()]
日期
2016-02-14   NaN
2016-02-28   NaN
2016-03-06   NaN
2016-10-09   NaN
Name: 收盘价(元), dtype: float64
python 复制代码
data['收盘价(元)'].resample('W').max().dropna()
日期
2016-01-10    15.9855
2016-01-17    15.8265
2016-01-24    15.6940
2016-01-31    15.0405
2016-02-07    16.2328
               ...   
2017-04-16    15.9700
2017-04-23    15.5600
2017-04-30    15.2100
2017-05-07    15.1600
2017-05-14    14.8600
Name: 收盘价(元), Length: 67, dtype: float64
rolling() 和 ressample() 的区别与联系

pandas中的 rolling() 函数和 ressample() 函数的用途略有不同,尽管它们都可以用于在时间窗口内聚合数据。

  • ' rolling() '用于在一定大小的滚动窗口上应用函数。例如,7天窗口的滚动平均值将计算数据中每7天周期的平均值。但是,这将包括跨周(如周三至周二)的7天周期。

  • ' resample() '用于将时间序列的频率更改为定义的频率,然后在每个间隔上应用函数。例如,重新采样到"W"频率并取最大值将计算数据中每个星期的最大值。

您可以使用' rolling() '来计算7天的最大值,如果您的数据从周一开始并且没有间隔,则可能类似于每周最大值。但是,如果数据中存在空白,或者不是从周一开始,则7天最大值将不对应于周最大值。

74.绘制重采样数据与原始数据

python 复制代码
data['收盘价(元)'].plot()
data['收盘价(元)'].resample('7D').max().plot()

75.将数据往后移动5天

python 复制代码
data.shift(5)

| | 代码 | 简称 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 日期 | | | | | | | | | | | | | | | | | |
| 2016-01-04 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| 2016-01-05 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| 2016-01-06 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| 2016-01-07 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| 2016-01-08 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 2017-05-03 | 600000.SH | 浦发银行 | 15.00 | 15.02 | 15.10 | 14.99 | 15.05 | 12975919 | 195296862 | 0.05 | 0.3333 | 15.0507 | 0.06 | 3.253551e+11 | 3.253551e+11 | 2.161828e+10 | 6.1273 |
| 2017-05-04 | 600000.SH | 浦发银行 | 15.05 | 15.06 | 15.11 | 15.00 | 15.05 | 14939871 | 225022668 | 0.00 | 0.0000 | 15.0619 | 0.0691 | 3.253551e+11 | 3.253551e+11 | 2.161828e+10 | 6.1273 |
| 2017-05-05 | 600000.SH | 浦发银行 | 15.05 | 15.05 | 15.25 | 15.03 | 15.21 | 22887645 | 345791526 | 0.16 | 1.0631 | 15.1082 | 0.1059 | 3.288140e+11 | 3.288140e+11 | 2.161828e+10 | 6.1925 |
| 2017-05-08 | 600000.SH | 浦发银行 | 15.21 | 15.15 | 15.22 | 15.08 | 15.21 | 15718509 | 238419161 | 0.00 | 0.0000 | 15.1681 | 0.0727 | 3.288140e+11 | 3.288140e+11 | 2.161828e+10 | 6.1925 |

2017-05-09 600000.SH 浦发银行 15.21 15.21 15.22 15.13 15.16 12607509 191225527 -0.05 -0.3287 15.1676 0.0583 3.277331e+11 3.277331e+11 2.161828e+10 6.1721

309 rows × 17 columns

76.将数据向前移动5天

python 复制代码
data.shift(-5)

| | 代码 | 简称 | 前收盘价(元) | 开盘价(元) | 最高价(元) | 最低价(元) | 收盘价(元) | 成交量(股) | 成交金额(元) | 涨跌(元) | 涨跌幅(%) | 均价(元) | 换手率(%) | A股流通市值(元) | 总市值(元) | A股流通股本(股) | 市盈率 |
| 日期 | | | | | | | | | | | | | | | | | |
| 2016-01-04 | 600000.SH | 浦发银行 | 15.4467 | 15.1994 | 15.4114 | 14.9786 | 15.0581 | 90177135 | 1550155933 | -0.3886 | -2.5157 | 17.1901 | 0.4834 | 3.180417e+11 | 3.180417e+11 | 1.865347e+10 | 6.2849 |
| 2016-01-05 | 600000.SH | 浦发银行 | 15.0581 | 15.1641 | 15.4732 | 15.0846 | 15.4114 | 55374454 | 964061502 | 0.3533 | 2.3460 | 17.4099 | 0.2969 | 3.255031e+11 | 3.255031e+11 | 1.865347e+10 | 6.4324 |
| 2016-01-06 | 600000.SH | 浦发银行 | 15.4114 | 15.5174 | 15.8088 | 15.3231 | 15.3584 | 47869312 | 843717365 | -0.0530 | -0.3438 | 17.6254 | 0.2566 | 3.243839e+11 | 3.243839e+11 | 1.865347e+10 | 6.4102 |
| 2016-01-07 | 600000.SH | 浦发银行 | 15.3584 | 15.0140 | 15.8883 | 14.9168 | 15.8265 | 54838833 | 966117848 | 0.4681 | 3.0477 | 17.6174 | 0.294 | 3.342702e+11 | 3.342702e+11 | 1.865347e+10 | 6.6056 |
| 2016-01-08 | 600000.SH | 浦发银行 | 15.8265 | 15.7205 | 16.0296 | 15.4732 | 15.5262 | 46723139 | 836146426 | -0.3003 | -1.8973 | 17.8958 | 0.2505 | 3.279280e+11 | 3.279280e+11 | 1.865347e+10 | 6.4803 |
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 2017-05-03 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| 2017-05-04 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| 2017-05-05 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| 2017-05-08 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |

2017-05-09 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN

309 rows × 17 columns

77.使用expending函数计算开盘价的移动窗口均值

  • .expanding() :在你的数据上创建一个扩展窗口。展开窗口从数据的开头开始,并包含截至当前点的所有数据。

  • .mean():计算每个窗口的平均值。

结果是一个pandas Series,其中每个点是截至并包括当天的所有天的平均开盘价。这意味着第一个点将是第一天的开盘价,第二个点将是前两天的平均开盘价,第三个点将是前三天的平均开盘价,以此类推。

python 复制代码
data['收盘价(元)'].expanding().mean()
日期
2016-01-04    15.720500
2016-01-05    15.791150
2016-01-06    15.855933
2016-01-07    15.758050
2016-01-08    15.695780
                ...    
2017-05-03    16.047382
2017-05-04    16.043894
2017-05-05    16.040233
2017-05-08    16.036401
2017-05-09    16.032271
Name: 收盘价(元), Length: 309, dtype: float64

78.绘制上一题的移动均值与原始数据折线图

python 复制代码
data['收盘价(元)'].expanding().mean().plot()
data['收盘价(元)'].plot()

79.计算布林指标

Bollinger Band (BBands)是一种流行的金融技术分析工具,由John Bollinger在20世纪80年代提出。Bollinger带包括一个作为n周期简单移动平均线(SMA)的中间带,一个在中间带之上的K倍n周期标准差处的上带,以及一个在中间带之下的K倍n周期标准差处的下带。参数N和K通常分别为20和2。

布林指数(Bollinger Band Index,简称Brin Index)是一个衡量股票价格是高还是低的指标。计算公式如下:

$

Brin Index = \frac{Price - Lower Band}{Upper Band - Lower Band}

$

其中:

  • Price为当前价格,
  • Lower Band 是指较低的Bollinger波段,
  • Upper Band 是指较高的Bollinger波段。

布林指数的取值范围为0 ~ 1。当布林指数接近0时,表明该股票的价格接近其低位区间。当它接近1时,它表明股票正在其范围的高端交易。

请注意,您需要有历史价格数据来计算Bollinger波段的移动平均线和标准差。

下面是用熊猫计算布林指数的方法:

python 复制代码
# 计算移动平均数和标准偏差
data['MA'] = data['收盘价(元)'].rolling(window = 20).mean()
data['SD'] = data['收盘价(元)'].rolling(window = 20).std()
# 计算上布林带和下布林带
data['UpperBB'] = data['MA'] + (data['SD'] * 2)
data['LowerBB'] = data['MA'] - (data['SD'] * 2)
# 计算布林指数
data['Brin'] = (data['收盘价(元)'] - data['LowerBB']) / (data['UpperBB'] - data['LowerBB'])

80.计算布林线并绘制

python 复制代码
plt.figure(figsize = (12,6)) # 设置图形的大小
data['Brin'].plot(grid = True) # 实际创建了图形
plt.title('Brin Index') # 为图形添加了标题
plt.show() # 显示图形


相关推荐
智慧化智能化数字化方案20 小时前
工业金融政务数据分类分级体系建设解读
大数据·金融·数据分类分级·政务·政务数据分类·工业数据分类·金融数据分类分级
dundunmm1 天前
机器学习之pandas
人工智能·python·机器学习·数据挖掘·pandas
原点安全1 天前
“鼎和财险一体化数据安全管控实践”入选信通院金融领域优秀案例
大数据·人工智能·金融
AI_NEW_COME1 天前
解锁金融新纪元:内部知识库的深度挖掘与战略价值
金融
东方佑1 天前
pandas df 如何 输出数据到 sqlite3
oracle·sqlite·pandas
正在走向自律2 天前
Agent 案例分析:金融场景中的智能体-蚂蚁金服案例(10/30)
阿里云·金融·ai agent·金融场景中的智能体
liuweidong08022 天前
【Pandas】pandas Series flags
pandas
正在走向自律3 天前
微众银行金融场景 Agent:创新实践与深度剖析(12/30)
金融·ai agent·ai智能体·微众银行
Lx3523 天前
Pandas数据重命名:列名与索引为标题
后端·python·pandas
ai_lian_shuo3 天前
四、使用langchain搭建RAG:金融问答机器人--构建web应用,问答链,带记忆功能
python·ai·金融·langchain·机器人