tushare库获取金融股票数据

定义:

Tushare 是一个为金融量化分析师和数据爱好者设计的开源工具,提供从数据采集、清洗加工到数据存储的全流程服务。它能够实时抓取沪深两市的股票和期货市场数据,包括交易价格、成交量、市值、市盈率等关键指标,同时也提供历史数据的采集。Tushare 的数据采集功能是其核心优势之一,它支持多种数据类型,包括日K线数据和分钟级数据,满足不同分析需求。

Tushare 的数据清洗与加工功能提供了强大的工具集,能够自动识别并处理缺失值、异常值和重复数据,确保数据的准确性和完整性。用户可以通过内置的函数轻松实现数据的标准化、归一化等预处理操作。此外,Tushare 支持将采集和加工后的数据存储在本地,并提供了多种格式的数据导出功能,如CSV、Excel等,方便用户对数据的长期保存和分享。

Tushare 的API设计注重用户体验,力求简洁明了。用户可以通过简单的函数调用来获取所需的数据,无需深入了解背后的实现细节。无论是获取个股的历史交易数据,还是实时的行情数据,Tushare 都提供了相应的接口,使得数据获取过程高效而直观。

Tushare Pro版在原有基础上进行了全面升级,提供了更稳定、更高质量的数据服务,满足专业金融数据需求。它不仅支持中国A股市场,还涵盖了港股市场以及全球主要市场的数据,包括股票、期货、基金、债券、外汇等多种金融产品。Tushare Pro版的数据采集和整理力度不断加大,力求达到专业数据专业服务的能力。

使用Tushare前,需要在官网注册账号并获取API Token。安装Tushare后,可以通过Python代码调用其接口获取数据。例如,获取股票历史行情数据的代码如下:

复制代码
python

import tushare as ts
# 设置token
ts.set_token('你的token')
# 初始化pro接口
pro = ts.pro_api()
# 查询股票历史行情数据
df = pro.daily(ts_code='000001.SZ', start_date='20200101', end_date='20201231')
print(df.head())

在以上代码中,需要先设置Token才能使用Tushare的接口。Token是在Tushare官网上注册并获取的。通过以上的示例代码,可以方便地获取股票、财务等数据,为金融数据分析提供了便利。

Tushare的安装和使用相对简单,可以通过Python的包管理工具pip进行安装,安装命令为 pip install tushare。安装完成后,用户需要在Tushare官网注册账号,并获取自己的API Token,然后在Python脚本中配置Token,即可开始使用Tushare提供的金融数据服务。

Tushare的数据服务是开放的,免费的平台,不带任何商业性质和目的。它为各类金融投资和研究人员提供适用的数据和工具,帮助提高金融数据的高可用性,提升投研效率,减少不必要的数据处理成本开销。Tushare还在不断的完善和优化,后期将逐步增加更多种类的数据,以满足用户的多元化需

一、交易数据

交易类数据提供股票的交易行情数据,通过简单的接口调用可获取相应的DataFrame格式数据,主要包括以下类别:

历史行情数据

复权历史数据

实时行情数据

历史分笔数据

实时报价数据

当日历史数据

大盘指数列表

大单交易数据

1.历史行情

请转移到Tushare Pro新接口,本接口不再维护。

在Pro版接口中,我们也增加了通用行情接口,可以方便获得各种资源各种频度的数据,欢迎使用。

获取个股历史交易数据(包括均线数据),可以通过参数设置获取日k线,周k线,月k线,以及5分钟、15分钟、30分钟和60分钟k线数据。本接口只能获取近3年的日线数据,适合搭配均线数据进行选股和分析,如果需要全部历史数据,请调用下一个接口:

get_h_data()

get_k_data()

参数说明:

code:股票代码,即6位数字代码,或者指数代码(sh=上证指数sz=深圳成指hs300=沪深300指数sz50=上证50zxb=中小板cyb=创业板)

start:开始日期,格式YYYY-MM-DD

end:结束日期,格式YYYY-MM-DD

ktype:数据类型,D=日 k线 W=周 M=月 5=5分钟 15=15分钟 30=30分钟 60=60分钟,默认为D

retry_count:当网络异常后重试次数,默认为3

pause:重试时停顿秒数,默认为0

返回值说明:

date:日期

open:开盘价

high:最高价

close:收盘价

low:最低价

volume:成交量

price_change:价格变动

p_change:涨跌幅

ma5:5日均价

ma10:10日均价

ma20:20日均价

v_max5:5日均量

v_max10:10日均量

v_max20:20日均量

turnover:换手率[注:指数无此项]

复制代码
>>> import tushare as ts
>>> p1=ts.get_hist_data('600848')    #一次性获取全部日k线数据
本接口即将停止更新,请尽快使用Pro版接口:https://tushare.pro/document/2
>>> p1
             open   high  close    low  ...     v_ma5    v_ma10    v_ma20  turnover
date                                    ...                                        
2022-11-10  11.89  12.00  11.96  11.83  ...  26698.54  29148.51  30058.40      0.09
2022-11-09  12.04  12.15  11.95  11.93  ...  26244.56  31886.21  30317.23      0.12
2022-11-08  11.95  12.08  12.01  11.93  ...  26275.42  34077.42  30761.28      0.08
2022-11-07  11.95  12.04  11.98  11.84  ...  31547.13  35641.61  31334.16      0.13
2022-11-04  11.80  12.02  11.96  11.77  ...  29920.10  35862.92  31142.60      0.13
...           ...    ...    ...    ...  ...       ...       ...       ...       ...
2020-05-18  20.50  20.88  20.53  20.42  ...  50837.18  50837.18  50837.18      0.60
2020-05-15  20.26  20.78  20.61  20.22  ...  48396.27  48396.27  48396.27      0.82
2020-05-14  20.10  20.45  20.18  20.05  ...  36782.36  36782.36  36782.36      0.31
2020-05-13  20.05  20.47  20.29  19.92  ...  39611.55  39611.55  39611.55      0.36
2020-05-12  20.30  20.36  20.06  19.89  ...  42419.52  42419.52  42419.52      0.42
 
[609 rows x 14 columns]
相关推荐
湫ccc3 分钟前
《Python基础》之pip换国内镜像源
开发语言·python·pip
hakesashou5 分钟前
Python中常用的函数介绍
java·网络·python
菜鸟的人工智能之路15 分钟前
极坐标气泡图:医学数据分析的可视化新视角
python·数据分析·健康医疗
菜鸟学Python16 分钟前
Python 数据分析核心库大全!
开发语言·python·数据挖掘·数据分析
小白不太白95017 分钟前
设计模式之 责任链模式
python·设计模式·责任链模式
喜欢猪猪23 分钟前
Django:从入门到精通
后端·python·django
糖豆豆今天也要努力鸭29 分钟前
torch.__version__的torch版本和conda list的torch版本不一致
linux·pytorch·python·深度学习·conda·torch
何大春1 小时前
【弱监督语义分割】Self-supervised Image-specific Prototype Exploration for WSSS 论文阅读
论文阅读·人工智能·python·深度学习·论文笔记·原型模式
在下不上天1 小时前
Flume日志采集系统的部署,实现flume负载均衡,flume故障恢复
大数据·开发语言·python
SEVEN-YEARS1 小时前
深入理解TensorFlow中的形状处理函数
人工智能·python·tensorflow