01.自动化交易综述

算法交易的概念：

利用自动化平台，执行预先设置的一系列规则完成交易行为。

算法交易的优势

1.历史数据评估

2.执行高效

3.无主观情绪输入

4.可度量评价

5.交易频率

算法交易的劣势

1.成本，成本低难以体现收益

2.技巧

算法交易流程

大前提:基于某种平台（可自建）

1.提出假设

2.建立模型

3.回测验证

4.执行交易

交易策略的来源（trading strategy）

1市场微观结构研究(for HFT mostly)

2.基金结构套利(fund structure arbitrage)

3机器学习/人工智能（重点）

机器学习的四个流派：

离散的角度：符号主义（symbolism），可解释性好

代表性算法领域 1：决策树，涉及到的学科知识：信息论；

代表性算法领域 2：规则学习 (Rule)，涉及到的学科知识：数理逻辑；

连接主义（connectionism）

代表性算法领域：神经网络，涉及到的学科知识：泛函分析。

连续的角度：频率主义（frequentists）

代表性算法领域：支持向量机 (SVM)，涉及到的学科知识：统计学；

概率角度：贝叶斯主义（bayesian）

代表性算法领域：贝叶斯，例如朴素贝叶斯、概率图等，涉及到的学科知识：统计学、概率论；

ML的核心三板斧：

Data

Model & Objective Function

Optimization：寻找上面function的极值的方法

ML+Trading

限价委托单薄模型（Limit Order Book Modeling）

基于价格的分类模型（Price-based Classification Models），最常用，吃价格，输出分类（买卖）

基于文本的分类模型（Text-based Classification Models）基于高质量网站（Twitter）或股票评论网站（新浪财经新闻），采用自然语言处理方式进行选股票（信噪比较大，新闻来源，各种托）

强化学习（Reinforcement Learning）

ML+Trading建模四要素

Good model and efficient trading algorithms

Hardware( GPU/CPU)硬件要求

High quality data，数据是模型精度的上限

Platform(keras/tensorflow/sklearn) python为主

交易策略的评估

1.策略的基本假设

2.Sharp Ratio

3.杠杆

4.频率

5.风险

6.W/L

7.模型复杂度 VC dim

8.最大亏损 Maximum drawdown

9.Benchmarking

回测

1.回测是指将交易策略在历史数据中进行合理验证的过程。

2.回测的意义：

策略筛选

策略优化

策略验证

3.错误的回测：

乐观主义偏差 special look back region

时间旅行

·程序bug

·train/val/test set

幸存者误差（选股）

搭建平台需要理解事件驱动的编程模型

python 复制代码

while True:
	new_even = get_new_event()
	if new_event.something='事件1':
		do_something()
	if new_event.something='事件2':
		do_something_else()
	
	tick(50) #wait 50 milliseconds

金融时间序列数据统计分析（米筐）

python 复制代码

import warnings
warnings.filterwarnings("ignore")
import numpy as numpy
import pandas as pd
import matplotlib.pyplot as plt
# matplotlib没有就 pip install matplotlib
plt.style.use('seaborn')
#将matplotlib的图表直接嵌入到Notebook之中，py文件不支持这个命令
#%matplotlib inline

'''
导入数据
1.以时间为索引
2.将事件转换成标准格式
3.绘制展示各个指标的走势图
'''
#指定第一列为索引列，并且自动将时间文本转化为日期类型
data = pd.read_csv('stockdata.csv',index_col=0,parse_dates=True)
data.head()

data.plot(figsize = (10,12))

#分开显示
data.plot(figsize = (10,12),subplot = True)

'''
各个指标含义
AAPL.O：Applo Stock
MSFT.O：Microsoft Stock
INTC.O：IntelStock
AMZN.O：Amazon Stock
GS.N：Goldman Sachs Stock
SPY：SPDR S&P 500 ETF Trust 
SPX：S&P 500 Index
VIX：VIX Volatity Index
EUR：EUR/USD Exchange Rate 
XAU：Gold Price 
GDX：VanEck Vectors Gold Miners ETF 
GLD：SPDR Gold Trust
'''

# 统计分析
data.info()

data.describe().round(2)

data.mean()

data.aggregate([min,max,np.mean,np.std,np.median])

python 复制代码

#示例程序，至少包含4个必须实现的方法
import talib
# 在这个方法中编写任何的初始化逻辑。context对象将会在你的算法策略的任何方法之间做传递。
def init(context):
    context.s1 = "000001.XSHE"
    #实时打印日志
    logger.info("Interested at stock:" + str())

# before_trading函数会在每天交易开始前被调用，当天仅会调用一次
def before_trading(context, bar_dict)
	pass
	
#

# 你选择的证券的数据更新将会触发此段逻辑，例如日或分钟历史数据切片或者是实时数据切片更新
# 该策略执行的频率在右边可以选择：天、分钟
def handle_bar(context, bar_dict):
    # 开始编写你的主要的算法逻辑
    pass

# after_trading函数会在每天交易结束后被调用，当天只会被调用一次
def after_trading(context):
    pass

从300支股票从选取10支收益率最高的股票，并买入；

收益率从股票的财务数据中提取，然后排序；

该策略每天执行，每天都会更新10支股票，需要将现有股票与排行榜中的股票进行比对，卖掉不在榜内的股票，买入在榜上的股票。