金融相关的强化学习工具

在金融强化学习中,我们既可以自己实现环境,也可以利用现有工具快速搭建实验平台。本文重点介绍如何使用现成工具来简化金融 RL 实践。

1 选择金融的 RL 库

方式 代码量 学习成本 复用性 回测功能 适用场景
FinRL / gym-anytrading 完善 教学、快速实验、科研
自写 gym.Env 极简环境 需自写 简单实验
完全自研环境和回测 需自写 高度定制的金融研究

现成工具推荐:

  • gym-anytrading

    :适合快速上手和教学实验,带示例数据(如 Open/High/Low/Close/Volume)。

  • FinRL

    :适合多资产、真实市场数据回测、科研和产业应用。

  • quantgym

    :适合专业衍生品市场建模,需要金融衍生品基础。

新手建议使用 gym-anytrading,快速完成实验,降低开发成本。


2 gym-anytrading 简介

gym-anytrading (https://github.com/AminHP/gym-anytrading) 2.3k star,主要支持股票和外汇市场,提供三种环境:TradingEnvForexEnvStocksEnv。默认动作仅包含买入(1)和卖出(0)。

优势:

  • 简单易用,代码量少,上手快

  • 支持数据处理、回测和可视化

  • 内置时序信息,只需设置 window_size

  • 可扩展和集成,适合 RL 实验和策略验证


3 gym-anytrading 回测示例

复制代码
import gymnasium as gym
import gym_anytrading
from gym_anytrading.envs import StocksEnv
from gym_anytrading.datasets import STOCKS_GOOGL

env = gym.make('stocks-v0', df=STOCKS_GOOGL, frame_bound=(50, 100), window_size=10)

observation = env.reset(seed=2023)
while True:
    action = env.action_space.sample()
    observation, reward, terminated, truncated, info = env.step(action)
    done = terminated or truncated
    if done:
        print("info:", info)
        break

env.unwrapped.render_all()

通过控制 action,可以切换 RL 模型策略、手写规则策略或实盘操作。


4 可视化示例

复制代码
import matplotlib.pyplot as plt  
plt.figure(figsize=(15,6)) 
plt.plot(env.history['total_profit'], label='Total Profit') plt.legend() 
  • env.render()

    env.unwrapped.render_all() 可用于可视化回测结果。


5 自定义环境类示例

​​​​​​​

复制代码
import pandas as pd 
from gym_anytrading.envs 
import TradingEnv from gym_anytrading.datasets 
import STOCKS_GOOGL  

class StockTradingEnv3(TradingEnv):     
...

5.1 核心方法和说明

方法 说明
__init__ 初始化环境,传入 dfwindow_sizeframe_bound
_process_data 决定 observation 特征(如 OHLCV)
step 执行动作,返回 observation、reward、done 等
reset 重置环境,返回初始 observation
_calculate_reward 根据当前价格或特征计算 reward
_update_profit 累计总利润,计算 RL 代理的收益

observation 是 (window_size, feature_dim) 的二维数组,reward 与当前步 _current_tick 同步。

5.2 附加功能

  • 可设置交易费率 trade_fee_bid_percent / trade_fee_ask_percent

  • 可获取最大可能利润 max_possible_profit


6 总结

  • 使用 gym-anytrading 可以快速搭建金融 RL 实验环境,节省大量重复代码

  • 支持回测和可视化,同时保留自定义空间

    • 非常适合教学、实验和快速原型开发

7 参考资料

  • gym-anytrading 文档
相关推荐
机汇五金_1 天前
深圳连续模五金冲压件
金融
kels88991 天前
加密货币实时api的订单簿快照多久更新一次?
开发语言·笔记·python·金融·区块链
AIFQuant2 天前
Java 对接全球股票实时报价:高可用架构与异常处理
java·开发语言·websocket·金融·架构·股票api
多年小白2 天前
复盘】2026年5月21日(周四)
大数据·人工智能·ai·金融·区块链
kels88992 天前
实时外汇api的节假日交易时间表,能自动判断休市吗?
开发语言·经验分享·笔记·python·金融·区块链
号码认证服务2 天前
公司号码认证怎么申请?提交企业资质开通名片,建立高效外呼体系
游戏·金融·健康医疗·传媒·零售·教育电商·交通物流
CryptoPP3 天前
快速集成:基于现代API的金融数据流解决方案
大数据·数据结构·笔记·金融·区块链
无心水3 天前
【分布式利器:金融级】金融级分布式架构开源框架全景解读
人工智能·分布式·金融·架构·开源·wpf·金融级框架
无心水4 天前
【分布式利器:SOAF】蚂蚁开源的金融级微服务全家桶:SOFAStack 核心架构与实战选型对比
人工智能·分布式·微服务·金融·架构·开源·分布式利器
xingbuxing_py4 天前
精华贴分享|【研报复现】财务质量类因子改进
金融·股票·编程·理财·量化投资·股市·炒股