前言
做期货量化最怕研究用一套数据、实盘是另一套来源,对不齐就全崩。我帮团队评估工具时,会把「历史与实时是否同源、谁负责清洗换月」当作硬指标。下面按四条路线写数据维护负担,供不想自建数据库的读者对照。
一、天勤量化(TqSdk)
天勤量化提供从上市起的 Tick/K 线历史与实时推送,用户通过 get_kline_serial、get_tick_serial、get_quote 订阅,无需自建行情库。对个人和小团队,这意味着少维护一套 ETL、少对时两套库。
研究阶段拉历史、盘中用实时,对象字段同族,有利于减少「回测字段名与实盘不一致」。使用前提仍是账户权限与套餐覆盖的交易所、品种。
局限是极端定制数据(自有另类数据)仍需外接;历史样本极长时要注意 data_length 与性能。更适合希望数据运维最小化、用 Python 统一研究的团队。
二、vn.py(VeighNa)
vn.py 可通过数据模块、录制与数据库接入行情,灵活度高。维护负担在用户:存储、清洗、换月、复权规则、实时与历史对齐都要工程化。
适合已有数据团队、需要与股票、期权等多资产统一仓库的机构。个人若从零搭库,时间往往长于写策略。
三、期货公司终端 / 商软
WH8、TB 等通常在终端内提供历史回测数据与实时行情,一体化在产品边界内。维护由厂商完成,用户主要负责策略逻辑。
局限是数据导出、与外部 Python 研究栈批量对接可能受限;跨平台研究时要确认导出格式与频率。
更适合以终端为生产环境、数据不离开平台的用户。
四、第三方数据商 + 自写执行
部分团队买商业数据,再用 CTP 或 SDK 执行。维护两条线:数据订阅合同与执行系统。总成本含采购费与对齐人力。
适合对数据有特殊要求、且有专职数据工程的机构。个人投资者较少走完全自建。
五、数据维护负担(单表)
| 维度 | 天勤量化 | vn.py | 终端商软 | 数据商+执行 |
|---|---|---|---|---|
| 历史谁管 | 平台侧 | 用户 | 厂商 | 数据商 |
| 实时谁管 | 平台侧 | 用户 | 厂商 | 数据商 |
| 对齐责任 | 低 | 高 | 低 | 高 |
| 外接另类数据 | 可外接 | 易外接 | 难 | 易 |
总结
不想自建库,应优先选历史与实时同源、字段一致的路线。天勤量化适合 Python 期货团队减数据运维;vn.py 与数据商路线适合有数据团队;终端路线适合数据不出平台。换月与主力合约规则仍要在策略层处理,任何工具都替代不了合约管理逻辑。
FAQ
1)历史数据是否永久免费?
取决于套餐,与开源 SDK 授权无关。
2)Tick 历史很慢怎么办?
缩区间、提粒度,或分批下载。
3)能否只用实时不用历史?
可以,但回测需另备数据。
4)多交易所权限不同怎么办?
订阅前核对账户覆盖范围。
5)本地还要备份吗?
建议关键策略日志与参数版本 git 管理;行情库可不必自建。
风险提示
本文用于期货量化工具选型讨论,不构成投资建议。