文章目录
-
- 前言
- 一、通用科研基础工具
-
- [1.1 论文检索](#1.1 论文检索)
- [1.2 文献管理](#1.2 文献管理)
- [1.3 私有知识库 / RAG 框架](#1.3 私有知识库 / RAG 框架)
- 二、计算机领域专项工具
-
- [2.1 自主科研 Agent](#2.1 自主科研 Agent)
-
- [AI-Researcher(港大 · NeurIPS 2025)](#AI-Researcher(港大 · NeurIPS 2025))
- Auto-Deep-Research(港大同组)
- [2.2 综述与报告生成](#2.2 综述与报告生成)
-
- STORM(Stanford)
- [Open Deep Research(LangChain)](#Open Deep Research(LangChain))
- [2.3 代码与实验辅助](#2.3 代码与实验辅助)
- [2.4 科研技能库(面向 Agent 开发者)](#2.4 科研技能库(面向 Agent 开发者))
- [2.5 CS 领域选型建议](#2.5 CS 领域选型建议)
- 三、金融领域专项工具
-
- [3.1 金融大语言模型](#3.1 金融大语言模型)
- [3.2 量化投资框架](#3.2 量化投资框架)
- [3.3 金融研究数据与基准](#3.3 金融研究数据与基准)
- [3.4 金融领域选型建议](#3.4 金融领域选型建议)
- 四、全领域工具总览
- 五、趋势观察
- 结论
- 参考资料
标签:
AI科研开源工具量化投资LLMRAGAgentFinGPTQlib
前言
大语言模型(LLM,Large Language Model)正在重塑科研范式。过去需要数周的文献综述、数天的实验脚本,现在借助 AI Agent 可以压缩到数小时完成。
但工具爆炸带来的问题是:选哪个?怎么组合?
本文聚焦 计算机 和 金融 两个领域,从自主科研 Agent、代码实验辅助、量化投资框架、金融大模型四个维度,梳理目前最值得关注的开源项目,并给出具体的选型建议。
一、通用科研基础工具
这些工具在两个领域都有广泛应用,建议优先了解。
1.1 论文检索
| 工具 | 特点 | 适用场景 |
|---|---|---|
| Semantic Scholar | 2亿+ 论文,AI 自动高亮论文目标 / 方法 / 结论,开源 PaperMage 库 | 文献调研首选入口 |
| Elicit | Ai2 非营利出品,108M+ 摘要,自动提取研究问题和结论 | 快速获取多篇论文要点 |
| Consensus | 专注"用论文回答具体问题"的模式 | 验证某个结论是否有文献支撑 |
1.2 文献管理
Zotero --- 开源,免费,跨平台。v7 版本支持 PDF 智能重命名、AI 自动标签、WebDAV 云同步,是目前生态最完善的文献管理工具。唯一的局限是存储空间默认只有 300MB,超出需要自建 WebDAV 或付费。
Litmaps --- 可视化文献引用关系网络,适合做 Survey 时快速发现"漏掉"的重要文献,数据来源覆盖 arXiv、PubMed、Web of Science。
1.3 私有知识库 / RAG 框架
RAG(Retrieval-Augmented Generation,检索增强生成)是当前搭建私有文献知识库的主流技术路线。
| 项目 | 机构 | GitHub Stars | 核心能力 |
|---|---|---|---|
| RAGFlow | InfiniFlow | 70k+ | 文档摄取 → 向量索引 → 多步推理,支持引用溯源,适合企业级知识库 |
| DeepSearcher | Zilliz | ~7k | 本地化深度研究 Agent,适合私有数据场景,部署门槛低 |
二、计算机领域专项工具
2.1 自主科研 Agent
这是近两年最令人兴奋的方向------让 AI 自己完成从想法到论文的全流程。
AI-Researcher(港大 · NeurIPS 2025)
覆盖完整研究生命周期:文献调研 → 假设生成 → 算法实现 → 论文撰写,极少需要人工干预。支持两种输入模式:
| 模式 | 输入 | 系统行为 |
|---|---|---|
| Level 1 | 用户提供详细的研究想法描述 | 系统自动制定实现方案并执行 |
| Level 2 | 用户提供参考论文,不指定想法 | 系统自主生成新的研究假设并探索 |
在线体验:novix.science/chat
注意:全自动生成的论文仍需人工审核,目前在创意性和实验严谨性上存在局限,更适合作为"研究加速器"而非"替代研究者"。
Auto-Deep-Research(港大同组)
- 仓库 :HKUDS/Auto-Deep-Research
- 定位:个人全自动深度研究助手,侧重信息综合与结构化报告输出,适合快速生成领域综述初稿。
2.2 综述与报告生成
STORM(Stanford)
- 仓库 :stanford-oval/storm
- 能力:给定一个主题,自动完成多轮网络检索,生成带引用的 Wikipedia 风格长篇综述。
- 适用:写 Survey 前的背景调研、快速了解陌生领域。
- 局限:生成内容的深度依赖联网搜索质量,细分前沿方向效果有限。
Open Deep Research(LangChain)
- 仓库 :langchain-ai/open-deep-research
- 能力:自主规划搜索策略 → 多步推理 → 生成带引用的结构化报告,MIT 协议完全开源。
- 与 STORM 的区别:STORM 偏向百科式综述,Open Deep Research 更擅长回答具体的研究问题。
2.3 代码与实验辅助
OpenHands
- 仓库 :All-Hands-AI/OpenHands
- 能力:在 Docker 沙箱中自主运行代码、安装依赖、调试、复现实验,支持与 GitHub 联动。
- 适用:CS 实验性研究中需要频繁跑实验、调参、复现 baseline 的场景。
- 局限:长时间复杂任务容易跑偏,仍需人工监督关键节点。
2.4 科研技能库(面向 Agent 开发者)
如果你想基于现有 LLM 搭建自己的科研 Agent,以下两个技能库可以大幅缩短开发时间:
| 项目 | 仓库 | 特点 |
|---|---|---|
| AI-Research-SKILLs | Orchestra-Research/AI-Research-SKILLs | 封装 Claude Code / Codex / Gemini 可用的研究技能模块,即插即用 |
| scientific-agent-skills | K-Dense-AI/scientific-agent-skills | 133 个技能模块,覆盖 CS / 生物 / 金融 / 写作,可接入任何 LLM |
2.5 CS 领域选型建议
| 需求场景 | 推荐工具 | 理由 |
|---|---|---|
| 全流程自动化科研 | AI-Researcher + OpenHands | 前者生成研究方案,后者负责执行代码 |
| 写综述 / Survey 初稿 | STORM + Elicit + Zotero | 自动检索 + 提取要点 + 归档管理 |
| 搭建私有文献知识库 | RAGFlow + Zotero | RAG 引擎 + 文献管理,互补性强 |
| 自定义科研 Agent | AI-Research-SKILLs / scientific-agent-skills | 模块化技能库,省去重复造轮子 |
三、金融领域专项工具
3.1 金融大语言模型
FinGPT
- 仓库 :AI4Finance-Foundation/FinGPT
- 论文 :FinGPT: Open-Source Financial Large Language Models
- 核心能力:金融情感分析、市场预测辅助、财报解读,基于 LoRA 微调,成本低、可复现。
- 数据覆盖:彭博、雅虎财经、Reddit、SEC 财报等多源金融数据。
快速上手示例(金融情感分析):
python
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
model_name = "FinGPT/fingpt-sentiment_llama2-13b_lora"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")
prompt = """Instruction: What is the sentiment of this news? Please choose an answer from {negative/neutral/positive}.
Input: Apple reported record quarterly revenue of $123.9 billion.
Answer: """
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
output = model.generate(**inputs, max_new_tokens=10)
print(tokenizer.decode(output[0], skip_special_tokens=True))
# 预期输出:positive
局限:FinGPT 目前主要基于 LLaMA 2 微调,模型本身知识截止于训练数据日期,实时行情分析需要结合外部数据接口。
FinRobot
- 仓库 :AI4Finance-Foundation/FinRobot
- 定位:基于 LLM 的金融分析 AI Agent 平台,支持接入多种 LLM 后端(OpenAI / 开源模型均可)。
- 能力:自动生成投研报告、财报深度分析、市场趋势解读。
- 与 FinGPT 的关系 :FinGPT 是模型层 (专注于金融 NLP 任务),FinRobot 是Agent 应用层(面向实际金融分析工作流),两者由同一团队维护,配合使用效果最佳。
3.2 量化投资框架
Qlib(微软)
- 仓库 :microsoft/qlib
- Stars:~17k
- 定位:面向机器学习 / 深度学习的量化投研全流程研究平台。
python
# Qlib 快速开始
import qlib
from qlib.constant import REG_CN
# 初始化(使用 A 股数据)
qlib.init(provider_uri="~/.qlib/qlib_data/cn_data", region=REG_CN)
from qlib.contrib.model.gbdt import LGBModel
from qlib.contrib.data.handler import Alpha158
# 使用内置 Alpha158 因子集训练 LightGBM 模型
handler = Alpha158(instruments="csi300", start_time="2018-01-01", end_time="2023-12-31")
model = LGBModel()
# 后续:model.fit() → 回测 → 绩效分析
Qlib 工作流:
数据获取 → 特征工程(Alpha 因子)→ 模型训练 → 策略回测 → 组合优化 → 绩效分析
- 适合人群:做量化因子学术研究、需要规范化可复现实验流程的研究者。
- 局限:数据接口主要面向 A 股,港股 / 美股需要自行适配数据源。
vn.py
- 仓库 :vnpy/vnpy
- Stars:~28k(国内 Stars 最多的量化框架)
- 定位:从策略开发到实盘交易的一站式量化平台。
- 支持品种:A 股、期货、数字货币、外汇、期权等。
- 特点:中文生态完善,文档详细,有活跃社区,适合快速工程落地。
- 局限:框架设计偏向中低频策略,高频交易性能存在瓶颈;不支持港股期权。
RD-Agent(微软)
- 仓库 :microsoft/RD-Agent
- 定位 :LLM + 量化系统结合,自动化因子挖掘与策略研究。
- 核心创新:利用大模型自动生成候选因子代码 → 执行回测验证 → 迭代优化,大幅降低因子研发的人工成本。
- 适合:希望用 AI 加速因子研究流程的量化团队,目前仍处于快速迭代阶段。
3.3 金融研究数据与基准
做金融 LLM 研究,这几个资源可以直接用于论文实验对比:
| 资源 | 链接 | 用途 |
|---|---|---|
| FinLLMs Benchmark | adlnlp/FinLLMs | 金融 LLM 数据集与 benchmark 汇总,适合论文实验 |
| FinAI Contest 2025 | open-finance-lab | 基于 FinRL + FinGPT 的 Agent 竞赛,有公开排行榜 |
| AMiner(清华) | aminer.cn | 3.31 亿论文 + 1.35 亿学者,金融 / 经济领域文献检索 |
3.4 金融领域选型建议
| 需求场景 | 推荐工具 | 理由 |
|---|---|---|
| 金融 NLP / 情感分析研究 | FinGPT + FinLLMs Benchmark | 模型 + 标准测试集,直接复现论文结果 |
| 投研报告自动生成 | FinRobot | 开箱即用的金融 Agent,接入自有 LLM 即可 |
| 量化策略学术研究 | Qlib | 微软出品,规范化程度高,实验可复现 |
| 量化策略工程落地 | vn.py | 中文生态,社区活跃,接口覆盖全 |
| AI 自动化因子挖掘 | RD-Agent | 前沿方向,LLM 驱动因子生成与验证 |
四、全领域工具总览
| 使用场景 | 推荐组合 | 备注 |
|---|---|---|
| CS 全自动科研 | AI-Researcher + OpenHands | 方案生成 + 代码执行 |
| CS 综述 / Survey | STORM + Elicit + Zotero | 检索 + 提炼 + 管理 |
| 私有文献知识库 | RAGFlow + Zotero | 任意领域通用 |
| 金融量化研究(学术) | Qlib + FinGPT + FinLLMs | 全链路可复现 |
| 金融量化研究(工程) | vn.py + RD-Agent | 落地快 + AI 因子挖掘 |
| 金融智能体开发 | FinRobot + RAGFlow | Agent 平台 + 私有知识库 |
| 通用科研 Agent 开发 | scientific-agent-skills + OpenHands | 技能库 + 代码执行环境 |
五、趋势观察
1. 科研自动化进入实用阶段
AI-Researcher(NeurIPS 2025)标志着"概念到论文"的全链路自动化已从 Demo 走向可部署的系统。但需要清醒认识:当前 AI 自主科研在原创性和严谨性上仍有明显局限,更适合定位为"效率倍增器"而非"研究替代者"。
2. 量化研究与 LLM 深度融合
RD-Agent 等项目表明,LLM 正在进入量化研究的核心环节------因子挖掘。根据公开数据,AI 驱动的因子生成可将筛选周期从数周压缩到数天,头部量化私募已在大规模招募 AI 相关研究人员。
3. 开源生态加速分化
GitHub 上 AI 相关仓库 2025 年同比增长 178%,但真正高质量、可落地的项目仍是少数。本文收录的项目均来自知名机构(微软、斯坦福、港大、LangChain)或经过大规模社区验证(Stars > 7k),可以作为可信的起点。
4. 垂直领域工具构建在通用框架之上
FinRobot、AI-Researcher 等垂直工具越来越多地基于 RAGFlow、AutoGen、LangChain 等通用框架构建。这意味着掌握通用框架是使用垂直工具的前提,建议先熟悉 RAGFlow 或 LangChain 的基本用法。
结论
本文系统梳理了计算机和金融两大领域中最值得关注的 AI 科研辅助开源项目,核心结论如下:
- CS 科研 :自动写论文找 AI-Researcher ,跑实验找 OpenHands ,写综述找 STORM
- 金融量化 :学术研究用 Qlib ,工程落地用 vn.py ,金融 NLP 用 FinGPT
- 通用基础 :文献管理用 Zotero ,私有知识库用 RAGFlow
参考资料
- HKUDS/AI-Researcher --- NeurIPS 2025
- AI4Finance-Foundation/FinGPT
- AI4Finance-Foundation/FinRobot
- microsoft/qlib
- microsoft/RD-Agent
- vnpy/vnpy
- infiniflow/ragflow
- stanford-oval/storm
- langchain-ai/open-deep-research
- Semantic Scholar
- Top AI GitHub Repositories in 2026 --- ByteByteGo