
一、 金融 AI 的核心挑战:通用 LLM 的局限性
在金融实战中,通用大模型(如 Claude 3.5, GPT-4)直接上岗会面临三大障碍:
- 幻觉风险:在财务建模中,极小的数值偏差即可导致估值错误。
- 数据孤岛:核心金融数据(FactSet, LSEG)封闭在专业终端后,AI 无法直接触达。
- 流程坍塌:复杂金融工作流(如跨国对账)步骤繁多,模型在长链路中容易丢失逻辑。
Anthropic 的 financial-services 项目通过 Managed Agents 架构与 MCP 协议,将 LLM 转化为受控的金融专家。

二、 生产材料:构建环境的"四大基石"
- 推理引擎 :推荐 Claude 3.5 Sonnet,其在 Tool Use 和逻辑推理上的平衡性最适合金融场景。
- 数据连接 :需具备 FactSet 或 LSEG API 权限。项目通过 MCP 协议实现数据"喂入"。
- 计算平台 :支持 AWS 部署,利用 Lambda 或 App Runner 承载无头 Agent。
- 开发语言 :基于 TypeScript 。通过强类型契约,确保 Agent 间
Handoff Payload的数据一致性。
三、 核心架构:两栖部署、智能编排与事实锚定
本项目并非简单的聊天机器人,而是一套高度工程化的金融 AI 引擎。其核心架构由三个维度交织而成:
1. 两栖部署:从"助手" to "引擎"

该项目支持 "一份源码,两栖部署":
- Claude Cowork (插件模式) :分析师侧边栏。侧重人机交互,AI 辅助阅读招股书并提供
/comps等快捷建议。 - Managed Agents (托管模式):无头后台服务。AI 作为自主引擎集成进 ERP 或审计流程,处理深夜对账等耗时任务。
2. 核心编排:Orchestrator-Subagent 与 Handoff 机制
- 任务分解 (Orchestrator) :编排者负责意图识别与任务指派,确保任务被分发给最专业的 Subagent(如:财报提取专家、合规专家)。
- 接力机制 (Handoff) :项目实现了
handoff_request事件监听机制。当 Agent A 完成数据采集后,仅将关键 Payload 移交给 Agent B 分析,大幅节省 Token 并在长链路中保持逻辑一致性。

3. MCP 协议:实现事实锚定 (Fact Grounding)
Model Context Protocol (MCP) 是对抗幻觉的核心:
- 动态协商:数据源自动向 Claude 宣告其"工具能力"。
- 事实强制比对:系统会自动比对 AI 生成值与原始数值,强制纠偏,确保"言必有据"。

四、 深度穿透:八大投资模块的 Skill 逻辑深度解析
本项目的核心生产力源于对金融工程的极端解构。以下是针对 8 个核心模块的深度 Skill 分析,展示了如何通过结构化指令(Skill)将 Claude 转化为资深分析师。
1. 投资逻辑 (Investment Logic)
-
核心 Skill :
thesis-tracker -
Skill 原文片段 :
markdown- **Thesis statement**: 1-2 sentence core thesis (e.g., "Long ACME --- margin expansion from pricing power + operating leverage as mix shifts to software") - **Key pillars**: 3-5 supporting arguments - **Stop-loss trigger**: What would make you exit ### Step 3: Thesis Scorecard | Pillar | Original Expectation | Current Status | Trend | |--------|---------------------|----------------|-------| | Revenue growth >20% | On track | Q3 was 22% | Stable | -
原文解读: 要求定义"可证伪"的投资陈述和止损触发点,并强制使用 Scorecard 跟踪每一个支柱。
-
使用场景思考: 适用于防止"投资幻觉",当市场噪音巨大时,Agent 协助分析师冷静对照初始逻辑,而非被股价波动左右。
-
使用案例模拟 :
- 输入: "更新 Nvidia 的投资逻辑,Q3 毛利超预期。"
- 预期输出 : 自动更新
Thesis Scorecard,将毛利支柱由On track提升为Outperforming,并重新计算估值安全边际。
2. 投资风险 (Investment Risk)
-
核心 Skill :
audit-xls -
Skill 原文片段 :
markdown- Every projection cell MUST be an Excel formula --- never a pre-computed value. - If you find yourself computing a value in Python and writing the result --- STOP. Write the formula instead. | # | Sheet | Severity | Issue | Suggested Fix | |---|---|---|---|---| | 1 | BS | Critical | Assets != L+E | Check RE rollforward | -
原文解读: 严禁硬编码(Hardcodes),要求 Agent 必须在 Excel 中写入动态公式,并提供分级的审计报错机制。
-
使用场景思考: 在深夜处理复杂的并购模型时,Agent 作为"数字哨兵",能瞬间定位由于四舍五入或逻辑断路导致的报表不平。
-
使用案例模拟 :
- 输入: "检查我刚生成的 DCF 模型。"
- 预期输出 : 一份
Audit Report,标记出第 42 行存在硬编码,并给出对应的修复公式字符串。
3. 公司概览 (Company Overview)
-
核心 Skill :
earnings-analysis -
Skill 原文片段 :
markdown**CRITICAL**: Properly cite all data with SPECIFIC sources and CLICKABLE HYPERLINKS. Source: Q3 2024 10-Q filed November 8, 2024; [Hyperlink "10-Q" to: https://www.sec.gov/...] - **Identify management tone**: Track phrases like "cautiously optimistic" or "headwinds". -
原文解读: 强制要求数据溯源至 SEC 原文链接,并对管理层语调进行语义建模。
-
使用场景思考: 快速阅读上百页的 10-K 文件。Agent 提取关键数值后,分析师可一键点击链接核实原始上下文。
-
使用案例模拟 :
- 输入: "总结 Apple 最新的季度财报。"
- 预期输出: 结构化的摘要,包含毛利贡献、研发投入,且每个数字后缀均带有点向 SEC 官网的跳转链接。
4. 产品分析 (Product Analysis)
-
核心 Skill :
competitive-analysis -
Skill 原文片段 :
markdown| Moat | What to assess | |---|---| | Network effects | User/supplier flywheel strength | | Switching costs | Technical integration depth, lock-in | ### Step 2: Value Chain Mapping - Identify suppliers, distributors, and end-users. -
原文解读: 运用波特五力与护城河框架,要求 Agent 从网络效应和切换成本维度量化产品竞争力。
-
使用场景思考: 评估 SaaS 公司时,通过分析 API 集成深度(切换成本)来判断客户留存率的确定性。
-
使用案例模拟 :
- 输入: "分析 Snowflake 的护城河。"
- 预期输出: 一份包含"数据重力(Data Gravity)"分析的竞争矩阵,重点标注其网络效应带来的增长飞轮。
5. 行业分析 (Industry Analysis)
-
核心 Skill :
sector-overview -
Skill 原文片段 :
markdown**Market Size & Growth** - Total addressable market (TAM) with source - Historical growth rate (5-year CAGR) - Forecast growth rate and key assumptions -
原文解读: 建立 TAM/SAM/SOM 市场规模金字塔模型,并强制要求 CAGR(复合年均增长率)的逻辑推导。
-
使用场景思考: 进入新赛道(如低轨卫星)时,Agent 快速扫描行业研报,建立起自上而下的市场容量模型。
-
使用案例模拟 :
- 输入: "建立全球 AI 芯片的市场规模模型。"
- 预期输出: 包含分年度增长预测的 TAM 漏斗图,并注明驱动增长的核心假设(如 H100 出货量)。
6. 竞争格局 (Competitive Landscape)
-
核心 Skill :
comps-analysis -
Skill 原文片段 :
markdown| Dimension | Company A | Company B | Company C | |---|---|---|---| | Scale | ●●● $160B | ●●○ $45B | ●○○ $8B | | Growth | ●●○ +26% | ●●● +35% | ●●○ +22% | -
原文解读: 通过可视化的分值(●●●)进行多维对标,将定性的竞争优势转化为半定量的身位分析。
-
使用场景思考: 寻找"估值洼地"时,Agent 通过扫描 Peers 的 P/E 与营收增速,自动识别出偏离回归线的异常标的。
-
使用案例模拟 :
- 输入: "对比特斯拉与其主要竞争对手的交付数据。"
- 预期输出: 一张详尽的可比公司表(Comps Table),包含毛利、交付量、研发占比的横向对比。
7. 财务分析 (Financial Analysis)
-
核心 Skill :
3-statement-model -
Skill 原文片段 :
markdown**Balance Sheet (BS) Quality Checks** - Assets = Liabilities + Equity (primary check) - Cash balance matches Cash Flow Statement ending cash - Retained Earnings rolls forward correctly -
原文解读: 实现严格的三表勾稽检查,确保资产负债表平衡且现金流逻辑闭环。
-
使用场景思考: 自动构建初始财务模型。Agent 确保每一处勾稽关系正确,将分析师从繁琐的"找平"工作中解放出来。
-
使用案例模拟 :
- 输入: "基于最新的年报数据生成三表模型。"
- 预期输出 : 包含 IS/BS/CF 动态链接的 Excel 模板,且内置的
Check Row全显示为0(通过校验)。
8. 估值预测 (Valuation Forecast)
-
核心 Skill :
dcf-model -
Skill 原文片段 :
markdown**Terminal Value Calculation** Terminal FCF = Final Year FCF × (1 + Terminal Growth Rate) Terminal Value = Terminal FCF / (WACC - Terminal Growth Rate) **Sensitivity Tables**: Odd number of rows/cols (e.g., 5x5) for base case centering. -
原文解读: 内置标准的 DCF 估值公式,并强制要求 5x5 的敏感性分析矩阵,以确定估值的安全边界。
-
使用场景思考: 终极定价环节。分析师可以通过调整 WACC 或终端增长率,观察股价对核心变量的敏感程度。
-
使用案例模拟 :
- 输入: "运行 Amazon 的 10 年 DCF 模型。"
- 预期输出: 包含 WACC 计算过程、详细现金流折现及最终"足球场图(Football Field)"估值区间的分析报告。
五、 实战:以"总账核对 (GL Reconciler)"为例
全链路流程:
- 数据抓取 :
Reader Agent通过 MCP 访问全球 ERP,抓取异构账务。 - 规则审计 :
Engine Agent调用 Cookbook (专家食谱) 中的审计规则进行匹配。 - 异常决策 :无法匹配的账项通过 Handoff 移交给风险 Agent,进行历史邮件关联分析。
- 报告生成:最终生成一份带推理依据、符合 SEC 审计标准的合规底稿。
六、 总结:迈向工业级金融生产力

financial-services 的成功不仅在于模型能力,更在于其架构的克制:
- 以协议为核心:用 MCP 解决连接性。
- 以规约为框架:用 Managed Agents 解决可控性。
这套代码库为将 LLM 引入金融核心业务提供了成熟的工业模板。建议立即部署,从定制第一个"金融专家食谱"开始。