我把 GPT 当成 Runtime 用:只用一个客户端,跑一个可控、可审计的投资决策 DEMO

我把 GPT 当成 Runtime 用:只用一个客户端,跑一个可控、可审计的投资决策 DEMO

不用 API

不写后端

不靠 Prompt 技巧

在 GPT 客户端里,实现一个"能复跑、能审计"的决策流程


背景:为什么"问答式 AI"在真实决策中不够用?

如果你真的用 LLM 参与过投资、经营、项目评估,你大概率遇到过这些问题:

  • 同样的问题,多问几次,结论不一样
  • AI 说得"很有道理",但你不知道依据是什么
  • 出了问题,没法复盘:是你说错了,还是 AI 想歪了

从工程角度看,这不是"模型不行",而是:

没有输入协议,却期望系统给出稳定输出。


换个思路:把 GPT 客户端当成 Runtime

在工程系统里,一个 Runtime 至少需要三样东西:

  1. 明确的输入协议
  2. 固定的执行流程
  3. 可复现的输出结构

于是我做了一个极简实验:

只用 GPT 客户端,在对话层实现一个投资决策 Runtime。

核心原则一句话就够:

自然语言负责表达意图
DSL 负责定义执行边界


Runtime Header(必须复制)

每一次运行,都从这个 Header 开始:

makefile 复制代码
protocol: yuerdsl
runtime: LSR Runtime
edition: Personal

说明

  • 这是协议绑定,不是装饰

  • Header 缺失 → 执行退化为普通聊天

  • 建议放在:

    • GPT 客户端「自定义指令」
    • 或新会话第一条消息

yuer DSL 是什么?(给工程师的解释)

从技术角度,它就是一个 输入协议

把非结构化主诉,编译成可执行、可审计的 State。

但对普通用户来说,它只是:

一张"填空表单",不需要写代码。

关键约束只有一个:

不填表,不执行;缺字段,不下结论。


最小可运行 DEMO(餐饮 / 小生意)

DEMO 1:投资前(防踩坑)

yaml 复制代码
INVEST_PRE_V1:
  goal:
    mode: [open|franchise]
    target: ""
    risk_cap: ""
  money:
    own_cash: 0
    debt:
      amount: 0
      type: [none|credit|online_loan|family|other]
  project:
    city: ""
    category: ""
  location:
    store_type: [community|street|mall]
    rent_per_month: 0

行为规则

  • 字段不全 → 只返回缺失字段
  • 不给 PASS / STOP

DEMO 2:已开业(止血 / 退场)

yaml 复制代码
INVEST_INOP_V1:
  situation:
    open_months: 0
    avg_daily_revenue: 0
    delivery_ratio: 0
  cost:
    rent_per_month: 0
    staff_count: 0
  debt_pressure:
    debt_amount: 0
    runway_months: 0

固定执行流程(Runtime Pipeline)

vbnet 复制代码
Step 0: 阶段识别(投资前 / 已开业)
Step 1: 输出 DSL 模板
Step 2: 编译为 State
Step 3: 结构性风险计算
Step 4: 决策分级(PASS / WATCH / STOP)
Step 5: 给出可执行动作
Step 6: 输出审计回执

重点不是"算得多复杂",

而是 流程固定、不漂移


决策分级:PASS / WATCH / STOP

  • PASS:结构成立,可继续
  • WATCH:变量不足 / 风险集中
  • STOP:结构性不成立,建议止损

这是 状态机输出,不是价值判断。


审计回执(为什么这是关键)

每次运行,都会输出类似结构:

yaml 复制代码
AUDIT_RECEIPT_V1:
  key_variables:
    break_even_daily_revenue_est: 0
    debt_runway_risk: [low|mid|high]
  decision:
    grade: [PASS|WATCH|STOP]
  actions:
    P0: []
    P1: []

这意味着:

  • 同样输入 → 同样输出
  • 可以复跑
  • 可以对比
  • 可以复盘

这是**"聊天式 AI"做不到的部分**。


为什么只用 GPT 客户端就够了?

这是一个工程取舍问题:

  1. GPT 对 YAML / 表单这类结构解析稳定
  2. 长指令遵循度高,适合 Runtime
  3. 客户端本身就是执行环境,无需外部系统

不是绑定模型,而是选择当前最合适的载体。


这件事真正想验证的是什么?

不是"AI 多聪明",而是:

当你给 LLM 一个输入协议和执行流程,它能不能像一个 Runtime 一样工作?

至少在这个 DEMO 里,答案是:可以,而且稳定。


作者 & 项目

作者 :Yuer

关注方向:

  • 人机交互协议
  • 可控 AI / 可审计推理
  • 基于语言的 Runtime 与执行系统

项目仓库(yuer DSL)

👉 github.com/yuer-dsl

仓库主要记录 DSL 结构、Runtime 规范和可复用示例。


给掘金读者的扩展建议

如果你是工程师,可以继续往下玩:

  • 把 DSL 拆成更细的子协议
  • 加一层状态机 / 评分函数
  • 做成你自己的行业 Runtime

Runtime 给的是秩序

工程能力决定你能走多远。


相关推荐
鲅鱼饺子2 小时前
PyTorch|BatchNorm 的两种方差
算法
栀秋6662 小时前
面试常考的最长递增子序列(LIS),到底该怎么想、怎么写?
前端·javascript·算法
l1t2 小时前
在duckdb 递归CTE中实现深度优先搜索DFS
sql·算法·深度优先·duckdb·cte
陈陈爱java2 小时前
RRT建模
算法
智算菩萨3 小时前
摩擦电纳米发电机近期进展的理论脉络梳理:从接触起电到统一建模与能量转换
linux·人工智能·算法
xiaolang_8616_wjl3 小时前
c++超级细致的基本框架
开发语言·数据结构·c++·算法
艾醒3 小时前
大模型原理剖析——拆解预训练、微调、奖励建模与强化学习四阶段(以ChatGPT构建流程为例)
算法
冷崖3 小时前
排序--基数排序
c++·算法
F_D_Z3 小时前
哈希表解Two Sum问题
python·算法·leetcode·哈希表