在 MCP 中实现 “askhuman” 式交互:原理、实践与开源方案

关键词:MCP、Model Context Protocol、交互式参数收集、askhuman、Dify、Lobe Chat、AnythingLLM


1. 背景:MCP 的"无状态"限制

MCP(Model Context Protocol)将 大模型 ↔ 工具 的通信标准化为一次性的 Request--Response 调用:

  • Server 只暴露工具清单与 JSONSchema;
  • Client 把 LLM 生成的参数一次性发出去;
  • Server 执行后返回结果,整个回合结束。

这意味着 原生协议没有中断点 让 Server 反问"还缺什么?"。要实现类 askhuman 的体验,必须把交互逻辑上移到 Client 层


2. 设计模式:多轮对话 + 客户端补参

2.1 数据流

复制代码
┌──────────┐        ┌──────────┐        ┌──────────┐
│   用户    │ <───> │ MCP Client │ <───> │ MCP Server│
└──────────┘        └──────────┘        └──────────┘
  1. LLM 生成 tool_calls,发现缺参 →
  2. Client 拦截
  3. Client 弹窗/CLI 提问 →
  4. 用户回答 →
  5. Client 回填参数
  6. 再次调用 tool →
  7. 结果返回给用户。

2.2 关键实现点

层级 要点
Server 把可能缺失的字段设为 optional,并在 description 注明"如未提供将询问用户"。
LLM Prompt 加系统指令:

"若参数缺失,不要猜测,直接告知用户并等待补充。" |

| Client | 维护对话状态;检测缺失字段;提供 UI/CLI 输入;重试调用。 |


3. 最小可行示例(Node.js CLI)

3.1 伪码:交互式搜索工具

ts 复制代码
// mcp-client.ts
import { Client } from '@modelcontextprotocol/sdk/client/index.js';
import * as readline from 'node:readline/promises';

const rl = readline.createInterface({ input: process.stdin, output: process.stdout });

const client = new Client(/* transport */);

const toolCall = /* 来自 LLM */;
const args = toolCall.arguments;

if (!args.query) {
  args.query = await rl.question('请输入搜索关键词:');
}

const res = await client.callTool({
  name: 'search',
  arguments: args,
});
console.log(res.content);

3.2 效果

复制代码
> 我想搜索一些内容
🤖 需要关键词才能搜索,请输入:
> TypeScript MCP
✅ 调用 search({ query: "TypeScript MCP" }) ...

4. 开源方案盘点

项目 交互方式 部署形态 亮点
Dify 工作流节点「Ask Human」 Docker / SaaS 零代码拖拽、支持审批流
Lobe Chat 前端弹窗注入变量 Vercel / Docker 插件市场、可嵌入网页
AnythingLLM Agent「Require User Input」 桌面 / Docker 私有化、知识库联动
Open MCP Client CopilotKit 表单 纯前端 轻量、可二次开发
Dolphin-MCP CLI 交互钩子 Python 库 适合脚本自动化

5. 典型集成:Dify 实战

5.1 步骤

  1. 在 Dify 新建 Chatflow
  2. 拖入 MCP Tool 节点,选择 search
  3. query 留空 → 拖入 Ask User 节点绑定到 query
  4. 发布应用,用户即可在对话中被询问关键词。

6. 最佳实践小结

  1. 永远让 Server 无状态,交互逻辑只在 Client。
  2. 参数 schema 描述清晰 → LLM 更容易判断何时缺参。
  3. 对话状态持久化(Session ID)→ 支持多用户并发。
  4. 超时与取消机制 → 避免用户长时间无响应卡死流程。
  5. 安全提示 → 敏感操作(删除、转账)务必二次确认。

7. 延伸阅读


🚀 欢迎在评论区分享你的 MCP 交互玩法!

相关推荐
. . . . .7 分钟前
基于React的开源框架Next.js、UmiJS、Ant Design Pro
javascript·react.js·开源
wdfk_prog1 小时前
一个开源的CANopen转Modbus网关
开源
猫先生Mr.Mao3 小时前
2025年8月AGI月评|AI开源项目全解析:从智能体到3D世界,技术边界再突破
人工智能·开源·aigc·agi·ai资讯·分布式推理框架
升鲜宝供应链及收银系统源代码服务5 小时前
升鲜宝供应链管理系统-生鲜配送系统_分拣端界面重构设计(一)
spring boot·重构·开源·收银系统·生鲜门店·升鲜宝多门店收银系统
CoderJia程序员甲9 小时前
GitHub 热榜项目 - 日榜(2025-10-31)
ai·开源·llm·github
无人装备硬件开发爱好者16 小时前
从开源到落地:SimpleBGC 三轴稳像平台全栈技术解析(上)
开源·foc·simplebgc·三轴稳像
开源社16 小时前
2025 开源社最新介绍 — 开源人的家
开源
NocoBase19 小时前
6 大企业级无代码低代码平台 RBAC 权限体系深度对比
低代码·开源·资讯
lht63193561220 小时前
部署开源漏洞扫描工具SiriusScan及问题解决
linux·安全·开源
DisonTangor21 小时前
OpenAI开源gpt-oss-safeguard-120b和gpt-oss-safeguard-20b
人工智能·gpt·语言模型·开源·aigc