MCP Server工具参数设计与AI约束指南

前言

使用 MCP 或类似 Prompt 编排框架时的常见痛点:当参数定义得太多、太细,AI 反而"自由发挥",提取出你没想让它提取的参数,导致调用出错或结果失控。

比如这里有一个查询会议室的mcp server,设置了如下这些参数,还有筛选(这里的筛选相当不严谨,只是demo,将就一下吧)

将它注册在mcp client上,测试一下,可以看到

我仅仅只是问"北京"的会议室,AI却意外根据MCP Server工具的参数描述意外的提取了额外的参数,而且这些参数是毫无根据的,楼层1?容量10?哪里来的,这不是乱讲吗?

然后我将所有参数都去掉

再试一下,这个效果就好得多

小结一下这两种的差别,

总体上都是:用户输入-AI + MCP Client(理解-根据mcp工具列表,选择调用工具?-提取工具参数-调用-整理结果-输出)

方式1:定义了MCP工具参数,AI+MCP Client调用MCP Server,筛选是由MCP Server先初步代码筛选,然后再经过AI的二步筛选。

方式2:删掉了所有的MCP工具参数,一次性将所有数据返回,然后直接由AI筛选。

虽然上面展示出来的是,方式2更符合要求,但其实使用MCP Server并不是这么随意,一边所有参数带上,让AI提取参数后发,一边把所有参数去掉,让AI在相应的基础上再发挥。

归根到底这是MCP 或类似 Prompt 编排框架时的常见痛点:当参数定义得太多、太细,AI 反而"自由发挥",提取出你没想让它提取的参数,导致调用出错或结果失控。

所以我们非常需要一套比较合理且有相关实践经验的"方法论"。

MCP参数定义原则

1、只暴露必要参数(最小化原则)

不要为了"完整"而定义所有可能的参数。

  • 错误做法:定义 user_name, user_age, user_gender, user_location, user_interests, scene, tone, length, format... 等 20 个参数。

  • ✅ 正确做法:只暴露当前任务真正需要决策的参数。比如这次调用只需要 tone 和 length,其他都用默认值或上下文推断。

AI 的"自由发挥"往往源于你给了它太多"想象空间"。

2、参数命名要"防歧义"

  • 避免模糊词:如 style, mode, type ------ AI 容易脑补。

  • 推荐命名:动词+名词限定+名词,例如:

    • output_tone(而不是 style)

    • response_length_in_sentences(而不是 length)

    • target_audience_age_group(而不是 audience)

3、枚举值优先,避免开放输入

  • 开放式:tone: "请用幽默或严肃的语气"

  • 枚举式:

json 复制代码
"tone": {
  "type": "string",
  "enum": ["humorous", "serious", "neutral", "sarcastic"],
  "description": "输出语气风格"
}

AI 更容易识别并从选项中选择,而不是"创造"一个 melancholic。

防止 AI "自由发挥"的 5 大策略

策略 1:使用"白名单参数"机制

在 MCP Server 层面,定义一个合法参数白名单。AI 提取的参数如果不在白名单内,直接拒绝调用或自动忽略。

python 复制代码
VALID_PARAMS = {"tone", "length", "format", "audience"}

def validate_params(extracted):
    return {k: v for k, v in extracted.items() if k in VALID_PARAMS}

这是最直接的"防越界"手段。

策略 2:在 Prompt 中明确"禁止推测"

在给 AI 的指令中,加入强约束性语句

"你只能从以下参数中提取值:tone, length, format。禁止推测或生成任何未列出的参数。如果用户提到其他信息,请忽略。"

你可以测试不同表述,比如:

  • "Strictly extract only the parameters defined below."

  • "Do not invent new parameters, even if the user implies them."

策略 3:使用"结构化输出 + Schema 校验"

不要依赖 AI 自由输出 JSON,而是要求它严格按照你定义的 JSON Schema 输出,并在后端做校验。

示例 Schema:

json 复制代码
{
  "type": "object",
  "properties": {
    "tone": { "type": "string", "enum": ["fun", "formal", "casual"] },
    "length": { "type": "integer", "minimum": 1, "maximum": 5 }
  },
  "required": ["tone"],
  "additionalProperties": false  // 关键!禁止额外字段
}

additionalProperties: false 是防止"自由发挥"的关键。

策略 4:分阶段提取:先分类,再提取

不要让 AI 一步到位提取所有参数。可以分两步:

  1. 意图识别阶段:判断用户想调用哪个功能(如"写文案"、"生成图片")。

  2. 参数提取阶段:根据功能,加载对应的参数 schema,再提取。

这样可以缩小参数搜索空间,减少误提取。

策略 5:加入"默认值 + 忽略机制"

对于非关键参数,设置默认值,并允许 AI "不提取":

"如果用户未明确提及 length,则使用默认值 3。不要试图从上下文中推测。"

这样避免 AI 为了"完整"而强行提取。

总结

"定义要窄,枚举要全,约束要严,校验要狠。"

不要指望 AI 能"自觉"遵守规则,而是要用 Schema + Prompt + 后端校验 三层围栏,把它圈在你想要的范围内。

相关推荐
果粒橙_LGC7 分钟前
论文阅读系列(一)Qwen-Image Technical Report
论文阅读·人工智能·学习
雷达学弱狗21 分钟前
backward怎么计算的是torch.tensor(2.0, requires_grad=True)变量的梯度
人工智能·pytorch·深度学习
Seeklike23 分钟前
diffuxers学习--AutoPipeline
人工智能·python·stable diffusion·diffusers
杨过过儿39 分钟前
【Task01】:简介与环境配置(第一章1、2节)
人工智能·自然语言处理
小妖同学学AI40 分钟前
deepseek一键生成word和excel并一键下载
人工智能·word·excel·deepseek
黎燃1 小时前
AI助力垃圾分类与回收的可行性研究:从算法到落地的深度解析
人工智能
强盛小灵通专卖员1 小时前
DL00291-联邦学习以去中心化锂离子电池健康预测模型完整实现
人工智能·机器学习·深度强化学习·核心期刊·导师·小论文·大论文
Hello123网站1 小时前
多墨智能-AI一键生成工作文档/流程图/思维导图
人工智能·流程图·ai工具
有Li2 小时前
CLIK-Diffusion:用于牙齿矫正的临床知识感知扩散模型|文献速递-深度学习人工智能医疗图像
人工智能·深度学习·文献·医学生
大唐荣华2 小时前
视觉语言模型(VLA)分类方法体系
人工智能·分类·机器人·具身智能