【AI面试临阵磨枪-088】Skill 如何做参数校验、依赖注入、权限控制、超时、重试、幂等?

一、面试题目

请讲解 AI Agent Skill 层面如何实现 参数校验、依赖注入、权限控制、超时控制、重试机制、幂等性,分别说明实现方式、落地规则与技术方案。

二、知识储备

1. 参数校验(入参/出参校验)

目标:提前拦截非法参数、空值、格式错误、越界数据,避免下游工具调用报错、产生幻觉、资损。

校验内容

  • 非空校验:用户ID、订单ID、手机号、关键业务参数必填
  • 格式校验:手机号、订单号、时间格式、枚举值
  • 范围校验:退款金额、赔付额度、时间范围、状态合法性
  • 业务规则校验:订单是否可退款、是否超售后时效

实现方式

  1. 配置化校验:JSON Schema / YAML 定义参数规则
  2. 代码层校验:Skill 入口统一校验器
  3. 强约束:校验失败直接拒绝执行,返回明确错误,不进入工具调用

要点

Skill入口统一拦截,不在内部各个步骤重复校验。

2. 依赖注入(DI)

目标:解耦 Skill 与底层 Tool、数据库、缓存、外部接口,实现可插拔、可测试、可替换。

注入对象

  • 工具依赖:查询订单、物流、退款、RAG 检索工具
  • 基础设施:Redis、向量库、消息队列、配置中心
  • 通用组件:日志、鉴权、熔断、重试、监控

实现方式

  • 构造函数注入:Skill 初始化时注入依赖
  • 上下文注入:执行时通过上下文透传
  • 容器托管:Skill 中台统一管理依赖实例

优势

Skill 只关注业务流程,不用关心底层调用细节;便于单元测试、Mock 测试。

3. 权限控制

目标:多租户、多角色、数据隔离,防止越权访问、越权操作(如查别人订单、随意退款)。

三层权限

  1. 租户级:只能操作本租户数据,tenant_id 强制过滤
  2. 用户级:只能操作自己的订单/数据,user_id 绑定
  3. 功能级:普通用户不能执行赔付、后台操作等高危 Skill

实现

  • 执行前鉴权:从上下文获取用户身份、角色、租户ID
  • 数据过滤:所有查询自动带上租户+用户过滤条件
  • 高危操作二次校验:大额退款、赔付需权限放行

要点

权限前置校验,贯穿 Skill 全流程,工具调用前必校验。

4. 超时控制

目标:防止下游接口慢、网络抖动导致 Skill 卡死、线程堆积、雪崩。

实现

  1. 全局超时:整个 Skill 执行总超时(如 5s)
  2. 单工具超时:每个 Tool 调用独立超时(如 2s)
  3. 超时策略:超时直接熔断,返回兜底结果或人工转接

落地规则

  • 实时数据类(订单/物流)严格短超时
  • 复杂推理类适当放宽
  • 超时后不再重试,直接降级

5. 重试机制

目标 :应对瞬时网络波动、接口抖动,提高执行成功率;禁止业务异常重试

重试规则(面试必背)

  • 可重试:网络异常、连接超时、5xx 服务端错误
  • 不可重试:参数错误、权限不足、业务规则不允许、4xx 错误

实现

  • 指数退避重试:1s→2s→4s,最多 2--3 次
  • 按工具粒度重试,不整段 Skill 重试
  • 重试次数超限直接熔断降级

禁忌

退款、赔付类高危操作禁止重试,防止重复扣款。

6. 幂等性(最关键,防资损)

目标:保证同一请求多次触发,只执行一次,防止重复退款、重复赔付、重复创建工单。

实现方案

  1. 唯一幂等ID:每个 Skill 调用生成 requestId,全局唯一
  2. 幂等表/Redis:记录 requestId + 执行状态(待执行/成功/失败)
  3. 执行前查状态:已成功直接返回结果;执行中加分布式锁
  4. 结果可回溯:通过订单ID+用户ID做业务幂等

高危场景强制幂等

退款、赔付、红包发放、订单创建,必须幂等兜底。

三、代码实现(Skill 统一执行骨架)

python 复制代码
class BaseSkill:
    def __init__(self, tools, auth_service, idempotent_helper):
        # 依赖注入
        self.tools = tools
        self.auth = auth_service
        self.idempotent = idempotent_helper

    async def run(self, context):
        # 1. 参数校验
        self.validate_params(context.params)
        
        # 2. 权限校验
        self.auth.check_permission(context.user_id, context.tenant_id)
        
        # 3. 幂等校验
        idempotent_key = f"{context.skill_id}:{context.request_id}"
        if self.idempotent.is_done(idempotent_key):
            return self.idempotent.get_result(idempotent_key)
        
        try:
            # 4. 带超时、重试执行业务流程
            result = await self.execute_with_timeout_retry(context)
            self.idempotent.mark_success(idempotent_key, result)
            return result
        except Exception as e:
            self.idempotent.mark_fail(idempotent_key)
            return self.fallback()

四、破局之道(面试升华)

Skill 相比传统 Function Calling,核心优势就是标准化的非功能能力封装

通过参数校验提前拦截非法输入、依赖注入解耦工具、权限控制保障安全、超时防止卡死、重试提升稳定性、幂等杜绝资损 ,把原本模型容易出错、不可控的单步调用,升级为稳定、安全、可运维、可规模化的企业级业务能力,这也是生产环境落地的核心要求。

相关推荐
城事漫游Molly1 小时前
AI与质性研究的融合(三):AI赋能质性数据分析——从编码到理论构建的新范式
大数据·人工智能·机器学习·prompt·ai for science·智能体·定性研究
chenying9981791 小时前
语音克隆模型的难点之一:音素对齐及交叉注意力早期失效问题 (兼论旋转位置编码)——F5-TTS、SupertonicTTS、VoxFlash-TTS 对比
人工智能·实时音视频·语音合成·tts·语音克隆
凯丨1 小时前
会“做梦“的 AI:用一句话生成可以玩的世界——读懂世界模型 Genie 3
人工智能·microsoft
踏着七彩祥云的小丑1 小时前
AI学习——记忆系统
人工智能·学习·ai
浅念-1 小时前
LeetCode 记忆化搜索 刷题总结
数据结构·算法·leetcode·职场和发展·深度优先·dfs
ACP广源盛139246256731 小时前
GSV2221@ACP# 高带宽低功耗显示转换芯片,赋能 TRAE SOLO 设备高清扩展升级
人工智能·嵌入式硬件·电脑·音视频
大强同学1 小时前
我用 Claude Code,把 NotebookLM 变成了 Obsidian 插件
人工智能·agent·claude·skill·notebooklm
J2虾虾2 小时前
Spring AI Alibaba - Memory 短期记忆
人工智能·spring·microsoft
刘一说2 小时前
AI科技热点日报 | 2026年5月30日
人工智能·科技