【AI面试临阵磨枪-088】Skill 如何做参数校验、依赖注入、权限控制、超时、重试、幂等？

一、面试题目

请讲解 AI Agent Skill 层面如何实现 参数校验、依赖注入、权限控制、超时控制、重试机制、幂等性，分别说明实现方式、落地规则与技术方案。

二、知识储备

1. 参数校验（入参/出参校验）

目标：提前拦截非法参数、空值、格式错误、越界数据，避免下游工具调用报错、产生幻觉、资损。

校验内容

非空校验：用户ID、订单ID、手机号、关键业务参数必填
格式校验：手机号、订单号、时间格式、枚举值
范围校验：退款金额、赔付额度、时间范围、状态合法性
业务规则校验：订单是否可退款、是否超售后时效

实现方式

配置化校验：JSON Schema / YAML 定义参数规则
代码层校验：Skill 入口统一校验器
强约束：校验失败直接拒绝执行，返回明确错误，不进入工具调用

要点

在Skill入口统一拦截，不在内部各个步骤重复校验。

2. 依赖注入（DI）

目标：解耦 Skill 与底层 Tool、数据库、缓存、外部接口，实现可插拔、可测试、可替换。

注入对象

工具依赖：查询订单、物流、退款、RAG 检索工具
基础设施：Redis、向量库、消息队列、配置中心
通用组件：日志、鉴权、熔断、重试、监控

实现方式

构造函数注入：Skill 初始化时注入依赖
上下文注入：执行时通过上下文透传
容器托管：Skill 中台统一管理依赖实例

优势

Skill 只关注业务流程，不用关心底层调用细节；便于单元测试、Mock 测试。

3. 权限控制

目标：多租户、多角色、数据隔离，防止越权访问、越权操作（如查别人订单、随意退款）。

三层权限

租户级：只能操作本租户数据，tenant_id 强制过滤
用户级：只能操作自己的订单/数据，user_id 绑定
功能级：普通用户不能执行赔付、后台操作等高危 Skill

实现

执行前鉴权：从上下文获取用户身份、角色、租户ID
数据过滤：所有查询自动带上租户+用户过滤条件
高危操作二次校验：大额退款、赔付需权限放行

要点

权限前置校验，贯穿 Skill 全流程，工具调用前必校验。

4. 超时控制

目标：防止下游接口慢、网络抖动导致 Skill 卡死、线程堆积、雪崩。

实现

全局超时：整个 Skill 执行总超时（如 5s）
单工具超时：每个 Tool 调用独立超时（如 2s）
超时策略：超时直接熔断，返回兜底结果或人工转接

落地规则

实时数据类（订单/物流）严格短超时
复杂推理类适当放宽
超时后不再重试，直接降级

5. 重试机制

目标：应对瞬时网络波动、接口抖动，提高执行成功率；禁止业务异常重试。

重试规则（面试必背）

可重试：网络异常、连接超时、5xx 服务端错误
不可重试：参数错误、权限不足、业务规则不允许、4xx 错误

实现

指数退避重试：1s→2s→4s，最多 2--3 次
按工具粒度重试，不整段 Skill 重试
重试次数超限直接熔断降级

禁忌

退款、赔付类高危操作禁止重试，防止重复扣款。

6. 幂等性（最关键，防资损）

目标：保证同一请求多次触发，只执行一次，防止重复退款、重复赔付、重复创建工单。

实现方案

唯一幂等ID：每个 Skill 调用生成 requestId，全局唯一
幂等表/Redis：记录 requestId + 执行状态（待执行/成功/失败）
执行前查状态：已成功直接返回结果；执行中加分布式锁
结果可回溯：通过订单ID+用户ID做业务幂等

高危场景强制幂等

退款、赔付、红包发放、订单创建，必须幂等兜底。

三、代码实现（Skill 统一执行骨架）

python 复制代码

class BaseSkill:
    def __init__(self, tools, auth_service, idempotent_helper):
        # 依赖注入
        self.tools = tools
        self.auth = auth_service
        self.idempotent = idempotent_helper

    async def run(self, context):
        # 1. 参数校验
        self.validate_params(context.params)
        
        # 2. 权限校验
        self.auth.check_permission(context.user_id, context.tenant_id)
        
        # 3. 幂等校验
        idempotent_key = f"{context.skill_id}:{context.request_id}"
        if self.idempotent.is_done(idempotent_key):
            return self.idempotent.get_result(idempotent_key)
        
        try:
            # 4. 带超时、重试执行业务流程
            result = await self.execute_with_timeout_retry(context)
            self.idempotent.mark_success(idempotent_key, result)
            return result
        except Exception as e:
            self.idempotent.mark_fail(idempotent_key)
            return self.fallback()

四、破局之道（面试升华）

Skill 相比传统 Function Calling，核心优势就是标准化的非功能能力封装 。

通过参数校验提前拦截非法输入、依赖注入解耦工具、权限控制保障安全、超时防止卡死、重试提升稳定性、幂等杜绝资损 ，把原本模型容易出错、不可控的单步调用，升级为稳定、安全、可运维、可规模化的企业级业务能力，这也是生产环境落地的核心要求。