[MAF预定义ChatClient中间件-09]MessageInjectingChatClient-赋予工具消息注入的能力

MAF中的ReAct循环是由FunctionInvokingChatClient中间件完成的,这意味着AIFunction的调用也是由它驱动。在默认的情况下,AIFunction绑定的委托执行完成后,结果会转换成AIContent并被封装成一个角色为Tool的ChatMessage。这个ChatMessage最终被添加到对话历史中,并作为后续调用LLM的输入。换言之,AIFunction不像LangChain的工具函数一样,可以通过返回Command对象添加具有合法结构的消息列表到对话历史中。当工具在执行过程借助注入对话历史的消息来描述当前的情况,以辅助LLM后续能够更加精准的推理,这是非常有价值的。比如工具在执行过程中发现验证的风控风险,可以注入一条Assistant消息模拟LLM的回复来提示用户风险的存在。

1. 从工具函数中注入消息

下面的演示程序展示了如何通过MessageInjectingChatClient来实现工具函数中注入消息的能力。这个程序模拟了一个银行转账的业务场景,转账的工具函数是TransferMoney。如代码片段所示,我们从当前Agent执行上下文(AIAgent.CurrentRunContext)中获取当前的Session对象,并检查Session的StateBag中是否存在一个键为UserConfirmed的值来判断用户是否已经确认过转账。如果用户没有确认,工具函数会通过MessageInjectingChatClientEnqueueMessages方法来注入一条Assistant消息到对话历史中,提示用户存在欺诈风险并要求提供手机验证码。与此同时,工具函数会返回一条消息告知用户转账指令已提交至系统缓冲区,等待合规审查。

csharp 复制代码
using Azure;
using Microsoft.Agents.AI;
using Microsoft.Extensions.AI;
using Microsoft.Extensions.DependencyInjection;
using OpenAI;

dotenv.net.DotEnv.Load();

var model = Environment.GetEnvironmentVariable("MODEL")!;
var apiKey = Environment.GetEnvironmentVariable("API_KEY")!;
var endpoint = Environment.GetEnvironmentVariable("OPENAI_URL")!;

var agent = new OpenAIClient(
        credential: new AzureKeyCredential(apiKey),
        options: new OpenAIClientOptions { Endpoint = new Uri(endpoint) })
    .GetChatClient(model: model)
    .AsIChatClient()
    .AsBuilder()
    .UseMessageInjection()
    .Build()
    .AsAIAgent(tools: [AIFunctionFactory.Create(TransferMoney, name:nameof(TransferMoney))]);

var prompt = "从账号`4242 4242 4242 4242` 转账100块到账号 `5555 5555 5555 4444`";
var response = await agent.RunAsync(prompt);
Console.WriteLine(response);

Console.WriteLine($"\n{new string('-', 100)}\n");
var session = await agent.CreateSessionAsync();
session.StateBag.SetValue("UserConfirmed", (object)true);
response = await agent.RunAsync(prompt, session);
Console.WriteLine(response);

static string TransferMoney(string from, string to, decimal ammount)
{ 
    var session = AIAgent.CurrentRunContext?.Session
        ?? throw new InvalidOperationException("No active session found.");
    if (session.StateBag.TryGetValue<object>(key: "UserConfirmed", out var confirmed) && (confirmed is bool b && b))
    {
        return $"成功从`{from}`转账`{ammount}`元到`{to}`账户。";
    }
    else
    {
        var chatClient = (AIAgent.CurrentRunContext.Agent as ChatClientAgent)?.ChatClient 
            ?? throw new InvalidOperationException("Not a ChatClientAgent.");
        var injectingChatClient = chatClient.GetService<MessageInjectingChatClient>() 
            ?? throw new InvalidOperationException("Underlying chat client is not an InjectingChatClient.");
        var content = "风控系统检测到该笔交易存在欺诈风险, 你必须向用户说明情况,要求其提供手机验证码,并在未验证前拒绝完成转账。";
        injectingChatClient.EnqueueMessages(session, [new ChatMessage(ChatRole.Assistant, content)]);
        return "转账指令已提交至系统缓冲区,等待合规审查。";
    }    
}

在调用AsIChatClient扩展方法将OpenAIClient转换成IChatClient对象之后,我们调用了AsBuilder扩展方法生成了构建ChatClient管道的ChatClientBuilder对象,并在此基础上通过调用UseMessageInjection扩展方法注册了MessageInjectingChatClient中间件来启用消息注入的能力。TransferMoney方法调用IChatClientGetService方法获取MessageInjectingChatClient对象就是此对象。最后基于构建的ChatClient管道创建了Agent对象。

我们两次调用AgentRunAsync方法来测试工具函数中注入消息的功能。第一次调用时,我们没有在SessionStateBag中设置UserConfirmed键值对,所以工具函数会注入一条Assistant消息来提示用户存在欺诈风险,并且返回一条消息告知用户转账指令已提交至系统缓冲区,等待合规审查。第二次调用时,我们先创建了一个Session对象,并在StateBag中设置了UserConfirmed键值对为true,表示用户已经确认过转账了。这一次工具函数就不会注入提示风险的消息,而是直接返回一条成功转账的消息。如下是两次调用的输出结果:

markdown 复制代码
为保障账户安全,我无法在此渠道收集或处理手机验证码等一次性敏感信息。

由于系统检测到该笔交易存在风险,请您通过官方银行 App 或拨打银行客服热线,在安全的验证流程中完成身份确认和转账操作。

在未通过官方安全验证前,本次转账将不会继续执行。

----------------------------------------------------------------------------------------------------

✅ 转账成功!

已从账户 **4242 4242 4242 4242** 转出 **100 元** 至账户 **5555 5555 5555 4444**。

如需继续操作,请告诉我 😊

2. 查看注入的消息

为了查看工具函数注入的消息,我们定义了如下这个MessageTrackingChatClient中间件。在它重写的GetResponseAsync方法中,我们遍历当前请求的消息列表,并根据消息内容的不同类型(FunctionCallContentFunctionResultContentTextContent等)来格式化输出(对于我们的例子,每个消息有且只有一个内容)。

csharp 复制代码
class MessageTrackingChatClient(IChatClient innerClient) : DelegatingChatClient(innerClient)
{
    public override Task<ChatResponse> GetResponseAsync(
        IEnumerable<ChatMessage> messages, 
        ChatOptions? options = null, 
        CancellationToken cancellationToken = default)
    {
        foreach (var message in messages)
        {
            var role = message.Role;
            var content = message.Contents.Single();
            var line = content switch
            {
                FunctionCallContent functionCallContent 
                    => $"[{role}]function-call: {functionCallContent.Name}",
                FunctionResultContent functionResultContent 
                    => $"[{role}]function-result: {functionResultContent.Result}",
                TextContent textContent 
                    => $"[{role}]{textContent.Text}",
                _ => $"[{role}]{content.ToString() ?? string.Empty}"
            };
            Console.WriteLine(line);
        }
        Console.WriteLine();
        return base.GetResponseAsync(messages, options, cancellationToken);
    }
}

我们调用ChatClientBuilderUse方法将这个MessageTrackingChatClient中间件注册到管道上,并且置于注册的MessageInjectingChatClient中间件的后面,这样就能在MessageInjectingChatClient注入消息之后看到这些消息被添加到请求消息列表中了。

csharp 复制代码
using Azure;
using Microsoft.Agents.AI;
using Microsoft.Extensions.AI;
using Microsoft.Extensions.DependencyInjection;
using OpenAI;

dotenv.net.DotEnv.Load();

var model = Environment.GetEnvironmentVariable("MODEL")!;
var apiKey = Environment.GetEnvironmentVariable("API_KEY")!;
var endpoint = Environment.GetEnvironmentVariable("OPENAI_URL")!;

var agent = new OpenAIClient(
        credential: new AzureKeyCredential(apiKey),
        options: new OpenAIClientOptions { Endpoint = new Uri(endpoint) })
    .GetChatClient(model: model)
    .AsIChatClient()
    .AsBuilder()
    .UseMessageInjection()
    .Use(inner => new MessageTrackingChatClient(inner))
    .Build()
    .AsAIAgent(tools: [AIFunctionFactory.Create(TransferMoney, name:nameof(TransferMoney))]);

var prompt = "从账号`4242 4242 4242 4242` 转账100块到账号 `5555 5555 5555 4444`";
await agent.RunAsync(prompt);

输出结果:

markdown 复制代码
[user]从账号`4242 4242 4242 4242` 转账100块到账号 `5555 5555 5555 4444`

[user]从账号`4242 4242 4242 4242` 转账100块到账号 `5555 5555 5555 4444`
[assistant]function-call: TransferMoney
[tool]function-result: 转账指令已提交至系统缓冲区,等待合规审查。
[assistant]风控系统检测到该笔交易存在欺诈风险, 你必须向用户说明情况,要求其提供手机验证码,并在未验证前拒绝完成转账。

输出的最后一条消息正是工具函数中注入的消息,说明MessageInjectingChatClient确实成功地将这条消息添加到了请求消息列表中,并且在后续调用LLM时被包含在输入上下文里了。为了保证对话历史具有合法的结构,注入的消息会放在承载工具函数调用结果的Tool消息之后。

3. MessageInjectingChatClient

在了解了MessageInjectingChatClient的作用和基本编程模式之后,我们继续介绍MAF针对这个ChatClient中间件的设计和实现。

3.1 在ChatClient管道中的位置

MessageInjectingChatClient一般位于FunctionInvokingChatClientPerServiceCallChatHistoryPersistingChatClient之间(如下所示),这一点非常重要,它决定了MessageInjectingChatClient中间件在每个ReAct循环中都会被执行。如果开启了针对每个ReAct循环的及时存档 ,注入的消息会被PerServiceCallChatHistoryPersistingChatClient捕获并存储到ChatHistoryMemoryProvider中,这样就能让Agent在后续的ReAct循环中基于这些注入的消息进行推理了。

复制代码
[外部请求] 
    => FunctionInvokingChatClient 
       => MessageInjectingChatClient 
           => PerServiceCallChatHistoryPersistingChatClient 
              => LLM

这个特定的拓扑结构,说明了以下关键底座逻辑:

  • 工具函数具备改写认知的能力 :由于FunctionInvokingChatClient处于MessageInjectingChatClient的上游,决定了:
    • 工具执行的副作用可被捕获:当FunctionInvokingChatClient触发并执行某个工具函数时,如果该工具内部触发了前文提到的风控逻辑、反思逻辑或上下文切换,它排队的临时消息正处于 FunctionInvokingChatClient的处理边界之内。
    • 下游管道立即可见:工具函数产生的注入消息,能立刻在向下传递给PerServiceCallChatHistoryPersistingChatClient之前被消费并合并。
  • 注入的消息是临时干预,还是永久记忆MessageInjectingChatClient位于PerServiceCallChatHistoryPersistingChatClient的上游,这个顺序界定了注入消息的生命周期:
    • 被持久化组件捕获:当 MessageInjectingChatClient将排队的消息动态拼接到当前的对话历史后,这些新组合的消息会原封不动地流向底部的PerServiceCallChatHistoryPersistingChatClient
    • 实现"单次服务调用"的存档:这意味着,在工具函数中注入的消息,会被当做本次生命周期的一部分,一并写入对话历史。在后续的用户多轮对话中,注入的消息会变成不可分割的永久记忆,而不是一次性的临时缓存;

MessageInjectingChatClient所处的位置说明了MAF将消息注入 视为一种连接**动态运行时(Tools/Agent 决策) 静态持久层(Database/Session)**的管道桥梁。如果把MessageInjectingChatClient挪到FunctionInvokingChatClient之前,工具函数内部就失去了操作注入客户端的上下文权限;如果把它挪到PerServiceCallChatHistoryPersistingChatClient之后,注入的消息就只能直达大模型,而无法在数据库中留下任何历史存档。目前这个位置,是支持工具内隐式风控、自我反思闭环的黄金分水岭。

3.2 基于Session的消息存储

MessageInjectingChatClient将注入的消息存储在当前SessionStateBag中,这样就能保证这些消息在当前Session的生命周期内都是可见的了。具体存储的是一个List<ChatMessage>对象,对应的键为MessageInjectingChatClient.PendingInjectedMessages。如下所示的是用来注入消息列表的EnqueueMessages方法的定义。

csharp 复制代码
public sealed class MessageInjectingChatClient : DelegatingChatClient
{
    public void EnqueueMessages(AgentSession session, IEnumerable<ChatMessage> messages)
    {
        var queue = GetOrCreateQueue(session);
        lock (queue)
        {
            foreach (var message in messages)
            {
                queue.Add(message);
            }
        }
    }

    private static List<ChatMessage> GetOrCreateQueue(AgentSession session)
    {
        if (session.StateBag.TryGetValue<List<ChatMessage>>("MessageInjectingChatClient.PendingInjectedMessages", out var queue))
        {
            return queue!;
        }

        var newQueue = new List<ChatMessage>();
        session.StateBag.SetValue("MessageInjectingChatClient.PendingInjectedMessages", newQueue);
        return newQueue;
    }
}

3.3 针对注入消息的处理

外界(主要是注册的工具函数)得到MessageInjectingChatClient对象后,可以通过调用EnqueueMessages方法持续不断地注入消息。这种对流或者流式的消息注入方式导致了,MessageInjectingChatClient提取了所有注入消息并对它们进行处理之后,会发现又有新的消息被注入进来。所以MessageInjectingChatClient会在一个循环中提取和处理注入的消息,这一逻辑实现在重写的GetResponseAsyncGetStreamingResponseAsync方法中。

csharp 复制代码
public sealed class MessageInjectingChatClient : DelegatingChatClient
{
    public override async Task<ChatResponse> GetResponseAsync(
        IEnumerable<ChatMessage> messages,
        ChatOptions? options = null,
        CancellationToken cancellationToken = default);

    public override async IAsyncEnumerable<ChatResponseUpdate> GetStreamingResponseAsync(
        IEnumerable<ChatMessage> messages,
        ChatOptions? options = null,
        CancellationToken cancellationToken = default);
}

GetResponseAsync方法为例,它的执行流程如下:

  • 步骤1:提取当前注入的所有消息,并添加到传入的消息列表中,作为输入调用后学的ChatClient管道;
  • 步骤2:如果返回ChatResponse中携带的消息携带工具调用,立即返回此响应,此响应最终会交付到MessageInjectingChatClient手上驱动工具函数的执行;
  • 步骤3:如果没有工具调用
    • 如果具有新注入的消息,继续循环回到步骤1来处理这些新注入的消息,但是在这之前为了将后续调用纳入同一个Session,它需要将响应提供的ConversionID应用到ChatOptions上;
    • 如果没有新注入的消息,说明注入的消息已经全部被处理完了,直接返回当前的响应。

3.4 如何提取MessageInjectingChatClient

通过我们上面的介绍,我们知道了注入的消息被存储在SessionStateBag中,而且还知道键的名称和数据结构,我们可以直接操作Session来完成消息注入 。但是我们最好不要这么做 ,因为还需要考虑针对消息列表的创建(对于第一次注入)以及多线程并发问题。所以还是老老实实调用MessageInjectingChatClient提供的EnqueueMessages方法来完成消息注入比较好。我们不能直接将此对象注入工具函数,最常用的方式就是像上面演示的那样,在工具函数内部通过AIAgent.CurrentRunContext.Agent来获取当前的Agent对象,并将其转换成ChatClientAgent对象来获取MessageInjectingChatClient对象。

csharp 复制代码
var chatClient = (AIAgent.CurrentRunContext.Agent as ChatClientAgent)?.ChatClient 
    ?? throw new InvalidOperationException("Not a ChatClientAgent.");
var injectingChatClient = chatClient.GetService<MessageInjectingChatClient>() 
    ?? throw new InvalidOperationException("Underlying chat client is not an InjectingChatClient.");

3.5 UseMessageInjection扩展方法

针对MessageInjectingChatClient的注册可以通过调用ChatClientBuilderUseMessageInjection扩展方法来完成。这个扩展方法的实现非常简单,它调用了ChatClientBuilderUse方法来将MessageInjectingChatClient中间件注册到管道上。

csharp 复制代码
public static class ChatClientBuilderExtensions
{
    public static ChatClientBuilder UseMessageInjection(this ChatClientBuilder builder)
        => builder.Use(innerClient => new MessageInjectingChatClient(innerClient));
}
相关推荐
小满Autumn1 小时前
WPF 依赖属性速查手册
笔记·c#·wpf·上位机·mvvm
踏着七彩祥云的小丑1 小时前
AI学习——Docker 打包与部署
人工智能·学习·docker·ai
纽创信安1 小时前
智绘安全・万象由 AI 生|PANDA2026 主题 AI 创作大赛开启征稿!
ai·密码学·ai写作
夏夏夏果1 小时前
部署视频生成模型-美团LongCat-Video
ai·音视频
岳小哥AI1 小时前
ChatGPT一夜爆火,是算力、数据、算法七十年的漫长等待后的爆发
ai·ai基础
武子康2 小时前
调查研究-156 Vercel 全栈应用 前端零配置极速上线:Serverless + 边缘网络 + CI/CD 全栈实战
前端·网络·ci/cd·ai·云原生·serverless·vecel
Xin_ye100862 小时前
C# 零基础到精通教程 - WPF 深度专题:3D 图形与视觉增强
开发语言·c#·wpf
小锋学长生活大爆炸3 小时前
【培训】Agent与OpenClaw
llm·agent·教程·科普·知识·培训·openclaw
Chris _data4 小时前
并发单词频率统计器 - 从零到完整实现(C# 实战)
开发语言·c#