技术速递|通过 .NET Aspire 使用本地 AI 模型

作者:Aaron Powell

排版:Alan Wang

使用本地 AI 模型是无需将资源部署到云中即可在自己的机器上进行实验的好方法。在本文中,我们将探讨如何使用 .NET Aspire 与 Ollama 来本地运行 AI 模型,同时利用 Microsoft.Extensions.AI 抽象在部署时无缝过渡到云托管模型。

在 .NET Aspire 中设置 Ollama

我们需要一种方法在 .NET Aspire 应用程序中使用 Ollama,最简单的方法是使用 .NET Aspire 社区工具包中的 Ollama 托管集成。您可以通过 Visual Studio 工具、VS Code 工具或 .NET CLI 从 NuGet 安装 Ollama 托管集成。接下来,我们来看一下如何通过命令行将 Ollama 托管集成安装到我们的应用程序主机项目中:

csharp 复制代码
dotnet add package CommunityToolkit.Aspire.Hosting.Ollama

安装 Ollama 托管集成后,您可以在 Program.cs 文件中进行配置。以下是配置 Ollama 托管集成的示例:

csharp 复制代码
var ollama =
        builder.AddOllama("ollama")
               .WithDataVolume()
               .WithOpenWebUI();

这里,我们使用了 AddOllama 扩展方法将容器添加到应用程序主机中。由于我们需要下载一些模型,因此我们希望在容器重启时持久化这些模型(这意味着我们每次启动容器时不必重新下载好几 GB 的数据!)。此外,为了提供一个测试环境,我们还添加了 OpenWebUI 容器,它将为我们提供一个用于在应用程序之外与模型交互的网页界面。

运行本地模型

我们在上一步中创建的 Ollama 资源仅运行了 Ollama 服务器,接下来我们还需要向其添加一些模型,可以通过 AddModel 方法完成。让我们使用 Llama 3.2 模型

csharp 复制代码
var chat = ollama.AddModel("chat", "llama3.2");

如果我们想使用模型的某个变体或特定标签,可以在 AddModel 方法中指定,例如 ollama.AddModel("chat", "llama3.2:1b") 用于 Llama 3.2 模型的 1b 标签。或者,如果您需要的模型不在 Ollama 库中,可以使用 AddHuggingFaceModel 方法从 Hugging Face 模型库中添加模型。

现在我们已经有了模型,可以将其作为资源添加到应用程序主机中的其他服务中:

csharp 复制代码
builder.AddProject<Projects.MyApi>("api")
       .WithReference(chat);

当我们运行应用程序主机项目时,Ollama 服务器将启动并下载我们指定的模型(确保在下载完成之前不要停止应用程序主机),然后我们就可以在应用程序中使用该模型。如果您希望依赖该模型的资源等到模型下载完成后再使用,可以使用 WaitFor 方法与模型引用一起使用:

csharp 复制代码
builder.AddProject<Projects.MyApi>("api")
       .WithReference(chat)
       .WaitFor(chat);

在上面的仪表板截图中,我们可以看到模型正在下载。Ollama 服务器正在运行,但处于不健康状态,因为模型尚未下载完成,并且 API 资源尚未启动,因为它正在等待模型下载从而恢复健康状态。

在您的应用程序中使用模型

通过将我们的 API 项目设置来使用聊天模型,我们现在可以使用 OllamaSharp 库连接到 Ollama 服务器并与模型进行交互。为此,我们将使用 .NET Aspire 社区工具包中的 OllamaSharp 集成

csharp 复制代码
dotnet add package CommunityToolkit.Aspire.OllamaSharp

该集成允许我们将 OllamaSharp 客户端注册为 Microsoft.Extensions.AI 包中的 IChatClientIEmbeddingsGenerator 服务。这种抽象机制意味着我们可以将本地 Ollama 服务器切换为云托管选项(例如 Azure OpenAI 服务),而无需更改使用该客户端的代码:

csharp 复制代码
builder.AddOllamaSharpChatClient("chat");

注意:如果您使用的是嵌入模型并想要注册 IEmbeddingsGenerator 服务,可以使用 AddOllamaSharpEmbeddingsGenerator 方法。

为了充分利用 Microsoft.Extensions.AI 管道,我们可以将该服务提供给 ChatClientBuilder

csharp 复制代码
builder.AddKeyedOllamaSharpChatClient("chat");
builder.Services.AddChatClient(b => b
    .UseFunctionInvocation()
    .UseOpenTelemetry(configure: t => t.EnableSensitiveData = true)
    .UseLogging()
    // Use the OllamaSharp client
    .Use(b.Services.GetRequiredKeyedService<IChatClient>("chat")));

最后,我们可以将 IChatClient 注入到路由处理程序中:

csharp 复制代码
app.MapPost("/chat", async (IChatClient chatClient, string question) =>
{
    var response = await chatClient.CompleteAsync(question);
    return response.Message;
});

云托管模型支持

虽然 Ollama 是一个很好的本地开发工具,但在部署应用程序时,您可能更倾向于使用云端 AI 服务,例如 Azure OpenAI 服务。为此,我们需要更新 API 项目,以便在云端运行时注册 IChatClient 服务的不同实现:

csharp 复制代码
if (builder.Environment.IsDevelopment())
{
    builder.AddKeyedOllamaSharpChatClient("chat");
}
else
{
    builder.AddKeyedAzureOpenAIClient("chat");
}
builder.Services.AddChatClient(b => b
    .UseFunctionInvocation()
    .UseOpenTelemetry(configure: t => t.EnableSensitiveData = true)
    .UseLogging()
    // Use the previously registered IChatClient, which is either Ollama or Azure OpenAI
    .Use(b.Services.GetRequiredKeyedService<IChatClient>("chat")));

结论

在本文中,我们展示了如何仅通过几行代码使用 .NET Aspire 设置 Ollama 服务器,指定所需使用的模型,让其自动下载并集成到客户端应用程序中。同时,我们还介绍了如何利用 Microsoft.Extensions.AI 的抽象功能,轻松地在本地模型和云托管模型之间切换。这是一种强大的方式,可以在将 AI 模型部署到云端之前,先在本地机器上进行实验。

查看 eShop 示例应用程序,了解如何将 Ollama 与 .NET Aspire 结合使用的完整示例。

相关推荐
xixixi777771 小时前
基于零信任架构的通信
大数据·人工智能·架构·零信任·通信·个人隐私
玄同7651 小时前
LangChain v1.0+ Prompt 模板完全指南:构建精准可控的大模型交互
人工智能·语言模型·自然语言处理·langchain·nlp·交互·知识图谱
Ryan老房1 小时前
开源vs商业-数据标注工具的选择困境
人工智能·yolo·目标检测·计算机视觉·ai
取个鸣字真的难1 小时前
Obsidian + CC:用AI 打造知识管理系统
人工智能·产品运营
困死,根本不会1 小时前
OpenCV摄像头实时处理:基于 HSV 颜色空间的摄像头实时颜色筛选工具
人工智能·opencv·计算机视觉
Shirley~~1 小时前
Vue-skills的中文文档
前端·人工智能
华大哥2 小时前
AI大模型基于LangChain 进行RAG与Agent智能体开发
人工智能·langchain
Sagittarius_A*2 小时前
角点检测:Harris 与 Shi-Tomasi原理拆解【计算机视觉】
图像处理·人工智能·python·opencv·计算机视觉
困死,根本不会2 小时前
OpenCV实时摄像头处理:曝光调节、降噪与二值化实战
人工智能·opencv·计算机视觉
LitchiCheng2 小时前
Mujoco 开源机械臂 RL 强化学习避障、绕障
人工智能·python·开源