.NET 实战 LlamaSharp:本地运行开源大模型

一、什么是 LlamaSharp

LlamaSharp 是 llama.cpp 的 .NET 官方绑定库 ,让你在 纯本地、无外网、无 API 费用 的情况下运行 Llama 3、Qwen、Mistral、Gemma、Phi 等大模型。

特点:

  • 纯 CPU / GPU 均可运行
  • 支持 GGUF 量化模型(4-bit/8-bit)
  • 支持流式输出
  • 支持多轮对话上下文
  • 跨平台:Windows / Linux / macOS
  • .NET 6/7/8 全支持

二、环境搭建(一步到位)

1. 创建项目

bash 复制代码
dotnet new console -n LlamaSharpDemo
cd LlamaSharpDemo

2. 安装 NuGet 包(直接复制)

bash 复制代码
dotnet add package LlamaSharp

如需 NVIDIA CUDA 加速

bash 复制代码
dotnet add package LlamaSharp.Runtime.Cuda

3. 下载模型(GGUF 格式)

推荐下载站点:

https://huggingface.co/models?search=gguf

新手推荐模型:

  • Llama 3 8B Instruct q4_k_m.gguf
  • Qwen 7B Instruct q4_k_m.gguf

下载后:

  1. 在项目根目录新建 Models 文件夹
  2. .gguf 模型放入其中
  3. 文件属性 → 复制到输出目录:如果较新则复制

三、基础示例:一次性生成文本(可直接复制)

csharp 复制代码
using LlamaSharp;

// 模型路径(自行修改为你的模型名称)
var modelPath = @"Models\llama-3-8b-instruct-q4_k_m.gguf";

// 模型配置
var parameters = new ModelParams(modelPath)
{
    ContextSize = 2048,
    GpuLayerCount = 0 // 使用CPU设0,NVIDIA可设20/50
};

// 加载模型
using var model = LlamaModel.LoadFromParams(parameters);
using var engine = new InferenceEngine(model);

// 提示词
var prompt = "请用C#写一个单例模式,线程安全";

// 生成
var result = engine.Generate(prompt, new GenerateParams
{
    MaxTokens = 1024,
    Temperature = 0.3f
});

// 输出
Console.WriteLine("=== AI 回答 ===");
Console.WriteLine(result);

四、高级示例:流式输出(逐字打印)

csharp 复制代码
using LlamaSharp;

var modelPath = @"Models\llama-3-8b-instruct-q4_k_m.gguf";

var parameters = new ModelParams(modelPath)
{
    ContextSize = 2048,
    GpuLayerCount = 0
};

using var model = LlamaModel.LoadFromParams(parameters);
using var engine = new InferenceEngine(model);

Console.WriteLine("请输入问题:");
var userInput = Console.ReadLine();

Console.WriteLine("\n=== AI 正在回复 ===");

await foreach (var token in engine.GenerateStreamingAsync(userInput, new GenerateParams
{
    MaxTokens = 2048,
    Temperature = 0.5f
}))
{
    Console.Write(token);
}

Console.WriteLine("\n=== 完成 ===");

五、企业级示例:多轮对话机器人(带上下文记忆)

这是生产可用版本,支持:

  • 系统提示词
  • 上下文记忆
  • 流式输出
  • 无限聊天(自动管理上下文)
csharp 复制代码
using LlamaSharp;

// 模型路径
var modelPath = @"Models\llama-3-8b-instruct-q4_k_m.gguf";

var parameters = new ModelParams(modelPath)
{
    ContextSize = 4096,
    GpuLayerCount = 0
};

using var model = LlamaModel.LoadFromParams(parameters);
using var engine = new InferenceEngine(model);

// 初始化对话历史
var chat = new ChatHistory();

// 系统提示词(定义AI性格)
chat.AddMessage(ChatRole.System, """
你是一个专业的.NET编程助手,回答简洁、专业、带代码示例,不啰嗦。
""");

Console.WriteLine("=== .NET 本地AI聊天机器人(输入 exit 退出)===");

while (true)
{
    Console.Write("\n你:");
    var input = Console.ReadLine();

    if (input?.ToLower() == "exit") break;
    if (string.IsNullOrWhiteSpace(input)) continue;

    // 添加用户消息
    chat.AddMessage(ChatRole.User, input);

    // AI 回复
    Console.Write("AI:");
    var reply = "";

    await foreach (var token in engine.GenerateChatStreamingAsync(chat, new GenerateParams
    {
        MaxTokens = 2048,
        Temperature = 0.4f
    }))
    {
        reply += token;
        Console.Write(token);
    }

    // 保存AI回复到上下文
    chat.AddMessage(ChatRole.Assistant, reply);
    Console.WriteLine();
}

六、关键参数说明(必看)

参数 说明
ContextSize 上下文窗口,越大记忆越强
GpuLayerCount GPU 加速层数,CPU 设 0
MaxTokens 最大生成长度
Temperature 0=最确定,1=最随机
ChatHistory 对话上下文,实现多轮聊天

七、运行方法

  1. 复制代码
  2. 替换模型路径
  3. 运行
bash 复制代码
dotnet run

八、支持模型列表

LlamaSharp 支持所有 GGUF 格式 模型:

  • Llama 2 / Llama 3
  • Qwen(通义千问)
  • Mistral
  • Gemma
  • Phi 2 / 3
  • Baichuan
  • ChatGLM

相关推荐
bugcome_com15 小时前
阿里云OSS工具类完整设计与实现:基于.NET的静态单例模式实践
阿里云·单例模式·.net·oss
步步为营DotNet15 小时前
深度剖析.NET 11:Microsoft.Extensions.AI 在智能后端决策系统的创新应用 前言
人工智能·microsoft·.net
无风听海1 天前
ASP.NET Core .NET 10 错误响应体系全景:从 BadRequest 到编译器基础设施
后端·asp.net·.net
AI行业学习2 天前
.NET Framework 3.5 SP1 完整离线包【2026.5.31】
.net
学以智用3 天前
.NET Core 完整特性速查表(终极版)
后端·.net
cdbqss13 天前
VB2026 动态生成工具栏类 BqGetToolStrip
数据库·oracle·开源·.net·学习方法·教育电商·basic
宝桥南山3 天前
Microsoft Agent Framework(MAF) - 如何将workflow或者A2A client转换成一个AI Agent
microsoft·ai·微软·aigc·.net·.netcore
三天不学习4 天前
YOLO + .NET 10 快速入门:从零搭建实时目标检测应用
yolo·目标检测·.net
0x00074 天前
译 Anders Hejlsberg 谈 C# 与 .NET
开发语言·c#·.net
AI行业学习4 天前
.NET Framework 3.5 SP1 完整离线包(2029.5.29)
开发语言·windows·.net