11-AI基础概念入门

本篇是整套 AI 学习内容的起点。很多 .NET 开发者第一次接触人工智能时，最困扰的不是代码，而是名词：AI、机器学习、深度学习、NLP、大语言模型听起来都有关，却又不容易放到同一张知识地图里。本文会把这些概念串起来，并结合 .NET 场景解释它们分别适合解决什么问题。

如果你正在考虑把 AI 接进 Web API、企业后台、客服系统或者内容处理工具，这一篇特别适合作为热身。读完之后，你应该能够分清核心术语之间的关系，理解 AI 在工程里常见的落地方式，也能判断什么时候该选云端模型，什么时候更适合用本地模型或传统机器学习。

一、先把 AI 相关名词放到一张地图里

1.1 AI 到底在解决什么问题

很多人会把 AI 简单理解成"让机器像人一样思考"。这个说法方便记忆，但对开发者来说还不够落地。更实用的理解方式是：当一个问题很难靠固定规则完整描述，而人类却能凭经验大致判断时，AI 就有机会发挥作用。它擅长处理识别、分类、预测、生成和归纳这类问题。

例如，验证手机号格式、判断日期是否合法，这类任务非常适合用普通代码完成；但如果你要判断一条评论是不是在投诉、这封邮件是不是带有风险、这张图片里是不是猫，纯手写规则就会迅速变得庞杂。AI 的价值就在这里，它不是替代所有代码，而是接手那些"难以穷举规则、却又存在可学习模式"的任务。

从工程角度看，今天绝大多数项目接触到的都还是弱人工智能，也就是只能在特定领域完成特定任务的系统。聊天问答、翻译、推荐、识图都属于这一类。至于像人一样能跨领域迁移能力的通用人工智能，仍然是长期目标，而不是一般业务项目的常规选项。

1.2 机器学习、深度学习和大语言模型之间是什么关系

初学者最容易把 AI、机器学习、深度学习和大语言模型看成并列概念。实际上，它们更像包含关系。AI 是总目标，机器学习是实现 AI 的主要方法之一；深度学习是机器学习中的一种重要技术路线；大语言模型则是深度学习在自然语言处理方向上的代表性成果。

你可以把这条关系理解成一条逐步收窄的路径：先有"人工智能"这个大目标，然后出现"从数据中学习规律"的机器学习，再发展出依赖多层神经网络的深度学习，最终在文本任务上形成了今天大家熟悉的大语言模型。理解这种层次关系后，你再去看后续章节里的 OpenAI API、Semantic Kernel、ML.NET，就会更容易明白它们分别站在什么位置上。

二、机器为什么能"学会"规律

2.1 监督学习、无监督学习和强化学习各自适合什么问题

当我们说"模型在学习"时，本质上是在说模型通过样本不断调整内部参数，让输出更接近预期。不同学习范式的差别，不在于有没有数据，而在于数据有没有标签、反馈来自哪里，以及优化目标如何设定。

监督学习最容易理解，因为它像做有标准答案的练习题。你给模型一批已经标好结果的数据，让它学习输入和输出的对应关系。垃圾邮件识别、销量预测、评论正负面判断都属于这一类。无监督学习则没有标准答案，它更像让系统在数据中自己寻找结构，例如把相似客户聚到一起、发现异常交易、识别商品分群。强化学习又是另一种思路，它依赖持续反馈，模型通过"动作---结果---奖励"的循环不断修正策略，因此在游戏、路径规划和机器人控制领域更常见。

在企业项目里，最常见的通常还是监督学习，因为很多业务天然带标签，例如"是否流失""是否逾期""是否满意"。而大语言模型在使用阶段往往不要求你自己训练，它更像一个已经学会语言模式的通用能力模块，你需要做的是正确设计输入、上下文和边界。

2.2 神经网络为什么适合复杂任务

当输入数据变得复杂时，传统规则和简单特征工程会越来越吃力。图像里有空间结构，语音里有时间顺序，文本里有上下文语义，这些信息都不容易靠人工完整编码。神经网络的价值，就在于它能通过多层结构自动学习特征，从原始数据中逐步提取更高层的表示。

"深度学习"里的"深度"，并不是指模型真的更懂人类，而是指网络层数更多、表达能力更强。前面的层可能先识别局部模式，后面的层再把这些模式组合成更抽象的概念。也正因为如此，深度学习通常需要更多数据和算力，所以在业务开发中，我们更常见的做法是使用已经训练好的模型，而不是从零开始自己训练一个大模型。

三、自然语言处理与大语言模型到底强在哪里

3.1 NLP 正在把文本变成可计算对象

自然语言处理，也就是 NLP，可以理解成"让程序处理人类语言"的整套技术。它覆盖的范围远不止聊天，还包括文本分类、摘要生成、实体提取、翻译、问答、纠错和意图识别。只要输入或输出和语言有关，通常都可以归到 NLP 的范畴里。

传统 NLP 很多时候需要分词、手工做特征、再把特征送进分类器。这样的方案在结构稳定的场景中仍然有效，但面对复杂语境时很容易失灵。大语言模型的突破在于，它把"理解文本"和"生成文本"统一到了一个模型里，因此同一个模型既能回答问题，也能总结文档、抽取字段、改写文案，甚至根据自然语言生成代码或 SQL。

3.2 大语言模型为什么强大，也为什么会出错

大语言模型之所以表现惊艳，核心原因是它在海量语料上学习到了通用语言模式，所以具备很强的迁移能力。你不必为每个小任务单独训练模型，而是可以通过合适的提示词、示例和上下文，让它快速适应新任务。这极大降低了 AI 应用的试错成本，也让 .NET 开发者第一次可以像调用普通服务一样使用"语言能力"。

但它的局限也必须同时理解。第一，它可能产生幻觉，也就是输出看似合理却不真实的内容。第二，它的知识通常受训练时间限制，不等于实时事实。第三，它非常依赖上下文表达方式，同一个问题换一种写法，回答质量可能明显不同。因此，在企业项目里，LLM 更适合作为高能力组件，而不是完全不受约束的最终裁决者。

四、在 .NET 中落地 AI 的三条典型路径

4.1 直接调用云端模型 API

当你的目标是快速获得问答、改写、摘要、分类这类能力时，最直接的做法通常是调用云端模型 API。这种方式门槛低、试错快，很适合做原型、内部工具和第一版验证。

csharp 复制代码

using OpenAI.Chat;

var apiKey = Environment.GetEnvironmentVariable("OPENAI_API_KEY")
    ?? throw new InvalidOperationException("请先配置 OPENAI_API_KEY。");

var client = new ChatClient(model: "gpt-4o-mini", apiKey: apiKey);

var messages = new List<ChatMessage>
{
    new SystemChatMessage("你是一名面向 .NET 初学者的助教，请用中文解释概念。"),
    new UserChatMessage("请用一段话解释什么是机器学习。")
};

ChatCompletion completion = await client.CompleteChatAsync(messages);
Console.WriteLine(completion.Content[0].Text);

这段代码展示了最直接的调用流程。ChatClient 是模型客户端，负责和远程服务通信；消息列表里同时放入了 SystemChatMessage 和 UserChatMessage，前者用于规定身份和口吻，后者才是真正的问题输入。CompleteChatAsync 返回 ChatCompletion 结果，而 completion.Content[0].Text 则是最终文本输出。这个流程简单透明，非常适合作为入门第一步。

4.2 用 Semantic Kernel 组织模型与业务逻辑

当项目不再只是"问一句、回一句"，而是开始涉及提示模板、上下文、插件调用和流程编排时，直接写 SDK 调用代码会越来越分散。Semantic Kernel 的价值就在于，它帮助你把这些 AI 能力用更统一的方式组织起来。

csharp 复制代码

using Microsoft.SemanticKernel;

var apiKey = Environment.GetEnvironmentVariable("OPENAI_API_KEY")
    ?? throw new InvalidOperationException("请先配置 OPENAI_API_KEY。");

var kernel = Kernel.CreateBuilder()
    .AddOpenAIChatCompletion(modelId: "gpt-4o-mini", apiKey: apiKey)
    .Build();

var result = await kernel.InvokePromptAsync("请用三句话解释大语言模型和传统规则引擎的区别。");
Console.WriteLine(result);

这里的 Kernel 可以理解成 AI 应用的运行内核。你先通过 CreateBuilder 注册模型服务，再通过 Build 得到可执行的内核对象。InvokePromptAsync 是最轻量的入口，它让你可以像调用模板引擎一样发送提示词。随着需求增长，你还可以在同一个内核里继续加入插件、聊天历史和执行设置。

4.3 用 ML.NET 处理本地预测任务

并不是所有 AI 功能都必须依赖大语言模型。对于结构明确、输出固定、强调低成本和离线运行的任务，例如二分类、回归、推荐和异常检测，ML.NET 依然非常实用。

csharp 复制代码

using Microsoft.ML;
using Microsoft.ML.Data;

public sealed class SentimentSample
{
    public string Text { get; set; } = string.Empty;
    public bool Label { get; set; }
}

public sealed class SentimentPrediction
{
    [ColumnName("PredictedLabel")]
    public bool IsPositive { get; set; }

    public float Probability { get; set; }
}

var mlContext = new MLContext(seed: 1);

var samples = new List<SentimentSample>
{
    new() { Text = "客服响应很及时，体验不错", Label = true },
    new() { Text = "页面经常报错，使用起来很糟糕", Label = false },
    new() { Text = "文档写得很清楚", Label = true },
    new() { Text = "功能太少，而且有明显 Bug", Label = false }
};

var trainingData = mlContext.Data.LoadFromEnumerable(samples);

var pipeline = mlContext.Transforms.Text.FeaturizeText(
        outputColumnName: "Features",
        inputColumnName: nameof(SentimentSample.Text))
    .Append(mlContext.BinaryClassification.Trainers.SdcaLogisticRegression(
        labelColumnName: nameof(SentimentSample.Label),
        featureColumnName: "Features"));

var model = pipeline.Fit(trainingData);
var engine = mlContext.Model.CreatePredictionEngine<SentimentSample, SentimentPrediction>(model);

var prediction = engine.Predict(new SentimentSample { Text = "这个版本性能提升很明显" });
Console.WriteLine($"预测结果：{(prediction.IsPositive ? "正面" : "负面")}");
Console.WriteLine($"置信度：{prediction.Probability:P1}");

这段示例体现了 ML.NET 的典型流程。MLContext 是运行入口，负责数据加载、训练和预测；FeaturizeText 会把文本转换成数值特征；SdcaLogisticRegression 则训练一个二分类模型。训练完成后，通过 PredictionEngine 就能对新输入进行本地预测。和大语言模型相比，这种方案能力更窄，但输出更稳定、成本更低，也更适合规则明确的分析任务。

五、学习 AI 时应该如何建立正确路径

5.1 初学者更该先学概念还是先写代码

对 .NET 开发者来说，最稳妥的学习顺序通常不是一上来就追热点，而是先建立概念，再打通调用，最后再谈架构。概念层帮助你区分 AI、机器学习、LLM、Prompt、Embedding 等术语；调用层让你能在控制台程序、Web API 或后台任务里稳定接入模型；架构层才负责把模型和缓存、日志、鉴权、知识库、插件、监控真正整合起来。

这样学习的好处是，你不会把所有问题都归因于"模型不够强"。很多时候效果差并不是因为模型本身，而是因为提示词写得含糊、上下文组织混乱、业务边界没定义清楚，或者根本选错了解法。如果只是做固定标签分类，本地 ML.NET 可能比 LLM 更稳；如果是开放式问答和生成，大语言模型则更自然。

5.2 哪些业务最值得优先尝试 AI

真正值得优先尝试 AI 的场景，通常同时满足两个特点：人工处理成本高，以及业务允许一定概率性的输出波动。比如客服辅助回复、评论分析、工单归类、文档摘要、知识问答和内容改写，都很适合作为试点。反过来说，如果一个任务要求绝对精确、规则稳定、可解释性极强，那么优先考虑普通代码和规则引擎往往更稳。

学习 AI 的目的，不是把所有系统都改成"智能版"，而是在合适的地方让程序获得原本不容易编码的能力。只要建立了这种判断力，后面无论学习 OpenAI API、Semantic Kernel 还是 RAG，都会更容易进入状态。

练习题：

请结合你熟悉的一个业务系统，找出两个更适合用 AI 处理而不是手写规则的场景，并说明原因。

试着用自己的话说明 AI、机器学习、深度学习和大语言模型之间的包含关系。

如果你要做一个"用户评论正负面判断"功能，分别说说它用 ML.NET 和大语言模型实现时各自的优缺点。