AI大模型RAG与Agent开发学习

黑马程序员大模型RAG与Agent智能体项目实战教程,基于主流的LangChain技术从大模型提示词到实战项目

大模型开发核心: RAG、Agent ------ LangChain

  • 提示词优化(开发基础、基础到进阶、写精准提示词、提示词优化)

  • LangChain1.2核心技术学习(核心组件、工作原理、零基础都能懂)

  • RAG实战案例(项目案例、文档处理、向量数据库搭建、向量数据检索匹配)

  • Agent(需求拆解、Agent定义、工具调用、流程控制、实战开发)

1.前置准备

大模型的接入

本地部署:通过 Ollama 部署:Qwen、Deepseek

云端大模型:阿里云百炼平台:存在免费额度;可以使用 API key

代码调用 云端大模型

openai: python提供 访问云端模型的工具库

可以 使用 环境变量 记录值,自动读取变量从而获取值

在 阿里云百炼-模型广场找到模型调用代码,并使用自己申请的 API KEY进行代码调用 云端大模型。后续可以把API KEY 使用环境变量保护起来

运行阿里云提供的调用代码即可

python 复制代码
from openai import OpenAI
import os

client = OpenAI(
    # 如果没有配置环境变量,请用阿里云百炼API Key替换:api_key="sk-xxx"
    api_key="xxx",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "你能解决什么问题?"}]
completion = client.chat.completions.create(
    model="qwen3.5-plus",  # 您可以按需更换为其它深度思考模型
    messages=messages,
    extra_body={"enable_thinking": True},
    stream=True
)
is_answering = False  # 是否进入回复阶段
print("\n" + "=" * 20 + "思考过程" + "=" * 20)
for chunk in completion:
    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "完整回复" + "=" * 20)
            is_answering = True
        print(delta.content, end="", flush=True)

Ollama

一款简化大型语言模型本地部署和运行过程的开源软件(本地版)

支持多种开源模型,涵盖文本生成、代码生成、多模态推理

win部署ollama

官网安装ollama,如下:

选择模型,会自动下载模型 并进行回答

代码调用ollama本地模型

修改代码:

代码如下:

python 复制代码
from openai import OpenAI
import os

client = OpenAI(
    # 如果没有配置环境变量,请用阿里云百炼API Key替换:api_key="sk-xxx"
    # base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    base_url="http://localhost:11434/v1",
)

messages = [{"role": "user", "content": "你能解决什么问题?"}]
completion = client.chat.completions.create(
    # model="qwen3.5-plus",  # 您可以按需更换为其它深度思考模型
    model="gamma3:4b",
    messages=messages,
    extra_body={"enable_thinking": True},
    stream=True
)
is_answering = False  # 是否进入回复阶段
print("\n" + "=" * 20 + "思考过程" + "=" * 20)
for chunk in completion:
    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "完整回复" + "=" * 20)
            is_answering = True
        print(delta.content, end="", flush=True)
相关推荐
纤纡.7 小时前
基于 PyTorch 手动实现 CBOW 词向量训练详解
人工智能·pytorch·python·深度学习
大学有意思7 小时前
2026深度解析广西英华国际职业学院新能源汽车技术专业
人工智能·机器人
踩着两条虫7 小时前
AI驱动的Vue3应用开发平台深入探究(十八):扩展与定制之集成第三方库
vue.js·人工智能·低代码·重构·架构
恋猫de小郭7 小时前
Claude Code 源码里有意思设定:伪造、投毒、卧底、封号
前端·人工智能·ai编程
kailp7 小时前
无需本地显卡!跑GPT-SoVITS-V2Pro完整教程
人工智能·gpt·ai·大模型·云计算
饼干哥哥7 小时前
n8n已死!我用Kimi跑通了Claude Skills,直接替代工作流
人工智能
爱写代码的汤二狗7 小时前
第4章 载体选择:网站、小程序还是App?
人工智能·驱动开发·创业创新
墨^O^7 小时前
进程与线程的核心区别及 Linux 启动全过程解析
linux·c++·笔记·学习
寒秋花开曾相惜7 小时前
(学习笔记)3.9 异质的数据结构(3.9.1 结构)
c语言·网络·数据结构·数据库·笔记·学习
纤纡.7 小时前
从单图风格迁移到实时视频四宫格滤镜:OpenCV DNN 实战全解析
人工智能·opencv·dnn