AI学习-LangChain实战-多模态识别agent

智能体三核心,模型工具记忆

开发流程一般是定义模型;定义工具;添加记忆管理;然后定义智能体;测试

以下是黑马的菜品识别系统agent

复制代码
# 加载环境变量
from dotenv import load_dotenv
from langchain_core.messages import AIMessage

load_dotenv()

from langchain.chat_models import init_chat_model
import os

# 多模态模型
multimodal_model = init_chat_model(
    model="qwen3-omni-flash",  # 模型名称,这里选择qwen3.5-plus,这是一个多模态模型,支持图片、文本、音频、视频
    model_provider="openai"
)

from langchain_tavily import TavilySearch

# web搜索工具,使用tavily作为web搜索工具
web_search = TavilySearch(
    max_results=5,
    topic="general"
)

from langgraph.checkpoint.sqlite import SqliteSaver
import sqlite3

# 初始化checkpointer 记忆管理
checkpointer = SqliteSaver(sqlite3.connect("resources/personal_chief.db", check_same_thread=False))
# 自动建表
checkpointer.setup()

from langchain.agents import create_agent

system_prompt = """
你是一名私人厨师。收到用户提供的食材照片或清单后,请按以下流程操作:
1.识别和评估食材:若用户提供照片,首先辨识所有可见食材。基于食材的外观状态,评估其新鲜度与可用量,整理出一份"当前可用食材清单"。
2.智能食谱检索:优先调用 web_search 工具,以"可用食材清单"为核心关键词,查找可行菜谱。
3.多维度评估与排序:从营养价值和制作难度两个维度对检索到的候选食谱进行量化打分,并根据得分排序,制作简单且营养丰富的排名靠前。
4.结构化方案输出:把排序后的食谱整理为一份结构清晰的建议报告,要包含食谱信息、得分、推荐理由,帮助用户快速做出决策。

请严格按照流程,优先调用 web_search 工具搜索食谱,再搜索不到的情况下才能自己发挥。
"""

agent = create_agent(
    model=multimodal_model,
    tools=[web_search],
    system_prompt=system_prompt,
    checkpointer=checkpointer
)

from langchain.messages import HumanMessage

multimodal_message = HumanMessage(
    content=[
        {"type": "text", "text": "帮我看看这些食材能做些什么?"},
        # 正确格式:image_url,不是 image
        {
            "type": "image_url",
            "image_url": {
                "url": "https://img95.699pic.com/photo/60024/7565.jpg_wh860.jpg"
            }
        }
    ])

config = {"configurable": {"thread_id": "new_chat_124"}}
#注意这个tread_id,重复了就会导致用了别的记忆

response = agent.invoke({"messages": [multimodal_message]}, config)

# 友好打印
for message in response['messages']:
    message.pretty_print()

response = agent.invoke(
    {"messages": [HumanMessage(content="我喜欢第3道菜,可以说的更详细点吗?")]},
    config
)

# 友好打印
response['messages'][-1].pretty_print()

可见是有记忆的

用LangSmith进行部署,首先注册

LangSmith

复制这个apikey保存.env

相关推荐
Resistance丶未来1 小时前
管控用量,降本增效,MAI Gateway:助力企业搭建 Tokens 统一管理体系
人工智能·大模型·api·claude·ai安全·魔芋ai·maigateway
GIS数据转换器1 小时前
无人机车载巡检系统
大数据·数据库·人工智能·数据挖掘·数据分析·无人机
逸模8 小时前
告别熬夜手工整理台账,逸模智能归集实现项目数据自动化存档
大数据·运维·人工智能·笔记·其他·信息可视化·自动化
weixin_397574099 小时前
生产管理和设备管理:制造执行层的AI痛点
人工智能·制造
冬奇Lab9 小时前
Agent 系列(16):工具链设计——让 LLM 用对工具的五个原则
人工智能·llm·agent
xqqxqxxq9 小时前
哈希表(HashMap)技术学习笔记
笔记·学习·散列表
生而为虫9 小时前
[学习记录] 幼儿学习拼音html游戏
学习·游戏
冬奇Lab9 小时前
每日一个开源项目(第125篇):taste-skill - 给 AI 装上审美,让前端不再千篇一律
人工智能·开源·agent
AOwhisky9 小时前
MySQL 学习笔记(第四期):SQL 语言之多表查询
linux·运维·网络·数据库·笔记·学习·mysql
Ajie'Blog9 小时前
Copilot Agent Tasks API 开放:AI 编程开始进入后台任务时代
服务器·前端·javascript·人工智能·copilot·ai编程