【AI赋能测试笔记】3中间件

一、什么是中间件



比如

和智能体(大模型)交互的消息类型:

  • human message:人发送的信息
  • AI message:大模型返回的信息
  • Tool message:工具执行的结果
  • system message:系统消息(身份约定、上下文信息...)

langgraph API 自带记忆存储功能

前端界面参考样本

https://github.com/langchain-ai/agent-chat-ui

二、PDF解析器

前端加一个上传文件和图片的功能

下载https://github.com/langchain-ai/agent-chat-ui放到@src-example中

python 复制代码
# 我要在当前项目@src中的对话界面添加一个上传文件和图片的功能,请你参考代码@src-example中的文件上传功能,实现的效果及发送给后端的数据格式完全一致
# 如果没有参考样本项目
# 截取后端输出信息复制给AI,"后端获取到的数据是这样,我期望你把上传的附件转成base64编码放到additional_kwargs中发送到后端去"
python 复制代码
在这里插入代码片

前端会把PDF转成base64编码再上传到服务器,这样服务器会收到庞大而没有价值的信息->现在后端还是deepseek-chat模型(文本大模型),它不支持多模态输入

所以后端提取用户上传的base64位数据转成PDF,对PDF进行解析(内容包含:文本、图片、思维导图、流程图),提取到完整信息

后端

(1)https://docs.langchain.com/oss/python/integrations/document_loaders/pymupdf4llm

python 复制代码
# 帮我基于这段代码,开发一个pdf文档处理器,要求如下:
    # 1、核心代码:
    # from langchain_community.document_loaders.parsers import LLMImageBlobParser
    # from langchain_openai import ChatOpenAI
    # loader = PyMuPDF4LLMLoader( "./example_data/layout-parser-paper.pdf",
        # mode="page",
        # extract_images=True,
        # images_parser=LLMImageBlobParser(
        # model=ChatOpenAl( model="gpt-4. 1-mini", max_tokens=1024),)
    # docs=loader.load()
    # 2、我会传入一份base64位的pdf数据,借助该解析器最终返回pdf的完整内容
    # 脚本文件存放到这个目录:pdf_processor

(2)用豆包接入图片多模态https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-1-6-vision

创建一个API key,开通管理(全开通),视觉模型deepseed1.6复制完整的ID号,API接入

(3)会话中包含在线链接

三、如何将pdf解析器与智能体发生联系?智能体中间件:技能中间件

基于装饰器的中间件

基于类的中间件(装饰器的封装成一个类)

https://docs.langchain.com/oss/python/langchain/middleware/custom#class-based-middleware

前端加一个"是否开启PDF多模态"滑动开关

前端发的消息通过中间件截取到PDF base64位数据,调用pdf解析器,将解析后的pdf内容传给agent(,拿到信息之后大模型才能根据信息判断调用什么工具)

后端

python 复制代码
# 帮我开发一个中间件,实现的代码请参考https://docs.langchain.com/oss/python/langchain/middleware/custom
    # 具体实现功能如下:
    # 1、截取前端发的消息中的PDF base64位数据(去看下前端发的base64位什么样子),message格式如下:(粘贴)
    # 2、数据中的base64位的PDF数据发送给pdf解析器@pdf_processor/processor.py:PDFProcessor,解析器返回解析后的完整pdf信息,追加到system message
相关推荐
Cosolar2 分钟前
LlamaIndex 索引类型进阶:构建高性能 RAG 系统的核心能力
人工智能·开源·全栈
人工智能AI技术11 分钟前
【VibeCoding系列教程11】 AI智能体平台
人工智能
wing9811 分钟前
我的AI编程体验:从白嫖到付费,我为什么最终留下了Codex
前端·人工智能·程序员
YOLO数据集集合14 分钟前
智慧林业无人机巡检 松材线虫病害树木实例分割数据集 | 森林枯木识别 深度学习视觉
人工智能·深度学习·目标检测·计算机视觉·无人机
听你说3222 分钟前
深耕具身智能,亿达科创智能四足仿生机器人亮相沈阳机器人大会
人工智能·机器人
前端的阶梯23 分钟前
Cursor 开发 Python 项目完全指南
前端·人工智能·后端
Linlingu23 分钟前
OpenClaw接入阿里云百炼模型配置教程(完整可落地)
人工智能·阿里云·云计算·办公自动化·数字员工·小龙虾
CTA量化套保24 分钟前
Jupyter Notebook 反复运行天勤策略内存涨:close 与内核习惯
ide·人工智能·python·jupyter
不懂的浪漫33 分钟前
AI 时代还需要买课吗?我用 Skills + Markdown + HTML 搭了一套自学系统
前端·人工智能·html·skill
愚公搬代码35 分钟前
【愚公系列】《移动端AI应用开发》017-Android端应用开发(网络通信与API集成)
android·人工智能