企微一键报销AI Agent详细介绍(含源码)

一、概述

AI 发票智能识别 Agent 是一个基于 MaxKB 平台的智能体,专门用于处理多类型发票文件的智能识别、分类整理和格式转换。该智能体能够处理 PNG、JPG、JPEG、PDF 等多种格式的发票文件,通过企业微信接口集成和接入模型,实现文件上传和发票信息提取,最终输出标准格式化的发票信息和发票源文件的存储media_id。

标准化的发票信息和media_id,可以在提交发票报销审批时使用,目前已有基于该智能体的系统,对接企业微信的报销流程,改进企业内部报销流程,提升报销效率。详细介绍见参考资料。

二、功能

  • 多格式支持: 支持 PNG、JPG、JPEG、PDF 等多种发票文件格式
  • 批量处理: 能够同时处理多个发票文件
  • 企业微信集成: 通过企业微信临时素材管理实现文件上传并获取media_id
  • 智能识别: 利用AI模型提取发票关键信息
  • 格式标准化: 输出统一的 MarkDown 格式发票信息
  • 规则校验: 内置发票信息核对和验证机制

三、工作流程

1. 初始化阶段

  • 根据对话时的默认值(企业微信企业ID和企业微信自建应用密钥)通过工具获得 access_token

  • 将智能体的输入内容(JSON格式存储文件在MaxKB的OSS路径的图片和PDF)合并为一个JSON数组

  • 给数组中部分内容增加双引号使其符合JSON格式

2. 文件处理循环

在循环体中,每次循环执行以下操作:

  • 从JSON数组中取得一个元素

  • 通过工具从JSON保存的路径中下载上传的文件

  • 将文件上传到企业微信临时素材获取到文件对应media_id

  • 如果上传结果为空,自动重复一次该步骤

  • 通过工具将多个media_id合并为一个结果并赋值给全局变量media_ids

3. 分类处理阶段

根据文件类型进行智能分类处理:

情况一:只有图片
  • 通过AI模型从图片文件中提取发票信息

  • 将信息转为规定的标准格式

  • 对发票信息进行核对验证

  • 将判断结果整理到发票信息的描述中

  • 通过模型将发票信息转化为MarkDown格式输出

情况二:只有PDF
  • 通过AI模型从PDF文件中提取发票信息

  • 将信息转为规定的标准格式

  • 对发票信息进行核对验证

  • 将判断结果整理到发票信息的描述中

  • 通过模型将发票信息转化为MarkDown格式输出

情况三:同时有图片和PDF
  • 分别处理图片和PDF文件

  • 分别提取图片和PDF文件中的发票信息

  • 分别进行信息核对和验证

  • 将判断结果整理到发票信息的描述

  • 合并输出为MarkDown格式

四、工具说明

1. 获取access_token.tool

  • 功能: 获取企业微信自建应用的访问令牌

  • 输入参数:

    • corpid: 企业微信企业ID

    • corpsecret: 企业微信自建应用密钥

  • 输出: access_token

2. 整理输入内容为一个标准JSON数组.tool

  • 功能: 将输入的文档和图片的JSON数组合并为标准JSON数组

  • 输入参数:

    • input_document: 文档输入JSON数组

    • input_image: 图片输入JSON数组

  • 输出: 合并后的JSON数组

3. 全局变量_image输出参数加双引号.tool

  • 功能: 将输入字符串中的单引号转换为双引号,生成合法的JSON格式

  • 输入参数 : input_string - 前面合并为一个JSON数组的结果

  • 输出: 标准JSON格式数据

4. 上传file到企业微信_获取media_id.tool

  • 功能: 下载文件并上传到企业微信临时素材,获取media_id

  • 输入参数:

    • access_token: 企业微信访问令牌

    • file_json: 文件信息JSON

  • 输出: 文件的media_id

5. 将多个字符串用逗号拼接成数组.tool

  • 功能: 将多个media_id合并为数组格式

  • 输入参数: 多个media_id字符串

  • 输出: 合并后的数组

五、使用说明

1.输入要求

  • 文件格式: PNG、JPG、JPEG、PDF

  • 输入方式: 通过文件上传功能提交发票文件

  • 附加信息: 可输入报销理由等补充信息

2.输出格式

智能体输出标准的MarkDown格式,包含:

  • 发票基本信息(发票代码、发票号码、开票日期等)

  • 金额信息(含税金额、不含税金额、税额等)

  • 开票方和收票方信息

  • 发票类型和状态判断

  • 核对验证结果

3.交互示例

用户:(开始对话)

智能体: 您好,我是 AI 发票智能识别 Agent。 您可以上传多种类型的多个发票图片或文件(PNG、JPG、JPEG、PDF), 并输入报销理由,我会输出识别、分类整理后的发票信息。

用户:上传发票文件并输入报销理由

智能体:(回复结果如下)

六、技术架构

1.核心组件

  • MaxKB平台: 提供智能体运行环境

  • 企业微信API: 实现文件上传和管理

  • AI模型: 用于发票信息提取和识别

  • 自定义工具: 处理数据转换和格式标准化

2.数据处理流程

  1. 文件接收 → 2. 企业微信上传 → 3. AI识别 → 4. 信息校验 → 5. 格式转换 → 6. 格式输出

七、智能体部署

1.环境依赖

  • MaxKB平台环境(v2.0)

  • 企业微信企业账号和自建应用

  • 网络连接(用于API调用)

2.部署过程

  • 登录MaxKB平台

  • 进入"工具"页面,点击"创建",选择"导入创建",选择github仓库下载的tool工具文件,点击"导入",确认导入后点击工具的按钮启用工具

  • 进入"应用"页面,点击"创建",选择"导入创建",选择github仓库下载的mk智能体文件,点击"导入",点击智能体进入智能体设置页面

  • 配置智能体

3.配置参数

需要在智能体配置中设置:

  • 企业微信企业ID (corpid)

  • 企业微信自建应用密钥 (corpsecret)

  • 文件内容识别、格式转换所使用的模型在智能体导入后需要重新选择配置

  • (可选)内容识别组件的提示词中的输出样例具体内容,可以按照实际的发票信息填充,以此提高模型提取准确性

  • 配置完成后,点击"保存"按钮,点击"发布"按钮

八、注意事项

  1. 文件大小: 确保上传的文件大小在企业微信限制范围内

  2. 网络稳定性: 文件上传过程需要稳定的网络连接

  3. 格式兼容性: 确保上传的文件格式在支持范围内

  4. 错误处理: 系统具备重试机制,但建议通过智能体对话日志监控处理状态

九、参考资料

1.智能体使用教程

MaxKB文档

2.使用该智能体的系统的详细介绍

基于AI+企微的智能报销系统

3.智能体相关应用文件和工具文件来源

智能体文件下载链接

相关推荐
weixin_397578022 小时前
论文二、DBA工商管理博士论文数智化主题选择
人工智能
咒法师无翅鱼2 小时前
✅西电计算复杂性理论期末笔记
人工智能·机器学习
柳安忆2 小时前
Agent实战!从创意到突破:构建一个多智能体协作的研究创意生成系统
人工智能·ai
Tezign_space2 小时前
深度解析:GEA架构——生成与进化技术的融合
人工智能·数据分析·生成式ai·技术创新·内容生成·内容科技·gea
qq_12498707532 小时前
基于SSM框架的智能密室逃脱信息管理系统(源码+论文+部署+安装)
java·大数据·人工智能·spring boot·后端·毕业设计·计算机毕业设计
人工智能AI技术2 小时前
AI智能体商业化实战:解锁营销/医疗/制造三大高壁垒场景开发技巧
人工智能
人工智能AI技术2 小时前
Agent的核心特质:自主决策、感知环境、持续交互
人工智能
no24544102 小时前
RAGFlow 全面接入 MinerU 2.0,支持 pipeline、vlm-transformers、vlm-sglang 三种模式,解析精度大幅度up
java·大数据·人工智能·python·ai·sglang
俞凡2 小时前
AI 智能体高可靠设计模式:并行混合搜索融合
人工智能