Coze实战第15讲：钱都去哪儿了？Coze+飞书搭建自动记账系统

前言

很多人都有记账的习惯，但是每次都手动录入金额、时间、去向等信息，十分繁琐并且容易出错。

现在 AI 多模态能力已经十分成熟了，能否借助 AI 帮我们简化这个过程呢？

今天，我们就尝试通过 Coze 平台实现一个可以自动识别小票、支付结果等图片，并整理成结构化表格的智能体。

场景描述

智能体支持上传购物小票、支付结果等图片，通过多模态能力自动识别并提取出金额、支付时间、收款方、分类等信息，再通过大模型整理成结构化的结果，然后调用接口保存到飞书多维表格。

使用飞书多维表格，也方便我们后续继续进行财务情况的分析和统计。

前期准备

1、注册并登录 Coze 平台。

2、熟悉 Coze 平台的基本概念。

3、创建一个专用的智能体"钱都花哪了"。

4、提前建立飞书多维表格，主要包括以下几个字段：

to：收款方，文本类型。
money：总金额，数字类型，保留 2 位小数。
time：支付时间，文本类型，日期类型也可以，但是需要处理类型转换问题。
type：分类，文本类型。

配置智能体

人设与回复逻辑

本次分享由于主要功能都是通过工作流实现，该提示词不是特别重要。

为了更灵活的响应对话，大家可以按照之前的流程设置上提示词，后续截图都是基于未设置提示词情况进行的。

模型

依然采用默认的"豆包·1.5·Pro·32k"即可。

编制工作流

先了解一下完整的工作流情况。

工作流主要步骤：

开始
图片识别
整理数据
存储到飞书多维表格
结束

新建工作流 qiandouqunale 后直接进入工作流编排界面，我们依次展开。

开始

删除原始的 input 变量，建立我们所需的接收图片的变量。

变量名随意，主要是变量类型记得改为 Image 类型。

图片识别

插件节点，采用图片理解下imgUnderstand工具。

如下设置即可。

输入

url：图片地址，可以直接从"开始"节点获取即可。

text：设置图片识别的提示词。

复制代码

你是一个财务管理助手，请分析图片内容，精准从图片中提取总金额、账单分类（美食、生活必须、出行等）、收款方、支付时间，如果无法识别，可以设置为空，禁止随意编造数据。

主要包括 3 部分：

角色定位，有了专业方向，更加准确地理解图片内容。
提取目标：最终的列表字段。
强调禁止编造数据。

输出

我们要使用的识别结果，主要都在输出变量 response_for_model 中。

整理数据

大模型节点。

输入

一个变量 input, 获取"图片识别"节点的 response_for_model 输出。

用户提示词

由于场景比较简单，"系统提示词"没有设置，直接设置"用户提示词"。

如下：

css 复制代码

从{{input}}中提取出总金额、账单分类（美食、生活必须、出行等）、收款方、支付时间信息，并按照json格式组织，然后构造为飞书多维表格所需参数。
要求：
1. 仔细分析总金额，支付软件支付结果一般会增加负号，需要去除。
2. 总金额禁止携带单位，全部按照元为单位进行数值提取。
示例：
[    {        'fields': {              'money': 10.01,              'type': '美食',              'to': '京东秒送',              'time': '2025-07-14 12:00'        }    }]

主要包括以下作用：