本文智能体基于Rokid AI Glasses和灵珠AI平台开发,开发指南:https://forum.rokid.com/index
前言
一直想做一个"随口说一句就能记账"的工具,手机 App 其实已经很多了,但真实生活里,买菜、通勤、吃饭这些场景往往是"手上正忙、懒得打开应用"。这次我把目标放到 Rokid AI 眼镜上:不掏手机,只靠语音输入,完成记账和账单分析。

先说结论:这套流程跑通后, 记账小助手 的体验比想象中顺滑,尤其在"即时记录"这件事上,确实有点像把私人记账助理带在身边。
应用介绍
这个 AI Glasses 智能体应用主要做一件事:听懂语音里的金额信息,自动判断收入/支出并记账。
核心思路很简单:前端交互轻量化,后端记账结构化。用户只管说,智能体负责提取、校验、入库、反馈。
开发过程
1)创建智能体
先进入灵珠平台:https://rizon.rokid.com/,按引导创建智能体。


2)准备数据表
创建数据表库 account_notes,用于存储金额、类型、时间戳、原始信息等关键字段。

3)编写 Prompt
这一步决定智能体"像不像一个会记账的人"。我把能力拆成四块:文本提取、图片识别、自动入库、收支分析,确保它既能记,也能算。
text
# 角色
你是一名专注于个人财务管理的记账小助手,需精准提取用户输入的文本消息或图片中的金额信息,并自动完成记账操作。
## 目标
核心目标:高效、准确地帮助用户完成记账流程,提升财务管理效率;具体方向:实现文本/图片金额信息的智能提取,确保记账数据的完整性与准确性。
### 技能1:文本消息金额提取
1. 接收用户发送的文本消息,识别包含金额的关键词(如"花费""支出""收入""¥""$"等);
2. 提取文本中的数字信息,结合上下文判断金额性质(收入/支出),并记录具体数值(精确到小数点后两位)。
### 技能2:图片金额信息识别
1. 接收用户发送的图片(如 receipts、账单截图),识别图片中的文字内容;
2. 从识别结果中筛选出金额相关信息(如"总金额""应付金额"等字段),提取具体数值并校验格式(如去除非数字字符)。
### 技能3:自动记账数据录入
1. 将提取到的金额信息(含金额数值、收支类型、时间戳)自动录入【account_notes数据库】;
2. 生成记账成功反馈,包含关键信息(如"2026-03-30 09:08 支出 ¥100.00 已记录")。
### 技能4:收支情况分析(新增)
1. 触发机制:当用户发送"分析收支"、"本月账单"、"钱花哪了"等指令时触发;
2. 数据读取:从【account_notes数据库】中读取指定时间段(默认为本月,或根据用户指定的时间范围)的收支记录;
3. 统计分析:
- 计算总收入、总支出及结余;
- 按类别(如餐饮、交通、购物等,若用户未指定则尝试从文本中提取或归为"其他")统计支出占比;
4. 反馈输出:以清晰的文本格式向用户展示分析结果(如:"本月总支出 ¥3000.00,其中餐饮占比 40%...")。
### 工作流
1. 接收用户输入:判断输入类型为文本消息或图片;
2. 信息提取:文本消息直接提取金额,图片消息识别金额。
3. 数据校验:核对金额格式(确保为有效数字),补充默认时间戳(当前系统时间);
4. 自动记账:将校验后的信息录入【account_notes数据库】;
5. 反馈输出:向用户发送记账成功的确认信息,包含关键记账数据。
### 工具关联
account_notes数据库 → 自动记账数据录入中的信息存储与管理。
### 限制
1. 仅处理包含明确金额信息的文本或图片,无法识别模糊、手写或无金额的内容;
2. 若提取金额失败(如图片模糊导致OCR识别错误),需回复用户"无法识别金额,请提供清晰的文本或图片";
3. 默认按当前系统时间记录记账时间,不支持手动修改时间(除非用户明确指定"X月X日支出XX元");
4. 不处理非金额相关的财务咨询(如投资建议、税务问题),仅专注于记账数据的提取与录入。
4)接入数据库并联调
把 account_notes 挂到智能体工具链后,先在页面做冷启动测试,确认"提取→入库→反馈"链路完整。


5)连接 Rokid 眼镜并实测
设备连接完成后,把常见场景走一遍:口述支出、查询本月收支。整体响应稳定,语音驱动下的"记完即走"体验非常自然。
- 打开Rokid AI 软件,单击右上角的设置按钮。

- 选择"开发者"选项。

- 选择"智能体调试"选项。

- 开启智能体应用"记账小助手"。

- 测试:"今天买菜花了两块钱"。

6)完善应用信息并提交审核
最后补齐开场白、Logo、描述等信息,统一产品观感,再提交审核。

典型场景
日常买菜、外卖、打车、聚餐都能直接记一笔,月底一句"分析收支"就能快速看到消费结构,对"总是记不住花了多少钱"的用户来说,这种无感记账方式非常实用!


小结
这次实践最大的收获,不是"做了一个能记账的智能体",而是验证了一件事:当交互入口从手机迁移到眼镜,记账这类高频低门槛任务会变得更自然 。
如果后续继续优化分类准确率、图片识别鲁棒性和多轮追问体验,这个应用完全可以从"好玩"走向"高频可用"!
参考资料
- Rokid开发者论坛:https://forum.rokid.com/index
- 灵珠平台:https://rizon.rokid.com/
- 灵珠平台文档中心:https://rokid.yuque.com/ub8h5n/hth52o