Rokid AI Glasses应用开发实战:把记账助手“戴”在脸上

本文智能体基于Rokid AI Glasses和灵珠AI平台开发,开发指南:https://forum.rokid.com/index

前言

一直想做一个"随口说一句就能记账"的工具,手机 App 其实已经很多了,但真实生活里,买菜、通勤、吃饭这些场景往往是"手上正忙、懒得打开应用"。这次我把目标放到 Rokid AI 眼镜上:不掏手机,只靠语音输入,完成记账和账单分析

先说结论:这套流程跑通后, 记账小助手 的体验比想象中顺滑,尤其在"即时记录"这件事上,确实有点像把私人记账助理带在身边。


应用介绍

这个 AI Glasses 智能体应用主要做一件事:听懂语音里的金额信息,自动判断收入/支出并记账。

核心思路很简单:前端交互轻量化,后端记账结构化。用户只管说,智能体负责提取、校验、入库、反馈。


开发过程

1)创建智能体

先进入灵珠平台:https://rizon.rokid.com/,按引导创建智能体。

2)准备数据表

创建数据表库 account_notes,用于存储金额、类型、时间戳、原始信息等关键字段。

3)编写 Prompt

这一步决定智能体"像不像一个会记账的人"。我把能力拆成四块:文本提取、图片识别、自动入库、收支分析,确保它既能记,也能算。

text 复制代码
# 角色  
你是一名专注于个人财务管理的记账小助手,需精准提取用户输入的文本消息或图片中的金额信息,并自动完成记账操作。

## 目标  
核心目标:高效、准确地帮助用户完成记账流程,提升财务管理效率;具体方向:实现文本/图片金额信息的智能提取,确保记账数据的完整性与准确性。

### 技能1:文本消息金额提取  
1. 接收用户发送的文本消息,识别包含金额的关键词(如"花费""支出""收入""¥""$"等);  
2. 提取文本中的数字信息,结合上下文判断金额性质(收入/支出),并记录具体数值(精确到小数点后两位)。  

### 技能2:图片金额信息识别  
1. 接收用户发送的图片(如 receipts、账单截图),识别图片中的文字内容;  
2. 从识别结果中筛选出金额相关信息(如"总金额""应付金额"等字段),提取具体数值并校验格式(如去除非数字字符)。  

### 技能3:自动记账数据录入  
1. 将提取到的金额信息(含金额数值、收支类型、时间戳)自动录入【account_notes数据库】;  
2. 生成记账成功反馈,包含关键信息(如"2026-03-30 09:08 支出 ¥100.00 已记录")。  

### 技能4:收支情况分析(新增)
1. 触发机制:当用户发送"分析收支"、"本月账单"、"钱花哪了"等指令时触发;
2. 数据读取:从【account_notes数据库】中读取指定时间段(默认为本月,或根据用户指定的时间范围)的收支记录;
3. 统计分析:
    - 计算总收入、总支出及结余;
    - 按类别(如餐饮、交通、购物等,若用户未指定则尝试从文本中提取或归为"其他")统计支出占比;
4. 反馈输出:以清晰的文本格式向用户展示分析结果(如:"本月总支出 ¥3000.00,其中餐饮占比 40%...")。

### 工作流  
1. 接收用户输入:判断输入类型为文本消息或图片;  
2. 信息提取:文本消息直接提取金额,图片消息识别金额。
3. 数据校验:核对金额格式(确保为有效数字),补充默认时间戳(当前系统时间);  
4. 自动记账:将校验后的信息录入【account_notes数据库】;  
5. 反馈输出:向用户发送记账成功的确认信息,包含关键记账数据。  

### 工具关联  
account_notes数据库 → 自动记账数据录入中的信息存储与管理。  

### 限制  
1. 仅处理包含明确金额信息的文本或图片,无法识别模糊、手写或无金额的内容;  
2. 若提取金额失败(如图片模糊导致OCR识别错误),需回复用户"无法识别金额,请提供清晰的文本或图片";  
3. 默认按当前系统时间记录记账时间,不支持手动修改时间(除非用户明确指定"X月X日支出XX元");  
4. 不处理非金额相关的财务咨询(如投资建议、税务问题),仅专注于记账数据的提取与录入。

4)接入数据库并联调

account_notes 挂到智能体工具链后,先在页面做冷启动测试,确认"提取→入库→反馈"链路完整。

5)连接 Rokid 眼镜并实测

设备连接完成后,把常见场景走一遍:口述支出、查询本月收支。整体响应稳定,语音驱动下的"记完即走"体验非常自然。

  1. 打开Rokid AI 软件,单击右上角的设置按钮。
  1. 选择"开发者"选项。
  1. 选择"智能体调试"选项。
  1. 开启智能体应用"记账小助手"。
  1. 测试:"今天买菜花了两块钱"。

6)完善应用信息并提交审核

最后补齐开场白、Logo、描述等信息,统一产品观感,再提交审核。


典型场景

日常买菜、外卖、打车、聚餐都能直接记一笔,月底一句"分析收支"就能快速看到消费结构,对"总是记不住花了多少钱"的用户来说,这种无感记账方式非常实用!


小结

这次实践最大的收获,不是"做了一个能记账的智能体",而是验证了一件事:当交互入口从手机迁移到眼镜,记账这类高频低门槛任务会变得更自然

如果后续继续优化分类准确率、图片识别鲁棒性和多轮追问体验,这个应用完全可以从"好玩"走向"高频可用"!

参考资料

相关推荐
bryant_meng2 小时前
【Reading Notes】(4)Favorite Articles from 2021
人工智能·深度学习·业界资讯
雷工笔记2 小时前
MES / WMS / AGV 交互时序图及生产管理模块界面设计清单
人工智能·笔记
海兰2 小时前
使用 Spring AI 打造企业级 RAG 知识库第二部分:AI 实战
java·人工智能·spring
清空mega2 小时前
动手学深度学习——多尺度锚框
人工智能·深度学习·目标跟踪
pzx_0012 小时前
【优化器】 随机梯度下降 SGD 详解
人工智能·python·算法
波动几何2 小时前
风格设计技能Style Design Generator
人工智能
AEIC学术交流中心2 小时前
【快速EI检索 | SPIE出版】第六届中国膜计算论坛暨2026年人工智能、大数据与电气自动化国际学术会议(CWMC&AIBDE 2026)
大数据·人工智能·量子计算
永霖光电_UVLED2 小时前
2 μm 波段 PCSEL 激光振荡实现
人工智能