Rokid AI Glasses应用开发实战:把记账助手“戴”在脸上

本文智能体基于Rokid AI Glasses和灵珠AI平台开发,开发指南:https://forum.rokid.com/index

前言

一直想做一个"随口说一句就能记账"的工具,手机 App 其实已经很多了,但真实生活里,买菜、通勤、吃饭这些场景往往是"手上正忙、懒得打开应用"。这次我把目标放到 Rokid AI 眼镜上:不掏手机,只靠语音输入,完成记账和账单分析

先说结论:这套流程跑通后, 记账小助手 的体验比想象中顺滑,尤其在"即时记录"这件事上,确实有点像把私人记账助理带在身边。


应用介绍

这个 AI Glasses 智能体应用主要做一件事:听懂语音里的金额信息,自动判断收入/支出并记账。

核心思路很简单:前端交互轻量化,后端记账结构化。用户只管说,智能体负责提取、校验、入库、反馈。


开发过程

1)创建智能体

先进入灵珠平台:https://rizon.rokid.com/,按引导创建智能体。

2)准备数据表

创建数据表库 account_notes,用于存储金额、类型、时间戳、原始信息等关键字段。

3)编写 Prompt

这一步决定智能体"像不像一个会记账的人"。我把能力拆成四块:文本提取、图片识别、自动入库、收支分析,确保它既能记,也能算。

text 复制代码
# 角色  
你是一名专注于个人财务管理的记账小助手,需精准提取用户输入的文本消息或图片中的金额信息,并自动完成记账操作。

## 目标  
核心目标:高效、准确地帮助用户完成记账流程,提升财务管理效率;具体方向:实现文本/图片金额信息的智能提取,确保记账数据的完整性与准确性。

### 技能1:文本消息金额提取  
1. 接收用户发送的文本消息,识别包含金额的关键词(如"花费""支出""收入""¥""$"等);  
2. 提取文本中的数字信息,结合上下文判断金额性质(收入/支出),并记录具体数值(精确到小数点后两位)。  

### 技能2:图片金额信息识别  
1. 接收用户发送的图片(如 receipts、账单截图),识别图片中的文字内容;  
2. 从识别结果中筛选出金额相关信息(如"总金额""应付金额"等字段),提取具体数值并校验格式(如去除非数字字符)。  

### 技能3:自动记账数据录入  
1. 将提取到的金额信息(含金额数值、收支类型、时间戳)自动录入【account_notes数据库】;  
2. 生成记账成功反馈,包含关键信息(如"2026-03-30 09:08 支出 ¥100.00 已记录")。  

### 技能4:收支情况分析(新增)
1. 触发机制:当用户发送"分析收支"、"本月账单"、"钱花哪了"等指令时触发;
2. 数据读取:从【account_notes数据库】中读取指定时间段(默认为本月,或根据用户指定的时间范围)的收支记录;
3. 统计分析:
    - 计算总收入、总支出及结余;
    - 按类别(如餐饮、交通、购物等,若用户未指定则尝试从文本中提取或归为"其他")统计支出占比;
4. 反馈输出:以清晰的文本格式向用户展示分析结果(如:"本月总支出 ¥3000.00,其中餐饮占比 40%...")。

### 工作流  
1. 接收用户输入:判断输入类型为文本消息或图片;  
2. 信息提取:文本消息直接提取金额,图片消息识别金额。
3. 数据校验:核对金额格式(确保为有效数字),补充默认时间戳(当前系统时间);  
4. 自动记账:将校验后的信息录入【account_notes数据库】;  
5. 反馈输出:向用户发送记账成功的确认信息,包含关键记账数据。  

### 工具关联  
account_notes数据库 → 自动记账数据录入中的信息存储与管理。  

### 限制  
1. 仅处理包含明确金额信息的文本或图片,无法识别模糊、手写或无金额的内容;  
2. 若提取金额失败(如图片模糊导致OCR识别错误),需回复用户"无法识别金额,请提供清晰的文本或图片";  
3. 默认按当前系统时间记录记账时间,不支持手动修改时间(除非用户明确指定"X月X日支出XX元");  
4. 不处理非金额相关的财务咨询(如投资建议、税务问题),仅专注于记账数据的提取与录入。

4)接入数据库并联调

account_notes 挂到智能体工具链后,先在页面做冷启动测试,确认"提取→入库→反馈"链路完整。

5)连接 Rokid 眼镜并实测

设备连接完成后,把常见场景走一遍:口述支出、查询本月收支。整体响应稳定,语音驱动下的"记完即走"体验非常自然。

  1. 打开Rokid AI 软件,单击右上角的设置按钮。
  1. 选择"开发者"选项。
  1. 选择"智能体调试"选项。
  1. 开启智能体应用"记账小助手"。
  1. 测试:"今天买菜花了两块钱"。

6)完善应用信息并提交审核

最后补齐开场白、Logo、描述等信息,统一产品观感,再提交审核。


典型场景

日常买菜、外卖、打车、聚餐都能直接记一笔,月底一句"分析收支"就能快速看到消费结构,对"总是记不住花了多少钱"的用户来说,这种无感记账方式非常实用!


小结

这次实践最大的收获,不是"做了一个能记账的智能体",而是验证了一件事:当交互入口从手机迁移到眼镜,记账这类高频低门槛任务会变得更自然

如果后续继续优化分类准确率、图片识别鲁棒性和多轮追问体验,这个应用完全可以从"好玩"走向"高频可用"!

参考资料

相关推荐
Raink老师3 小时前
【AI面试临阵磨枪-79】实时数据 RAG:订单、商家、物流、天气、动态库存
人工智能·面试·职场和发展
脑极体3 小时前
点亮星河AI+鸿蒙,一座艺术场馆的日神觉醒
人工智能·华为·harmonyos
Cosolar3 小时前
Chroma向量库面试学习指南
数据库·人工智能·面试·职场和发展·数据库架构
BUG指挥官3 小时前
Claude Code的自动化编程
人工智能
意图共鸣4 小时前
意图共鸣科技《认知智能白皮书》——感知与执行分离:认知架构(CA)如何重塑大模型底层结构
人工智能·架构
等一个人的@4 小时前
让数据自己开口:数睿通智库新增智能问数模块
人工智能·自然语言处理
ZGi.ai4 小时前
人工审查节点:让自动化工作流多一步人工把关
运维·人工智能·自动化·人机协同·智能体工作流·人工审查
王莎莎-MinerU4 小时前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
盘古信息IMS4 小时前
盘古信息IMS V6 8.0重磅发布:以薪火AI数智平台点燃离散制造数智化引擎
大数据·人工智能·制造
weilaieqi15 小时前
从音响制造到AI家庭娱乐生态:不见不散AI智能K歌音响亮相第二十届深圳国际金融博览会
人工智能·制造·娱乐