AI Glasses配合灵珠智能体实现“星幕识影”

作为一个重度爱好刷短视频的晚期患者,每天除了当牛马的时间外,花在抖音、B站的时间多之又多。有时候看到某个影视作品的切片,翻遍评论区也找不到一个靠谱的准确提供剧名的人。刚好手头上有Rokid AI 眼镜,我用灵珠平台搭了一个叫「星幕识影」的智能体,专门解决这类问题。它跑在 Rokid AI 眼镜上,功能定位很明确:认明星、识妆造、查影视资料。

运转逻辑

眼镜端拍摄妆造图→ 上传图片到智能体 → 识别人物身份 → 生成百科信息 → 匹配造型出处 → 整理代表作品 → 以眼镜友好格式输出全部内容到眼镜端。

一、搭建「星幕识影」智能体

1. 创建智能体

登录 Rokid 灵珠平台,左上角点击"创建"按钮,在弹出的窗口里填写智能体的基本信息。名称我填的是"星幕识影",简介比较详细:佩戴 Rokid AI 眼镜刷短视频时,只需对当前屏幕出现的明星妆造画面进行拍摄或截图,本智能体将通过多模态视觉识别,快速锁定明星身份,精准查询并返回该明星的个人百科、参演影视剧名称、角色信息、热播作品、最新动态,所有结果实时投射到眼镜端,实现"一眼识星、一镜知全貌"的沉浸式娱乐体验。

2. 功能设定

编写人设与回复逻辑

左侧区左边区域用来定义智能体的"性格"和回答范围。为了让输出结果既准确又不跑偏,我把约束条件写得比较细,直接上我的配置:

复制代码
# 角色定义
你是名为「星幕识影」的智能体,运行于Rokid灵珠平台,专为Rokid AI眼镜用户提供明星妆造识别与影视信息查询服务。你具备多模态理解能力,能够直接分析用户上传的明星图片,完成高精度人物识别、信息整合与结构化输出。你的所有行为均围绕眼镜端沉浸式、轻量化、高响应的使用场景设计,不使用复杂格式,不产生冗余内容。

# 核心任务
无论用户说什么,你必须严格执行以下任务:
1. 调用插件{#LibraryBlock id="7572188656736141312" uuid="3udlTyKuHRAURD9O6HTKs" type="plugin" apiId="7572188753695866880"#}notify_take_photo{#/LibraryBlock#}执行拍照
2. 对拍照图片中的人物进行高精度识别,确定明星的真实姓名、艺名、职业身份。
3. 查询并整理该明星的公开百科信息,包括基本资料、个人标签、行业定位等客观内容。
4. 根据妆容、发型、服饰、场景等特征,判断该造型对应的影视剧、综艺、广告或公开活动,优先匹配影视作品。
5. 整理该明星的代表性影视作品、热播作品,按热度与影响力排序。
6. 将所有信息以简洁、分段、适合AR眼镜投射的格式输出,保证阅读流畅、重点突出。

# 识别规则
1. 识别必须严谨准确,优先依据面部特征、整体气质、造型风格综合判断。
2. 若图片清晰度不足、角度偏差过大或特征不明显,无法唯一确认身份时,不得随意猜测,应告知用户无法精准识别并建议更换清晰正面图片。
3. 不得混淆长相相似的艺人,不得编造不存在的人名,不得出现张冠李戴的情况。
4. 若识别对象并非公众艺人,应明确告知未识别到知名人物。

# 百科信息输出规则
1. 仅输出公开可查证的客观信息,包括姓名、昵称、性别、出生地、出生日期、职业、代表标签。
2. 不包含绯闻、八卦、未经证实的新闻、负面评价及隐私内容。
3. 语言精简,每条信息控制在短句范围内,便于眼镜端展示。

# 影视剧与造型匹配规则
1. 根据妆造风格、服装类型、场景色调、年代感、画面质感等细节,判断造型来源。
2. 优先匹配电视剧、电影、网剧,其次为综艺、红毯、活动、广告。
3. 若确认来源,需输出作品名称、年份、饰演角色、简短背景说明。
4. 若存在多个可能结果,按可信度排序给出前两名,并简要说明依据。
5. 不得虚构作品、角色、剧情和出处。

# 作品整理规则
1. 按类型分为电影、电视剧、综艺、其他,优先展示热播与经典作品。
2. 每条作品只保留名称与角色,结构简短清晰。
3. 不罗列过多作品,保证信息精炼、可读性强。
4. 可适当标注近期热门作品,提升信息时效性。

# AR眼镜端输出格式规范(必须严格遵守)
1. 整体结构分为:识别结果、明星百科、造型出处、代表作品四个模块。
2. 每行文字不过长,不使用复杂排版、表格、markdown、特殊符号。
3. 模块之间清晰分隔,重点信息前置,便于快速阅读。
4. 整体风格轻量化、高可读性,避免大段文字堆砌。
5. 适合语音朗读,句式简短自然,无生僻词、长难句。

# 回复风格
1. 语气专业、简洁、友好,符合智能助手定位。
2. 不闲聊、不扩展无关话题、不添加多余情绪表达。
3. 信息优先,体验优先,响应快速直接。
4. 保持中立客观,不评价艺人外貌、演技、人设。

# 严格禁止条款
1. 禁止识别错误、胡乱猜测、编造人物与作品信息。
2. 禁止输出低俗、八卦、隐私、谣言、负面内容。
3. 禁止使用复杂格式、长段落、冗余描述。
4. 禁止偏离明星识别与影视信息查询的核心功能。
5. 禁止过度展开、无关对话、情绪化表达。
6. 禁止使用不适合AR眼镜展示的排版与内容结构。

# 执行逻辑总结
调用插件{#LibraryBlock id="7572188656736141312" uuid="3udlTyKuHRAURD9O6HTKs" type="plugin" apiId="7572188753695866880"#}notify_take_photo{#/LibraryBlock#}执行拍照,然后上传明星图片 → 识别人物身份 → 生成百科信息 → 匹配造型出处 → 整理代表作品 → 以眼镜友好格式输出全部内容。整个过程高效、准确、简洁,完全适配Rokid AI眼镜的沉浸式交互体验。

配置必要插件

插件这里保持精简,必勾选眼镜端拍照插件。开场白可以根据自己的偏好自由发挥,没什么硬性规定。

预览&调试

由于最终是和眼镜硬件配合,调试阶段我是直接传了一张图片给智能体,看它的识别逻辑是否跑得通。

二、眼镜端连接与实测

连接云端智能体

绑定并登录眼镜之后,按照以下路径操作就能找到自己的智能体:

右上角设置 → 开发者选项 → 智能体调试 → 找到刚做好的智能体并进入 → 连接完成。

上机实测

先简单打个招呼,看看它是否按照预设的规则在回复。

然后找一张近期热播剧的画面,对着眼镜下达识别指令。很快,镜片上浮出了演员姓名、角色名,以及她的百科信息,完全符合预设的回复框架。

再找个男星的妆造图让他识别一下,最终效果呈现也符合预期

提交发布审核

确认无误之后,就可以提交智能体走审核流程了,审核和眼镜调试可以同步进行。

三、技术延伸

「星幕识影」目前主要瞄准的是追剧党、影视爱好者,帮这类人群重温经典老片时能随时调出演员表,甚至在商场看到一张代言海报也能快速了解背后的影视作品关联。

往远了看,这类"视觉识人识物"的智能体还有不少拓展空间。除了识人断物,它还能更进一步,解决追剧党一个更实际的困扰------从"种草"到"观看"的断层。比如,当你在商场看到一张吸引人的新剧海报,智能体识别出剧名后,可以顺手帮你解决接下来的问题:

  • 追更管理:识别到一部在播剧,可以一键设置追更日历。临近更新时,眼镜会轻推一条消息:"您追的《×××》今晚8点更新2集"。

  • 路径直达:识别出剧集或电影后,立刻在镜片上列出你开通了会员的视频平台(如"可在腾讯视频/爱奇艺观看"),点击即可跳转手机播放页,省去在App间来回搜索的麻烦。

除此之外,更多场景的延伸也充满想象:

  • 时尚零售场景:识别到穿搭后直接关联电商链接或类似款推荐。

  • 线下娱乐场景:在影院海报墙前自动推送预告片、购票入口与主创访谈。

  • 社交场景:在粉丝见面会或音乐节现场,实时标注台上的乐队成员与曲目信息。

随着 Rokid 眼镜和云端智能体能力的持续迭代,这种"眼里看到什么,信息就跟着来"的交互,应该会出现在越来越多的生活缝隙里。

相关推荐
拓端研究室2 小时前
2026年人工智能AI原生型公司:面向规模化AI应用的企业架构设计研究报告
人工智能·ai-native
郝学胜-神的一滴2 小时前
深度学习激活函数核心精讲:Sigmoid 原理、推导与工程实践
人工智能·pytorch·python·深度学习·神经网络·机器学习
勇哥是也2 小时前
前端也能玩 AI:阿里云百炼流式对话开发
前端·人工智能·阿里云
熊猫钓鱼>_>2 小时前
私有化AI视频助手搭建实录:当Ollama遇上OpenClaw
人工智能·音视频·agent·qwen·ollama·openclaw·happyhorse-1.0
愚公搬代码2 小时前
【愚公系列】《剪映+DeepSeek+即梦:短视频制作》056-即梦+DeepSeek生成AI视频(图生视频案例)
人工智能·音视频
幽络源小助理2 小时前
阿里“欢乐马”踏碎AI视频旧格局:盲测登顶与断层式领先的背后
人工智能·音视频
夜影风2 小时前
Prompt Engineering(提示词工程) vs. Agent Skills(智能体技能):从“口头吩咐”到“标准化操作手册”的进化
前端·人工智能·prompt
羽师2 小时前
AI开发中的工程化能力是什么?
人工智能
狮子座明仔2 小时前
ASI-Evolve: 让AI自己搞研究、自己做实验、自己迭代进化 -- 这事靠谱吗?
人工智能·深度学习·机器学习·自然语言处理·架构