介绍一下飞书和看图片识别功能,这是Nanobot原作没有的功能。
一、飞书通道集成
工作原理
nanobot 使用 WebSocket 长连接 与飞书通信,无需公网 IP 或 Webhook 配置。
飞书服务器 ←WebSocket长连接→ nanobot
配置方法
在 ~/.nanobot/config.json 中配置:
{
"channels": {
"feishu": {
"enabled": true,
"appId": "cli_xxxxxxxxxxxx",
"appSecret": "xxxxxxxxxx",
"encryptKey": "",
"verificationToken": "",
"allowFrom": [],
"reactEmoji": "THUMBSUP"
}
}
}
前置条件
-
在 https://open.feishu.cn 创建企业自建应用
-
启用机器人能力
-
订阅事件:im.message.receive_v1
-
获取 App ID 和 App Secret
支持的消息类型

功能特性
-
自动回复表情:收到消息后自动点赞确认
-
Markdown 渲染:自动转换为飞书卡片
-
表格支持:Markdown 表格转为交互式表格
-
媒体文件:支持发送图片、文件
二、甲骨文/古画识别
技术架构

功能特性
甲骨文识别:
-
逐字识别甲骨文字形
-
给出每个字的释读结果
-
看不清的字标注 "□"
古画/书法识别:
-
识别所有题跋文字
-
识别落款、印章文字
-
提取完整文字内容
金石铭文:
-
识别碑刻、铜器铭文
-
自动搜索权威资料进行解读
使用方式
用户在飞书中发送图片后,nanobot 会:
-
自动下载图片到本地 (~/.nanobot/media/)
-
调用 recognize_image 工具识别
-
使用网络搜索查询相关权威资料
-
返回专业解读,然后把下载的图片删除
示例对话
用户:[发送一张甲骨文图片]
助手:【识别文字】
逐字释读:
-
王 - 象形字,表示王权
-
祀 - 祭祀之意
...
【权威解读】
这是一片商代卜辞,内容关于...
配置要求
{
"agents": {
"defaults": {
"visionModel": "dashscope_vision/kimi-k2.5",
"visionMaxTokens": 8192,
"visionTemperature": 0.3
}
},
"providers": {
"dashscope_vision": {
"apiKey": "sk-sp-xxxxxxxx",
"apiBase": "https://coding.dashscope.aliyuncs.com/v1"
}
}
}