向日葵MCP实践指南

前言

最近 AI 智能体的发展很快,OpenClaw 爆火网络,"让 AI 帮你干活"逐渐成为现实。但大多数 AI 助手仍然局限于文本对话,或者只能操作当前这台电脑。一个很自然的想法是:能不能让 AI 远程操控另一台设备------打开软件、执行命令、处理文件?

我最近折腾了一下向日葵的 MCP Server,它把向日葵的远程控制能力封装成了 MCP 标准接口,让 AI 智能体可以直接调用。这篇文章记录一下完整的配置过程和使用体验。

什么是 MCP?

先简单介绍一下背景。MCP(Model Context Protocol,模型上下文协议)是 Anthropic 提出的一种标准化协议,用于让 AI 大模型与外部工具进行交互。可以把它理解为 AI 世界的"USB 接口"------只要工具实现了 MCP 协议,支持该协议的 AI 就能直接调用它。

向日葵 MCP Server 基于这个协议,做的事情也比较直接:

  • 当桥梁:将向日葵的设备管理和远程操作能力,封装成标准化的 MCP 接口
  • 当工具集:AI 智能体可以直接调用远程控制能力,不用自己写控制代码
  • 当自动化引擎:AI 能自动查找设备、建立连接、执行操作,串成完整的工作流

目前支持 Windows 和 macOS,兼容 OpenCode、Cursor、Claude Code 等主流 AI 智能体平台。

安装与配置

环境准备

第一步:开启 MCP 能力

先安装最新版的向日葵客户端,找到【向日葵 MCP】功能,开启 MCP 服务器能力,服务类型推荐选择 Stdio 模式。

第二步:AI 客户端连接 MCP

官方提供了常用 AI 工具的配置方案,以 Claude Code 为例,配置格式如下:

json 复制代码
{
  "mcpServers": {
    "awesun-mcp-server": {
      "command": "/Applications/AweSun.app/Contents/Helpers/awesun-mcp-server",
      "env": {
        "AWESUN_API_URL": "http://127.0.0.1:8908",
        "AWESUN_API_TOKEN": "NDYxYzYzYzktYjFjYi00ZTkxLTk2MGItMTZiOGYxNjI3NmMw"
      }
    }
  }
}

也可以用一键配置命令:

bash 复制代码
claude mcp add --transport stdio \
  --env AWESUN_API_URL=http://127.0.0.1:8908 \
  --env AWESUN_API_TOKEN=NDYxYzYzYzktYjFjYi00ZTkxLTk2MGItMTZiOGYxNjI3NmMw \
  awesun-mcp-server -- /Applications/AweSun.app/Contents/Helpers/awesun-mcp-server

第三步:验证连接

配置完成后,在 AI 对话中输入"查询在线设备",如果能成功返回设备列表,说明配置已生效。

核心功能详解

向日葵 MCP Server 提供了三类核心接口:

1. 设备管理

  • 设备检索与定位 :通过设备名称或状态快速查找目标设备,获取远程连接所需的 remote_id
  • 设备信息维护:管理和更新设备的备注、分组等元数据信息
  • 设备状态控制:支持远程关机、唤醒等电源管理操作

2. 远程会话控制

  • 远程桌面连接 :通过 control_connect() 建立远程桌面会话,实时操控远端设备
  • 无桌面命令执行 :通过 control_command() 直接在远端设备上执行命令,不需要打开桌面,比较适合批量运维场景

3. 桌面自动化操作

这部分是我觉得比较有意思的能力。AI 通过"截屏 - 视觉识别 - 执行操作"的循环来实现桌面自动化:

  1. 调用 control_screenshot() 获取远端屏幕截图
  2. AI 视觉模型分析界面内容,识别按钮、输入框等元素
  3. 调用 desktop_*() 系列方法执行点击、输入、滚动等操作

这套流程让 AI 具备了"看屏幕、动鼠标"的能力,理论上可以操作任何图形界面应用。不过实际体验下来,对于复杂界面的识别准确率还依赖于底层视觉模型的能力,简单明确的操作(比如点击固定位置的按钮)成功率较高。

实战案例

案例一:远程办公文档检索

场景:在家办公时,需要获取公司电脑上的项目文档。

操作:在 AI 对话中输入:

"连接我的公司电脑'办公室-主机',找到桌面上的'Q1季度报告.xlsx',把内容总结给我。"

AI 会自动完成:查找设备 → 建立远程连接 → 定位文件 → 读取内容 → 生成摘要。整个过程不需要手动操作远程桌面。

案例二:服务器自动化运维

场景:生产服务器出现异常,需要紧急排查。

操作

"连接'生产服务器-01',查看最近的系统日志,分析是否有异常错误,如果发现 Nginx 服务停止,自动重启它。"

AI 通过向日葵建立远程连接后,执行日志查看命令,分析错误信息,并在确认问题后自动执行 systemctl restart nginx。这个场景用 control_command() 就够了,不需要打开远程桌面。

案例三:远程技术支持

场景:客户反馈软件报错,需要远程协助排查。

操作:在客户授权后,AI 通过 MCP 接口远程截取客户屏幕上的报错信息,自动分析错误原因并给出修复方案,也可以直接远程操作完成修复。相比传统的"电话沟通 → 远程连接 → 人工排查"流程,中间环节减少了不少。

和 OpenClaw 的对比

既然提到了 OpenClaw,简单对比一下。两者定位不同,不存在谁替代谁的关系:

对比维度 向日葵 MCP Server OpenClaw
核心定位 跨设备远程控制 + AI 自动化 本地单机 AI 任务助手
跨设备能力 支持,可控制远端设备 仅限本机操作
远程桌面 支持(截屏、点击、输入) 不支持
协议标准 基于 MCP 标准协议 自有技能/插件体系
部署方式 安装客户端,配置 MCP 命令行安装,需自备 API Key
适用场景 远程办公、跨设备运维、远程技术支持 本地邮件管理、日历、浏览器自动化

简单来说,OpenClaw 擅长本地单机自动化 ,帮你在当前电脑上处理邮件、填表单、跑脚本;向日葵 MCP 解决的是跨设备操作,比如从家里控制公司电脑、远程排查客户问题、批量管理多台服务器。两者可以互补,按实际需求选择就好。

总结

整体体验下来,向日葵 MCP Server 把远程控制能力接入 AI 工作流这个思路是可行的。对于经常需要跨设备操作的场景(远程办公、运维、技术支持),确实能减少不少手动操作。

当然也有一些可以改进的地方:桌面自动化的识别精度受限于视觉模型能力,复杂操作可能需要多次重试;对于简单的命令执行场景,直接 SSH 可能更直接。但作为一个让 AI 具备远程操控能力的方案,目前的完成度还是不错的,感兴趣的可以试试。

向日葵 MCP:sunlogin.oray.com/ai/mcp/

MCP 配置指南:service.oray.com/question/50...

相关推荐
ECH00O001 小时前
10-Fine-tuning/微调:给AI上"专业课"
人工智能
明月(Alioo)2 小时前
OpenClaw 从本地到云端:阿里云百炼免费模型配置实战指南
阿里云·ai·aigc·agent
V搜xhliang02462 小时前
多模态数据采集与标注
人工智能·目标检测·计算机视觉·知识图谱
CPU NULL2 小时前
Google Banana pro 画卡通信息图
人工智能·ai作画·aigc·nano banana
心.c2 小时前
从 ReAct 到 Plan-and-Execute:AI Agent 推理架构的理解与选择
人工智能·react.js·架构
人工智能AI技术2 小时前
GPT-5.4逆向NES游戏ROM:我是如何用AI自动生成可运行复古游戏代码的
人工智能
zkrb7772 小时前
AI误删生产库预警|中科热备:以硬核技术筑牢云上容灾防线
人工智能
咕泡科技2 小时前
从0到1系统学习大模型:一份接地气的入门指南
人工智能·python·学习
KerwinChou_CN2 小时前
大模型 RAG 中 RRF(Reciprocal Rank Fusion倒数排序融合)是什么
人工智能·后端·python