给 TRAE SOLO 一台服务器,它能干什么?

前一阵子刷到一个很有意思的操作:有人直接把一台服务器的权限扔给了 AI,并简单说了句目标。

然后,AI 就从零开始安装环境、配依赖,拉仓库,启动服务,最后成功完成了对外服务的提供。

今天,我们就尝试下这个思路:让 TRAE SOLO 自行在远程服务器中搭建一套 MinerU 环境。

MinerU

首先,简单介绍下 MinerU

MinerU 是一款能将PDF/图片转换为机器可读格式 (例如 markdownJSON)的工具,诞生于上海人工智能实验室出品大模型 InternLM 的预训练过程中。

核心特性:

  • 多模态文档解析:支持多种文档类型,包括扫描版 PDF
  • 结构化还原:可识别表格、公式、分子式等
  • 高保真语义理解:利用布局分析和阅读顺序推理,避免传统 OCR 机械识别导致的逻辑错乱。
  • 本地化 & 开源免费:全部模型和代码开源,可私有部署,无需调用外部 API,保障数据隐私。

共绩算力

AI 要部署的应用已经了解了,现在需要给 AI 找一个可以操作的服务器。

最近我使用的算力平台是"共绩算力",RTX 4090 只要 1.68 元/小时,还能按毫秒计费、自动扩容,非常便于我根据研究的模型挑选合适的节点配置。

尤其是目前,平台还有福利,注册就送算力券

实操记录

节点建立

注册并登录"共绩算力"平台。

在"云主机"页面选择合适的节点

选择合适的节点类型后,配置相关镜像、存储等,我这里配置了"基础镜像",由于是测试搭建模型,未配置相关存储。

如果是第一次租用,账户余额为 0,会要求充值一下(0.01元即可),然后,需要在个人中心关注下公众号,这些按照页面提示进行即可。

租用成功后,会在"控制台"-"云主机列表"中看到租用的节点。

24G 显存、63G 内存,1小时 1.68 元,并且有算力券抵扣,还很合适的。

远程连接

第一步 ,我们先来调整下 SSH 连接的命令,让其支持端口映射,方便访问 demo。

在上一步的"云主机列表"-"SSH登录信息"中,复制出登录指令,格式如下。

css 复制代码
ssh root@hdy1.550c.cloud -p 40002

增加端口映射参数

java 复制代码
ssh -vvN -L 7860:127.0.0.1:7860 root@hdy1.550c.cloud -p 40002

其中 7860MinerU demo 的服务端口。

第二步 ,我们打开 TRAE 进行远程连接。

输入上面的指令,回车即可。

此时会要求录入密码,再次从"云主机列表"-"SSH登录信息"中复制"登录密码"即可。

如果同一地址连接多次,可能会在 SSH 连接中生成多个相同的 Host,此时会出现登录失败的情况,手动删除重复的 Host 即可。

成功连接后,终端信息如下。

正常情况下可以在编辑器中打开远程文件夹,也可以在终端执行命令了。

但今天,我们都交给 AI。

环境部署

开发环境:国际版 SOLO Coder 智能体,未选择 Plan 模式。

直接在 Chat 窗口录入如下指令,等待完成。

指令

指令非常简单,让 AI 参考 MinerU 官方仓库文档,自行完成部署。

因为模型下载涉及到 HuggingFace 的网络问题,一般各大算力企业都会提供镜像内容,这里把"共绩算力"的镜像文档也放上了。

ruby 复制代码
参考github文档https://github.com/opendatalab/mineru?tab=readme-ov-file ,帮我完成mineru的安装,并完成demo启动。
云服务器文档:https://www.gongjiyun.com/docs/server/introduction/rznmwsy13i4a8yktuyycoxyinmg/ 

过程

过程很清晰:安装依赖、下载模型、启动Demo。

后面还有详细的安装步骤、网络加速与镜像建议、常用参数与优化、问题排查、后续可选增强等内容,便于我们回顾审阅。

SOLO 模式的好处就是中间遇到问题,它可以自行解决

最后还给出了 demo 的访问方式。

结果

命令执行完成后,SOLO 内置浏览器已经帮我把 demo 打开了。

这里可以通过 http://localhost:7860/ 访问到服务器,就是因为"远程连接"章节中的 SSH 命令中增加了端口映射。

调试优化

上面跑起来的 demo,上传测试的 PDF 后,转换报错。

不着急,我们直接让 SOLO 帮忙修复下。

指令

复制代码
demo中上传后报错,请帮我修复

过程

SOLO 可以从终端中获取错误信息,快速定位问题:

"上传解析时报错的根因是 Gradio 处理流程在解析时尝试访问 HuggingFace 获取模型元数据,出现 SSL 错误导致函数返回 None ,最终触发 TypeError: cannot unpack non-iterable NoneType object "

结果

再次上传 PDF,可以看到提取结果了,已经完成了今天的既定目标了。

由于模型参数未调优,识别中存在些许问题,非此次分享重点,我们就不再讨论了。

结语

整个过程还是非常顺利的,除了我第一次忘记配置模型镜像下载导致的失败。

之前以为 AI 可以自己 SOLO 代码就很酷了,没想到,AI 都已经可以自己掌控服务器了。

给个目标,就能直接等待验收?那后续技术验证、环境搭建脚本岂不是更轻松了。

当部署、调试、优化也能交给 AI 自主完成后,开发者就有了更多的时间去思考"做什么"而非"怎么做"------这或许才是智能时代的生产力跃迁。

相关推荐
人邮异步社区2 小时前
如何有效地利用AI辅助编程,提高编程效率?
人工智能·深度学习·ai编程
ai分享2 小时前
vue.js中父组件调用子组件的内部方法示例
ai编程
雨中飘荡的记忆3 小时前
Spring Alibaba AI 实战指南
java·ai编程
该用户已不存在4 小时前
6款MCP工具,让AI真正懂业务
ai编程·mcp
trsoliu4 小时前
2025 AI编程复盘:从 Copilot 到 Agent,Cursor 与 Windsurf 的"夺嫡之战"与 MCP 的野望
ai编程
程序员爱钓鱼4 小时前
用 Python 批量生成炫酷扫光 GIF 动效
后端·python·trae
remaindertime8 小时前
基于Ollama和Spring AI:实现本地大模型对话与 RAG 功能
人工智能·后端·ai编程
吴法刚10 小时前
Gemini cli 源码分析之-Gemini CLI 项目启动交互模式startInteractiveUI函数
ai·交互·ai编程·gemini·ai编码
let_code10 小时前
CopilotKit-丝滑连接agent和应用-理论篇
前端·agent·ai编程