给 TRAE SOLO 一台服务器,它能干什么?

前一阵子刷到一个很有意思的操作:有人直接把一台服务器的权限扔给了 AI,并简单说了句目标。

然后,AI 就从零开始安装环境、配依赖,拉仓库,启动服务,最后成功完成了对外服务的提供。

今天,我们就尝试下这个思路:让 TRAE SOLO 自行在远程服务器中搭建一套 MinerU 环境。

MinerU

首先,简单介绍下 MinerU

MinerU 是一款能将PDF/图片转换为机器可读格式 (例如 markdownJSON)的工具,诞生于上海人工智能实验室出品大模型 InternLM 的预训练过程中。

核心特性:

  • 多模态文档解析:支持多种文档类型,包括扫描版 PDF
  • 结构化还原:可识别表格、公式、分子式等
  • 高保真语义理解:利用布局分析和阅读顺序推理,避免传统 OCR 机械识别导致的逻辑错乱。
  • 本地化 & 开源免费:全部模型和代码开源,可私有部署,无需调用外部 API,保障数据隐私。

共绩算力

AI 要部署的应用已经了解了,现在需要给 AI 找一个可以操作的服务器。

最近我使用的算力平台是"共绩算力",RTX 4090 只要 1.68 元/小时,还能按毫秒计费、自动扩容,非常便于我根据研究的模型挑选合适的节点配置。

尤其是目前,平台还有福利,注册就送算力券

实操记录

节点建立

注册并登录"共绩算力"平台。

在"云主机"页面选择合适的节点

选择合适的节点类型后,配置相关镜像、存储等,我这里配置了"基础镜像",由于是测试搭建模型,未配置相关存储。

如果是第一次租用,账户余额为 0,会要求充值一下(0.01元即可),然后,需要在个人中心关注下公众号,这些按照页面提示进行即可。

租用成功后,会在"控制台"-"云主机列表"中看到租用的节点。

24G 显存、63G 内存,1小时 1.68 元,并且有算力券抵扣,还很合适的。

远程连接

第一步 ,我们先来调整下 SSH 连接的命令,让其支持端口映射,方便访问 demo。

在上一步的"云主机列表"-"SSH登录信息"中,复制出登录指令,格式如下。

css 复制代码
ssh root@hdy1.550c.cloud -p 40002

增加端口映射参数

java 复制代码
ssh -vvN -L 7860:127.0.0.1:7860 root@hdy1.550c.cloud -p 40002

其中 7860MinerU demo 的服务端口。

第二步 ,我们打开 TRAE 进行远程连接。

输入上面的指令,回车即可。

此时会要求录入密码,再次从"云主机列表"-"SSH登录信息"中复制"登录密码"即可。

如果同一地址连接多次,可能会在 SSH 连接中生成多个相同的 Host,此时会出现登录失败的情况,手动删除重复的 Host 即可。

成功连接后,终端信息如下。

正常情况下可以在编辑器中打开远程文件夹,也可以在终端执行命令了。

但今天,我们都交给 AI。

环境部署

开发环境:国际版 SOLO Coder 智能体,未选择 Plan 模式。

直接在 Chat 窗口录入如下指令,等待完成。

指令

指令非常简单,让 AI 参考 MinerU 官方仓库文档,自行完成部署。

因为模型下载涉及到 HuggingFace 的网络问题,一般各大算力企业都会提供镜像内容,这里把"共绩算力"的镜像文档也放上了。

ruby 复制代码
参考github文档https://github.com/opendatalab/mineru?tab=readme-ov-file ,帮我完成mineru的安装,并完成demo启动。
云服务器文档:https://www.gongjiyun.com/docs/server/introduction/rznmwsy13i4a8yktuyycoxyinmg/ 

过程

过程很清晰:安装依赖、下载模型、启动Demo。

后面还有详细的安装步骤、网络加速与镜像建议、常用参数与优化、问题排查、后续可选增强等内容,便于我们回顾审阅。

SOLO 模式的好处就是中间遇到问题,它可以自行解决

最后还给出了 demo 的访问方式。

结果

命令执行完成后,SOLO 内置浏览器已经帮我把 demo 打开了。

这里可以通过 http://localhost:7860/ 访问到服务器,就是因为"远程连接"章节中的 SSH 命令中增加了端口映射。

调试优化

上面跑起来的 demo,上传测试的 PDF 后,转换报错。

不着急,我们直接让 SOLO 帮忙修复下。

指令

复制代码
demo中上传后报错,请帮我修复

过程

SOLO 可以从终端中获取错误信息,快速定位问题:

"上传解析时报错的根因是 Gradio 处理流程在解析时尝试访问 HuggingFace 获取模型元数据,出现 SSL 错误导致函数返回 None ,最终触发 TypeError: cannot unpack non-iterable NoneType object "

结果

再次上传 PDF,可以看到提取结果了,已经完成了今天的既定目标了。

由于模型参数未调优,识别中存在些许问题,非此次分享重点,我们就不再讨论了。

结语

整个过程还是非常顺利的,除了我第一次忘记配置模型镜像下载导致的失败。

之前以为 AI 可以自己 SOLO 代码就很酷了,没想到,AI 都已经可以自己掌控服务器了。

给个目标,就能直接等待验收?那后续技术验证、环境搭建脚本岂不是更轻松了。

当部署、调试、优化也能交给 AI 自主完成后,开发者就有了更多的时间去思考"做什么"而非"怎么做"------这或许才是智能时代的生产力跃迁。

相关推荐
一只叫煤球的猫14 小时前
2025年终总结:我与AI——减少内耗、疯狂学习、享受乐趣
aigc·openai·ai编程
盖世英雄酱5813615 小时前
Java 组长年终总结:靠 AI 提效 50%,25 年搞副业只赚 4k?
后端·程序员·trae
努力的小郑16 小时前
2025年度总结:当我在 Cursor 里敲下 Tab 的那一刻,我知道时代变了
前端·后端·ai编程
薛定谔的猫220 小时前
Cursor 系列(2):使用心得
前端·ai编程·cursor
深念Y20 小时前
仿B站项目 前端 4 首页 顶层导航栏
前端·vue·ai编程·导航栏·bilibili·ai开发
dragonZhang20 小时前
基于 Agent Skills 的 UI 重构实践:从 Demo 到主题化界面的升级之路
前端·ai编程·claude
peterfei20 小时前
当AI编辑器学会了Shell命令:IfAI v0.2.6深度测评与实战指南
ai编程·cursor
神秘的猪头20 小时前
从“抽卡”到“规范驱动”:Vibe Coding 的进化史与计分小程序实战 🚀
ai编程·trae·vibecoding
初次攀爬者1 天前
RAG知识库增强|MinIO集成完整方案
后端·ai编程
undsky1 天前
【n8n教程】:AI Agent节点,构建你的智能自动化机器人
aigc·ai编程