前一阵子刷到一个很有意思的操作:有人直接把一台服务器的权限扔给了 AI,并简单说了句目标。
然后,AI 就从零开始安装环境、配依赖,拉仓库,启动服务,最后成功完成了对外服务的提供。
今天,我们就尝试下这个思路:让 TRAE SOLO 自行在远程服务器中搭建一套 MinerU 环境。
MinerU
首先,简单介绍下 MinerU。

MinerU 是一款能将PDF/图片转换为机器可读格式 (例如 markdown、JSON)的工具,诞生于上海人工智能实验室出品大模型 InternLM 的预训练过程中。
核心特性:
- 多模态文档解析:支持多种文档类型,包括扫描版 PDF
- 结构化还原:可识别表格、公式、分子式等
- 高保真语义理解:利用布局分析和阅读顺序推理,避免传统 OCR 机械识别导致的逻辑错乱。
- 本地化 & 开源免费:全部模型和代码开源,可私有部署,无需调用外部 API,保障数据隐私。
共绩算力
AI 要部署的应用已经了解了,现在需要给 AI 找一个可以操作的服务器。
最近我使用的算力平台是"共绩算力",RTX 4090 只要 1.68 元/小时,还能按毫秒计费、自动扩容,非常便于我根据研究的模型挑选合适的节点配置。
尤其是目前,平台还有福利,注册就送算力券。
实操记录
节点建立
注册并登录"共绩算力"平台。
在"云主机"页面选择合适的节点

选择合适的节点类型后,配置相关镜像、存储等,我这里配置了"基础镜像",由于是测试搭建模型,未配置相关存储。

如果是第一次租用,账户余额为 0,会要求充值一下(0.01元即可),然后,需要在个人中心关注下公众号,这些按照页面提示进行即可。
租用成功后,会在"控制台"-"云主机列表"中看到租用的节点。

24G 显存、63G 内存,1小时 1.68 元,并且有算力券抵扣,还很合适的。
远程连接
第一步 ,我们先来调整下 SSH 连接的命令,让其支持端口映射,方便访问 demo。
在上一步的"云主机列表"-"SSH登录信息"中,复制出登录指令,格式如下。
css
ssh root@hdy1.550c.cloud -p 40002
增加端口映射参数。
java
ssh -vvN -L 7860:127.0.0.1:7860 root@hdy1.550c.cloud -p 40002
其中 7860 是 MinerU demo 的服务端口。
第二步 ,我们打开 TRAE 进行远程连接。

输入上面的指令,回车即可。
此时会要求录入密码,再次从"云主机列表"-"SSH登录信息"中复制"登录密码"即可。
如果同一地址连接多次,可能会在 SSH 连接中生成多个相同的 Host,此时会出现登录失败的情况,手动删除重复的 Host 即可。
成功连接后,终端信息如下。

正常情况下可以在编辑器中打开远程文件夹,也可以在终端执行命令了。
但今天,我们都交给 AI。
环境部署
开发环境:国际版 SOLO Coder 智能体,未选择 Plan 模式。
直接在 Chat 窗口录入如下指令,等待完成。
指令
指令非常简单,让 AI 参考 MinerU 官方仓库文档,自行完成部署。
因为模型下载涉及到 HuggingFace 的网络问题,一般各大算力企业都会提供镜像内容,这里把"共绩算力"的镜像文档也放上了。
ruby
参考github文档https://github.com/opendatalab/mineru?tab=readme-ov-file ,帮我完成mineru的安装,并完成demo启动。
云服务器文档:https://www.gongjiyun.com/docs/server/introduction/rznmwsy13i4a8yktuyycoxyinmg/
过程
过程很清晰:安装依赖、下载模型、启动Demo。

后面还有详细的安装步骤、网络加速与镜像建议、常用参数与优化、问题排查、后续可选增强等内容,便于我们回顾审阅。
SOLO 模式的好处就是中间遇到问题,它可以自行解决。

最后还给出了 demo 的访问方式。

结果
命令执行完成后,SOLO 内置浏览器已经帮我把 demo 打开了。

这里可以通过 http://localhost:7860/ 访问到服务器,就是因为"远程连接"章节中的 SSH 命令中增加了端口映射。
调试优化
上面跑起来的 demo,上传测试的 PDF 后,转换报错。
不着急,我们直接让 SOLO 帮忙修复下。
指令
demo中上传后报错,请帮我修复
过程
SOLO 可以从终端中获取错误信息,快速定位问题:
"上传解析时报错的根因是 Gradio 处理流程在解析时尝试访问 HuggingFace 获取模型元数据,出现 SSL 错误导致函数返回 None ,最终触发 TypeError: cannot unpack non-iterable NoneType object "

结果
再次上传 PDF,可以看到提取结果了,已经完成了今天的既定目标了。

由于模型参数未调优,识别中存在些许问题,非此次分享重点,我们就不再讨论了。
结语
整个过程还是非常顺利的,除了我第一次忘记配置模型镜像下载导致的失败。
之前以为 AI 可以自己 SOLO 代码就很酷了,没想到,AI 都已经可以自己掌控服务器了。
给个目标,就能直接等待验收?那后续技术验证、环境搭建脚本岂不是更轻松了。
当部署、调试、优化也能交给 AI 自主完成后,开发者就有了更多的时间去思考"做什么"而非"怎么做"------这或许才是智能时代的生产力跃迁。