给 TRAE SOLO 一台服务器,它能干什么?

传送锚点

前一阵子刷到一个很有意思的操作:有人直接把一台服务器的权限扔给了 AI,并简单说了句目标。

然后,AI 就从零开始安装环境、配依赖,拉仓库,启动服务,最后成功完成了对外服务的提供。

今天,我们就尝试下这个思路:让 TRAE SOLO 自行在远程服务器中搭建一套 MinerU 环境。

MinerU

首先,简单介绍下 MinerU

MinerU 是一款能将PDF/图片转换为机器可读格式(例如 markdownJSON)的工具,诞生于上海人工智能实验室出品大模型 InternLM 的预训练过程中。

核心特性:

  • 多模态文档解析:支持多种文档类型,包括扫描版 PDF

  • 结构化还原:可识别表格、公式、分子式等

  • 高保真语义理解:利用布局分析和阅读顺序推理,避免传统 OCR 机械识别导致的逻辑错乱。

  • 本地化 & 开源免费:全部模型和代码开源,可私有部署,无需调用外部 API,保障数据隐私。

共绩算力

AI 要部署的应用已经了解了,现在需要给 AI 找一个可以操作的服务器。

最近我使用的算力平台是"共绩算力",RTX 4090 只要 1.68 元/小时,还能按毫秒计费、自动扩容,非常便于我根据研究的模型挑选合适的节点配置。

尤其是目前,平台还有福利,注册就送算力券。

实操记录

节点建立

注册并登录"共绩算力"平台。

在"云主机"页面选择合适的节点

选择合适的节点类型后,配置相关镜像、存储等,我这里配置了"基础镜像",由于是测试搭建模型,未配置相关存储。

如果是第一次租用,账户余额为 0,会要求充值一下(0.01元即可),然后,需要在个人中心关注下公众号,这些按照页面提示进行即可。

租用成功后,会在"控制台"-"云主机列表"中看到租用的节点。

24G 显存、63G 内存,1小时 1.68 元,并且有算力券抵扣,还很合适的。

远程连接

第一步,我们先来调整下 SSH 连接的命令,让其支持端口映射,方便访问 demo。

在上一步的"云主机列表"-"SSH登录信息"中,复制出登录指令,格式如下。

plain 复制代码
ssh root@hdy1.550c.cloud -p 40002

增加端口映射参数。

plain 复制代码
ssh -vvN -L 7860:127.0.0.1:7860 root@hdy1.550c.cloud -p 40002

其中 7860MinerU demo 的服务端口。

第二步,我们打开 TRAE 进行远程连接。

输入上面的指令,回车即可。

此时会要求录入密码,再次从"云主机列表"-"SSH登录信息"中复制"登录密码"即可。

如果同一地址连接多次,可能会在 SSH 连接中生成多个相同的 Host,此时会出现登录失败的情况,手动删除重复的 Host 即可。

成功连接后,终端信息如下。

正常情况下可以在编辑器中打开远程文件夹,也可以在终端执行命令了。

但今天,我们都交给 AI。

环境部署

开发环境:国际版 SOLO Coder 智能体,未选择 Plan 模式。

直接在 Chat 窗口录入如下指令,等待完成。

指令

指令非常简单,让 AI 参考 MinerU 官方仓库文档,自行完成部署。

因为模型下载涉及到 HuggingFace 的网络问题,一般各大算力企业都会提供镜像内容,这里把"共绩算力"的镜像文档也放上了。

plain 复制代码
参考github文档https://github.com/opendatalab/mineru?tab=readme-ov-file ,帮我完成mineru的安装,并完成demo启动。
云服务器文档:https://www.gongjiyun.com/docs/server/introduction/rznmwsy13i4a8yktuyycoxyinmg/ 

过程

过程很清晰:安装依赖、下载模型、启动Demo。

后面还有详细的安装步骤、网络加速与镜像建议、常用参数与优化、问题排查、后续可选增强等内容,便于我们回顾审阅。

SOLO 模式的好处就是中间遇到问题,它可以自行解决。

最后还给出了 demo 的访问方式。

结果

命令执行完成后,SOLO 内置浏览器已经帮我把 demo 打开了。

这里可以通过 http://localhost:7860/ 访问到服务器,就是因为"远程连接"章节中的 SSH 命令中增加了端口映射。

调试优化

上面跑起来的 demo,上传测试的 PDF 后,转换报错。

不着急,我们直接让 SOLO 帮忙修复下。

指令

plain 复制代码
demo中上传后报错,请帮我修复

过程

SOLO 可以从终端中获取错误信息,快速定位问题:

"上传解析时报错的根因是 Gradio 处理流程在解析时尝试访问 HuggingFace 获取模型元数据,出现 SSL 错误导致函数返回 None ,最终触发 TypeError: cannot unpack non-iterable NoneType object "

结果

再次上传 PDF,可以看到提取结果了,已经完成了今天的既定目标了。

er由于模型参数未调优,识别中存在些许问题,非此次分享重点,我们就不再讨论了。

结语

整个过程还是非常顺利的,除了我第一次忘记配置模型镜像下载导致的失败。

之前以为 AI 可以自己 SOLO 代码就很酷了,没想到,AI 都已经可以自己掌控服务器了。

给个目标,就能直接等待验收?那后续技术验证、环境搭建脚本岂不是更轻松了。

当部署、调试、优化也能交给 AI 自主完成后,开发者就有了更多的时间去思考"做什么"而非"怎么做"------这或许才是智能时代的生产力跃迁。

相关推荐
DKunYu2 小时前
3.负载均衡-LoadBalance
java·运维·spring cloud·微服务·负载均衡
2401_831501732 小时前
Devops之Docker安装和使用
运维·docker·devops
码界奇点2 小时前
基于Django与Zabbix集成的运维故障管理系统设计与实现
运维·django·毕业设计·zabbix·源代码管理
longxibo2 小时前
Ubuntu datasophon1.2.1 二开之二:解决三大监控组件安装后,启动失败:报缺失common.sh
大数据·linux·运维·ubuntu
小尧嵌入式2 小时前
Linux的shell命令
linux·运维·服务器·数据库·c++·windows·算法
码界奇点2 小时前
基于Django与Ansible的自动化运维管理系统设计与实现
运维·python·django·毕业设计·ansible·源代码管理
OnlyEasyCode2 小时前
.net程序部署Linux运行
linux·运维·服务器
kobe_OKOK_2 小时前
在 Ubuntu Server 24.04 (Noble)** 上安装 **SQL Server 驱动程序
linux·运维·ubuntu
星哥说事2 小时前
Zabbix与Prometheus在服务器及网络设备管理中的应用
服务器·zabbix·prometheus