给 TRAE SOLO 一台服务器,它能干什么?

传送锚点

前一阵子刷到一个很有意思的操作:有人直接把一台服务器的权限扔给了 AI,并简单说了句目标。

然后,AI 就从零开始安装环境、配依赖,拉仓库,启动服务,最后成功完成了对外服务的提供。

今天,我们就尝试下这个思路:让 TRAE SOLO 自行在远程服务器中搭建一套 MinerU 环境。

MinerU

首先,简单介绍下 MinerU

MinerU 是一款能将PDF/图片转换为机器可读格式(例如 markdownJSON)的工具,诞生于上海人工智能实验室出品大模型 InternLM 的预训练过程中。

核心特性:

  • 多模态文档解析:支持多种文档类型,包括扫描版 PDF

  • 结构化还原:可识别表格、公式、分子式等

  • 高保真语义理解:利用布局分析和阅读顺序推理,避免传统 OCR 机械识别导致的逻辑错乱。

  • 本地化 & 开源免费:全部模型和代码开源,可私有部署,无需调用外部 API,保障数据隐私。

共绩算力

AI 要部署的应用已经了解了,现在需要给 AI 找一个可以操作的服务器。

最近我使用的算力平台是"共绩算力",RTX 4090 只要 1.68 元/小时,还能按毫秒计费、自动扩容,非常便于我根据研究的模型挑选合适的节点配置。

尤其是目前,平台还有福利,注册就送算力券。

实操记录

节点建立

注册并登录"共绩算力"平台。

在"云主机"页面选择合适的节点

选择合适的节点类型后,配置相关镜像、存储等,我这里配置了"基础镜像",由于是测试搭建模型,未配置相关存储。

如果是第一次租用,账户余额为 0,会要求充值一下(0.01元即可),然后,需要在个人中心关注下公众号,这些按照页面提示进行即可。

租用成功后,会在"控制台"-"云主机列表"中看到租用的节点。

24G 显存、63G 内存,1小时 1.68 元,并且有算力券抵扣,还很合适的。

远程连接

第一步,我们先来调整下 SSH 连接的命令,让其支持端口映射,方便访问 demo。

在上一步的"云主机列表"-"SSH登录信息"中,复制出登录指令,格式如下。

plain 复制代码
ssh root@hdy1.550c.cloud -p 40002

增加端口映射参数。

plain 复制代码
ssh -vvN -L 7860:127.0.0.1:7860 root@hdy1.550c.cloud -p 40002

其中 7860MinerU demo 的服务端口。

第二步,我们打开 TRAE 进行远程连接。

输入上面的指令,回车即可。

此时会要求录入密码,再次从"云主机列表"-"SSH登录信息"中复制"登录密码"即可。

如果同一地址连接多次,可能会在 SSH 连接中生成多个相同的 Host,此时会出现登录失败的情况,手动删除重复的 Host 即可。

成功连接后,终端信息如下。

正常情况下可以在编辑器中打开远程文件夹,也可以在终端执行命令了。

但今天,我们都交给 AI。

环境部署

开发环境:国际版 SOLO Coder 智能体,未选择 Plan 模式。

直接在 Chat 窗口录入如下指令,等待完成。

指令

指令非常简单,让 AI 参考 MinerU 官方仓库文档,自行完成部署。

因为模型下载涉及到 HuggingFace 的网络问题,一般各大算力企业都会提供镜像内容,这里把"共绩算力"的镜像文档也放上了。

plain 复制代码
参考github文档https://github.com/opendatalab/mineru?tab=readme-ov-file ,帮我完成mineru的安装,并完成demo启动。
云服务器文档:https://www.gongjiyun.com/docs/server/introduction/rznmwsy13i4a8yktuyycoxyinmg/ 

过程

过程很清晰:安装依赖、下载模型、启动Demo。

后面还有详细的安装步骤、网络加速与镜像建议、常用参数与优化、问题排查、后续可选增强等内容,便于我们回顾审阅。

SOLO 模式的好处就是中间遇到问题,它可以自行解决。

最后还给出了 demo 的访问方式。

结果

命令执行完成后,SOLO 内置浏览器已经帮我把 demo 打开了。

这里可以通过 http://localhost:7860/ 访问到服务器,就是因为"远程连接"章节中的 SSH 命令中增加了端口映射。

调试优化

上面跑起来的 demo,上传测试的 PDF 后,转换报错。

不着急,我们直接让 SOLO 帮忙修复下。

指令

plain 复制代码
demo中上传后报错,请帮我修复

过程

SOLO 可以从终端中获取错误信息,快速定位问题:

"上传解析时报错的根因是 Gradio 处理流程在解析时尝试访问 HuggingFace 获取模型元数据,出现 SSL 错误导致函数返回 None ,最终触发 TypeError: cannot unpack non-iterable NoneType object "

结果

再次上传 PDF,可以看到提取结果了,已经完成了今天的既定目标了。

er由于模型参数未调优,识别中存在些许问题,非此次分享重点,我们就不再讨论了。

结语

整个过程还是非常顺利的,除了我第一次忘记配置模型镜像下载导致的失败。

之前以为 AI 可以自己 SOLO 代码就很酷了,没想到,AI 都已经可以自己掌控服务器了。

给个目标,就能直接等待验收?那后续技术验证、环境搭建脚本岂不是更轻松了。

当部署、调试、优化也能交给 AI 自主完成后,开发者就有了更多的时间去思考"做什么"而非"怎么做"------这或许才是智能时代的生产力跃迁。

相关推荐
AI逐月21 小时前
tmux 常用命令总结:从入门到稳定使用的一篇实战博客
linux·服务器·ssh·php
想逃离铁厂的老铁21 小时前
Day55 >> 并查集理论基础 + 107、寻找存在的路线
java·服务器
小白跃升坊21 小时前
基于1Panel的AI运维
linux·运维·人工智能·ai大模型·教学·ai agent
杨江21 小时前
seafile docker安装说明
运维
舰长11521 小时前
linux 实现文件共享的实现方式比较
linux·服务器·网络
好好沉淀1 天前
Docker开发笔记(详解)
运维·docker·容器
zmjjdank1ng1 天前
Linux 输出重定向
linux·运维
路由侠内网穿透.1 天前
本地部署智能家居集成解决方案 ESPHome 并实现外部访问( Linux 版本)
linux·运维·服务器·网络协议·智能家居
树℡独1 天前
ns-3仿真之应用层(三)
运维·服务器·ns3
VekiSon1 天前
Linux内核驱动——基础概念与开发环境搭建
linux·运维·服务器·c语言·arm开发