给 TRAE SOLO 一台服务器,它能干什么?

前一阵子刷到一个很有意思的操作:有人直接把一台服务器的权限扔给了 AI,并简单说了句目标。

然后,AI 就从零开始安装环境、配依赖,拉仓库,启动服务,最后成功完成了对外服务的提供。

今天,我们就尝试下这个思路:让 TRAE SOLO 自行在远程服务器中搭建一套 MinerU 环境。

MinerU

首先,简单介绍下 MinerU

MinerU 是一款能将PDF/图片转换为机器可读格式 (例如 markdownJSON)的工具,诞生于上海人工智能实验室出品大模型 InternLM 的预训练过程中。

核心特性:

  • 多模态文档解析:支持多种文档类型,包括扫描版 PDF
  • 结构化还原:可识别表格、公式、分子式等
  • 高保真语义理解:利用布局分析和阅读顺序推理,避免传统 OCR 机械识别导致的逻辑错乱。
  • 本地化 & 开源免费:全部模型和代码开源,可私有部署,无需调用外部 API,保障数据隐私。

共绩算力

AI 要部署的应用已经了解了,现在需要给 AI 找一个可以操作的服务器。

最近我使用的算力平台是"共绩算力",RTX 4090 只要 1.68 元/小时,还能按毫秒计费、自动扩容,非常便于我根据研究的模型挑选合适的节点配置。

尤其是目前,平台还有福利,注册就送算力券

实操记录

节点建立

注册并登录"共绩算力"平台。

在"云主机"页面选择合适的节点

选择合适的节点类型后,配置相关镜像、存储等,我这里配置了"基础镜像",由于是测试搭建模型,未配置相关存储。

如果是第一次租用,账户余额为 0,会要求充值一下(0.01元即可),然后,需要在个人中心关注下公众号,这些按照页面提示进行即可。

租用成功后,会在"控制台"-"云主机列表"中看到租用的节点。

24G 显存、63G 内存,1小时 1.68 元,并且有算力券抵扣,还很合适的。

远程连接

第一步 ,我们先来调整下 SSH 连接的命令,让其支持端口映射,方便访问 demo。

在上一步的"云主机列表"-"SSH登录信息"中,复制出登录指令,格式如下。

css 复制代码
ssh root@hdy1.550c.cloud -p 40002

增加端口映射参数

java 复制代码
ssh -vvN -L 7860:127.0.0.1:7860 root@hdy1.550c.cloud -p 40002

其中 7860MinerU demo 的服务端口。

第二步 ,我们打开 TRAE 进行远程连接。

输入上面的指令,回车即可。

此时会要求录入密码,再次从"云主机列表"-"SSH登录信息"中复制"登录密码"即可。

如果同一地址连接多次,可能会在 SSH 连接中生成多个相同的 Host,此时会出现登录失败的情况,手动删除重复的 Host 即可。

成功连接后,终端信息如下。

正常情况下可以在编辑器中打开远程文件夹,也可以在终端执行命令了。

但今天,我们都交给 AI。

环境部署

开发环境:国际版 SOLO Coder 智能体,未选择 Plan 模式。

直接在 Chat 窗口录入如下指令,等待完成。

指令

指令非常简单,让 AI 参考 MinerU 官方仓库文档,自行完成部署。

因为模型下载涉及到 HuggingFace 的网络问题,一般各大算力企业都会提供镜像内容,这里把"共绩算力"的镜像文档也放上了。

ruby 复制代码
参考github文档https://github.com/opendatalab/mineru?tab=readme-ov-file ,帮我完成mineru的安装,并完成demo启动。
云服务器文档:https://www.gongjiyun.com/docs/server/introduction/rznmwsy13i4a8yktuyycoxyinmg/ 

过程

过程很清晰:安装依赖、下载模型、启动Demo。

后面还有详细的安装步骤、网络加速与镜像建议、常用参数与优化、问题排查、后续可选增强等内容,便于我们回顾审阅。

SOLO 模式的好处就是中间遇到问题,它可以自行解决

最后还给出了 demo 的访问方式。

结果

命令执行完成后,SOLO 内置浏览器已经帮我把 demo 打开了。

这里可以通过 http://localhost:7860/ 访问到服务器,就是因为"远程连接"章节中的 SSH 命令中增加了端口映射。

调试优化

上面跑起来的 demo,上传测试的 PDF 后,转换报错。

不着急,我们直接让 SOLO 帮忙修复下。

指令

复制代码
demo中上传后报错,请帮我修复

过程

SOLO 可以从终端中获取错误信息,快速定位问题:

"上传解析时报错的根因是 Gradio 处理流程在解析时尝试访问 HuggingFace 获取模型元数据,出现 SSL 错误导致函数返回 None ,最终触发 TypeError: cannot unpack non-iterable NoneType object "

结果

再次上传 PDF,可以看到提取结果了,已经完成了今天的既定目标了。

由于模型参数未调优,识别中存在些许问题,非此次分享重点,我们就不再讨论了。

结语

整个过程还是非常顺利的,除了我第一次忘记配置模型镜像下载导致的失败。

之前以为 AI 可以自己 SOLO 代码就很酷了,没想到,AI 都已经可以自己掌控服务器了。

给个目标,就能直接等待验收?那后续技术验证、环境搭建脚本岂不是更轻松了。

当部署、调试、优化也能交给 AI 自主完成后,开发者就有了更多的时间去思考"做什么"而非"怎么做"------这或许才是智能时代的生产力跃迁。

相关推荐
程序员老刘·1 天前
Android Studio Otter 3 发布:日常开发选AS还是Cursor?
flutter·android studio·ai编程·跨平台开发·客户端开发
hampeter1 天前
【填坑指南】Trae/VS Code 远程连接 Ubuntu,终端总是自动激活特定的 Conda 环境?三招教你彻底解决!
linux·ubuntu·conda·trae
JMchen1231 天前
AI编程范式转移:深度解析人机协同编码的实战进阶与未来架构
人工智能·经验分享·python·深度学习·架构·pycharm·ai编程
HetFrame1 天前
大模型驱动的禅道任务自动化规划与创建
python·ai·自动化·大模型·ai编程·任务·禅道
Ashley_Amanda2 天前
主流AI编程工具深度解析
ai编程
代码匠心2 天前
Trae IDE 隐藏玩法:接入即梦 AI,生成高质量大片!
人工智能·ai·trae·skills
GISer_Jing2 天前
构建高性能Markdown引擎开发计划
前端·aigc·ai编程
Horizon_Ruan2 天前
从零开始掌握AI:LLM、RAG到Agent的完整学习路线图
人工智能·学习·ai编程
Testopia2 天前
AI编程实例 -- 数据可视化实战教程
人工智能·信息可视化·ai编程