AI使用小技巧: 用zed和MinerU本地版,同时学习PDF文档的文字和图片

mineru本地版,它不需要配置大模型,它是直接用cpu跑vlm模型的,vlm模型已经内置到mineru软件里了,所以不需要额外配置大模型,转文档给ai用很好,可以用来同时识别图片和文本。(转出来有图片,图片和文档的正文都存在了本地,图片在一个单独的images文件夹下,被转好后的正文引用本地图片路径;然后加一个agent,打开转好文档的目录,里面有转好后的正文文本,和images子文件夹,我这里用zed里面自己的zed agent,加支持图片的模型,我这里用Gemma4 26b a4b,就可以同时识别图片和文字了)

相关推荐
wengqidaifeng1 小时前
2. OpenClaw 架构落地指南:部署、渠道集成与安全边界全解
安全·ai·架构·openclaw
星辰AI1 小时前
告别翻译腔:用 AI Agent 自动化构建开源项目的多语言技术文档
人工智能·ai·语言模型
海盗12342 小时前
C#中PDF操作-QuestPDF页面设置与布局
java·pdf·c#
Sven在流浪2 小时前
LLamafactory Qlora微调 实战
ai·模型微调
带娃的IT创业者2 小时前
单比特奇迹:如何在本地设备运行 4B 图像生成模型?
ai·图像生成·模型量化·本地部署·低资源推理
IvanCodes2 小时前
Agent开发入门:提示词工程
人工智能·agent
麦哲思科技任甲林2 小时前
白话Skills之七:编写AI Skill的原则
人工智能·prompt·agent·ai编程·skills
玩c#的小杜同学2 小时前
一周 AI 新鲜事|2026.05.25—2026.05.31
人工智能·程序人生·ai·c#·程序员创富
海兰2 小时前
【文字三国志:第九篇】天命重构,游戏本地部署
游戏·ai