AI使用小技巧: 用zed和MinerU本地版,同时学习PDF文档的文字和图片

mineru本地版,它不需要配置大模型,它是直接用cpu跑vlm模型的,vlm模型已经内置到mineru软件里了,所以不需要额外配置大模型,转文档给ai用很好,可以用来同时识别图片和文本。(转出来有图片,图片和文档的正文都存在了本地,图片在一个单独的images文件夹下,被转好后的正文引用本地图片路径;然后加一个agent,打开转好文档的目录,里面有转好后的正文文本,和images子文件夹,我这里用zed里面自己的zed agent,加支持图片的模型,我这里用Gemma4 26b a4b,就可以同时识别图片和文字了)

相关推荐
沉默王二43 分钟前
无限期免费,Token 随便用,舒服啊!
agent·ai编程
老梁agent1 小时前
Agent 如何看懂时序数据?时间序列查询的 Tool 设计模式
物联网·agent
嘻嘻仙人1 小时前
Python 开发者的性能革命:为什么你应该从 pip 转向 uv?
llm·agent
付玉祥1 小时前
InferenceStage 的运行流程:推理与工具执行循环
agent
universeplayer1 小时前
我给 AI Agent 装了个飞机黑匣子:录下每一次 LLM 调用,崩了能确定性回放
llm·agent
Hector_zh1 小时前
实战·第八篇:当模型陷入死循环——FACA破解JSON生成的架构陷阱
人工智能·agent·vibecoding
嘻嘻仙人2 小时前
Claude Code CLI 实战案例——不同场景案例实操
agent
codedx3 小时前
LangChain 和 LangGraph 构建的 Agent 项目模版
后端·langchain·agent
小七-七牛开发者3 小时前
周一上线 | SpaceX 收购 Cursor、支付宝进入 AI 时代、DeepSeek 完成 500 亿元融资
ai·agent·token·glm·智谱·claudecode·ai coding·周一上线