简历填写Agent开发笔记

LastWhisperw2025-11-22 13:53

RT，秋招未遂，试图做一个自动填写简历的Agent，既能提高春招效率，又能作为项目经历写进简历。

考虑到如下方案：

1.获取前端代码，得到表单数据，并将label送入LLM，返回填写内容后进行填写

2.使用OCR识别当前页面字段和对应的bbox，交给LLM判断是否是需要填写的字段并返回填写值

3.使用VLM识别当前页面字段和对应bbox，给出推荐值并进行填写

方案1：表单填写

优点：送入LLM的无关内容少，单次推理速度快

缺点：受到前端代码格式的限制，未必通用所有网页，需要开发油猴脚本

方案2：OCR + LLM

优点：适配各种网页，无需深扒前端代码

缺点：OCR识别全屏区域，传入LLM的无关字段很多，增加推理成本和速度

方案2：VLM

优点：适配各种网页，无需深扒前端代码；无需前置识别操作，开发简单

缺点：VLM输出的bbox偏移严重

上一篇：【Unity】TextMeshPro富文本中使用精灵图集

下一篇：区块链在数字版权保护中的应用与挑战：破解版权侵权的技术革命

热门推荐

012026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 02GitHub 镜像站点 03【AI】2026 年具身智能模型和世界模型总结 042026年6月AI大模型全景报告：GPT-5.6、Claude Opus 4.8、Gemini 3.5，中美AI三足鼎立谁主沉浮？052026 AI 编程工具终极实战指南：Cursor vs Claude Code vs Copilot，开发者该怎么选？06Claude Code、Codex、Cursor三分天下：2026年AI编程Agent生态全景剖析 072026年6月AI行业全景：从百模大战到Agent元年，这30天发生了什么？082026 年 AI 大模型 & AI 编程工具实战全总结 09Trae国际版与国内版深度测评：AI原生IDE的双生花 10AI科技热点日报 | 2026年07月01日