简历填写Agent开发笔记

RT,秋招未遂,试图做一个自动填写简历的Agent,既能提高春招效率,又能作为项目经历写进简历。

考虑到如下方案:

1.获取前端代码,得到表单数据,并将label送入LLM,返回填写内容后进行填写

2.使用OCR识别当前页面字段和对应的bbox,交给LLM判断是否是需要填写的字段并返回填写值

3.使用VLM识别当前页面字段和对应bbox,给出推荐值并进行填写

方案1:表单填写

优点:送入LLM的无关内容少,单次推理速度快

缺点:受到前端代码格式的限制,未必通用所有网页,需要开发油猴脚本

方案2:OCR + LLM

优点:适配各种网页,无需深扒前端代码

缺点:OCR识别全屏区域,传入LLM的无关字段很多,增加推理成本和速度

方案2:VLM

优点:适配各种网页,无需深扒前端代码;无需前置识别操作,开发简单

缺点:VLM输出的bbox偏移严重

相关推荐
RainCity4 天前
Java Swing 自定义组件库分享(十二)
java·笔记·后端
LinXunFeng12 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
闪闪发亮的小星星16 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq16 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波16 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.16 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
.千余16 天前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.16 天前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
秋波。未央16 天前
Java Agent 开发 · Day 1 学习笔记(含作业完整标准答案)
java·笔记·学习
中屹指纹浏览器16 天前
2026指纹浏览器字体指纹、字体渲染偏差检测与全维度虚拟字体池搭建方案
经验分享·笔记