简历填写Agent开发笔记

RT,秋招未遂,试图做一个自动填写简历的Agent,既能提高春招效率,又能作为项目经历写进简历。

考虑到如下方案:

1.获取前端代码,得到表单数据,并将label送入LLM,返回填写内容后进行填写

2.使用OCR识别当前页面字段和对应的bbox,交给LLM判断是否是需要填写的字段并返回填写值

3.使用VLM识别当前页面字段和对应bbox,给出推荐值并进行填写

方案1:表单填写

优点:送入LLM的无关内容少,单次推理速度快

缺点:受到前端代码格式的限制,未必通用所有网页,需要开发油猴脚本

方案2:OCR + LLM

优点:适配各种网页,无需深扒前端代码

缺点:OCR识别全屏区域,传入LLM的无关字段很多,增加推理成本和速度

方案2:VLM

优点:适配各种网页,无需深扒前端代码;无需前置识别操作,开发简单

缺点:VLM输出的bbox偏移严重

相关推荐
KhalilRuan11 分钟前
秋招笔记汇总
笔记
laplace012330 分钟前
Part3 RAG文档切分
笔记·python·中间件·langchain·rag
被遗忘的旋律.32 分钟前
Linux驱动开发笔记(二十三)—— regmap
linux·驱动开发·笔记
技术宅学长1 小时前
关于CLS与mean_pooling的一些笔记
人工智能·pytorch·笔记·pycharm
数据轨迹0011 小时前
CVPR DarkIR:低光图像增强与去模糊一体化
经验分享·笔记·facebook·oneapi·twitter
自小吃多2 小时前
爬电距离与电气间隙
笔记·嵌入式硬件·硬件工程
半夏知半秋2 小时前
rust学习-Option与Result
开发语言·笔记·后端·学习·rust
雍凉明月夜3 小时前
深度学习网络笔记Ⅴ(Transformer源码详解)
笔记·深度学习·transformer
week_泽3 小时前
小程序云函数全面总结笔记_5
笔记·小程序
wdfk_prog3 小时前
[Linux]学习笔记系列 -- [fs]read_write
linux·笔记·学习