简历填写Agent开发笔记

RT,秋招未遂,试图做一个自动填写简历的Agent,既能提高春招效率,又能作为项目经历写进简历。

考虑到如下方案:

1.获取前端代码,得到表单数据,并将label送入LLM,返回填写内容后进行填写

2.使用OCR识别当前页面字段和对应的bbox,交给LLM判断是否是需要填写的字段并返回填写值

3.使用VLM识别当前页面字段和对应bbox,给出推荐值并进行填写

方案1:表单填写

优点:送入LLM的无关内容少,单次推理速度快

缺点:受到前端代码格式的限制,未必通用所有网页,需要开发油猴脚本

方案2:OCR + LLM

优点:适配各种网页,无需深扒前端代码

缺点:OCR识别全屏区域,传入LLM的无关字段很多,增加推理成本和速度

方案2:VLM

优点:适配各种网页,无需深扒前端代码;无需前置识别操作,开发简单

缺点:VLM输出的bbox偏移严重

相关推荐
YJlio1 天前
进程和诊断工具学习笔记(8.24):Handle——谁占着不放?句柄泄漏排查、强制解锁与检索技巧
服务器·笔记·学习
IUGEI1 天前
【后端开发笔记】JVM底层原理-内存结构篇
java·jvm·笔记·后端
wdfk_prog1 天前
[Linux]学习笔记系列 -- [kernel]trace
linux·笔记·学习
charlie1145141911 天前
勇闯前后端Week2:后端基础——HTTP与REST
开发语言·网络·笔记·网络协议·学习·http
走在路上的菜鸟1 天前
Android学Dart学习笔记第四节 基本类型
android·笔记·学习
未若君雅裁1 天前
斐波那契数列 - 动态规划实现 详解笔记
java·数据结构·笔记·算法·动态规划·代理模式
wdfk_prog1 天前
[Linux]学习笔记系列 -- [kernel]sysctl
linux·笔记·学习
moringlightyn2 天前
Linux---进程状态
linux·运维·服务器·笔记·操作系统·c·进程状态
go_bai2 天前
Linux-线程2
linux·c++·经验分享·笔记·学习方法