简历填写Agent开发笔记

RT,秋招未遂,试图做一个自动填写简历的Agent,既能提高春招效率,又能作为项目经历写进简历。

考虑到如下方案:

1.获取前端代码,得到表单数据,并将label送入LLM,返回填写内容后进行填写

2.使用OCR识别当前页面字段和对应的bbox,交给LLM判断是否是需要填写的字段并返回填写值

3.使用VLM识别当前页面字段和对应bbox,给出推荐值并进行填写

方案1:表单填写

优点:送入LLM的无关内容少,单次推理速度快

缺点:受到前端代码格式的限制,未必通用所有网页,需要开发油猴脚本

方案2:OCR + LLM

优点:适配各种网页,无需深扒前端代码

缺点:OCR识别全屏区域,传入LLM的无关字段很多,增加推理成本和速度

方案2:VLM

优点:适配各种网页,无需深扒前端代码;无需前置识别操作,开发简单

缺点:VLM输出的bbox偏移严重

相关推荐
AI视觉网奇11 分钟前
huggingface-cli 安装笔记2026
前端·笔记
idontknow2331 小时前
DPDK学习笔记(1):二层转发应用例代码解析
c语言·网络·笔记·学习
求真求知的糖葫芦2 小时前
耦合传输线分析学习笔记(八)对称耦合微带线S参数矩阵推导与应用(上)
笔记·学习·矩阵·射频工程
试试勇气2 小时前
Linux学习笔记(十三)--文件系统
linux·笔记·学习
jrlong2 小时前
DataWhale大模型基础与量化微调task5学习笔记(第 3 章:大模型训练与量化_Deepspeed 框架介绍)
笔记·学习
wdfk_prog3 小时前
[Linux]学习笔记系列 -- [drivers][clk]clk
linux·笔记·学习
ouliten3 小时前
C++笔记:现代C++封装内存池
笔记
m0_736034853 小时前
1.27笔记
linux·服务器·笔记
日更嵌入式的打工仔4 小时前
(实用向)中断服务程序(ISR)的优化方向
笔记·单片机
离离茶4 小时前
【笔记1-11】Qt 关闭QToolbar的拓展菜单
开发语言·笔记·qt