简历填写Agent开发笔记

RT,秋招未遂,试图做一个自动填写简历的Agent,既能提高春招效率,又能作为项目经历写进简历。

考虑到如下方案:

1.获取前端代码,得到表单数据,并将label送入LLM,返回填写内容后进行填写

2.使用OCR识别当前页面字段和对应的bbox,交给LLM判断是否是需要填写的字段并返回填写值

3.使用VLM识别当前页面字段和对应bbox,给出推荐值并进行填写

方案1:表单填写

优点:送入LLM的无关内容少,单次推理速度快

缺点:受到前端代码格式的限制,未必通用所有网页,需要开发油猴脚本

方案2:OCR + LLM

优点:适配各种网页,无需深扒前端代码

缺点:OCR识别全屏区域,传入LLM的无关字段很多,增加推理成本和速度

方案2:VLM

优点:适配各种网页,无需深扒前端代码;无需前置识别操作,开发简单

缺点:VLM输出的bbox偏移严重

相关推荐
亭台33 分钟前
【Matlab笔记_23】MATLAB的工具包m_map的m_image和m_pcolor区别
笔记·算法·matlab
Jack___Xue1 小时前
LangChain实战快速入门笔记(五)--LangChain使用之Tools
笔记·microsoft·langchain
走在路上的菜鸟2 小时前
Android学Dart学习笔记第十三节 注解
android·笔记·学习·flutter
hhy_smile3 小时前
Android 与 java 设计笔记
android·java·笔记
YJlio3 小时前
BgInfo 学习笔记(11.5):多种输出方式(壁纸 / 剪贴板 / 文件)与“更新其他桌面”实战
笔记·学习·c#
断剑zou天涯4 小时前
【算法笔记】线段树SegmentTree
数据结构·笔记·算法
自不量力的A同学4 小时前
ionet 25.2 发布
笔记
YJlio4 小时前
桌面工具学习笔记(11.4):BgInfo + Desktops + ZoomIt 组合拳——演示与排障环境一键到位
笔记·学习·自动化
玩具猴_wjh4 小时前
12.15 学习笔记
笔记·学习
福尔摩斯张5 小时前
TCP协议深度解析:从报文格式到连接管理(超详细)
linux·c语言·网络·c++·笔记·网络协议·tcp/ip