简历填写Agent开发笔记

RT,秋招未遂,试图做一个自动填写简历的Agent,既能提高春招效率,又能作为项目经历写进简历。

考虑到如下方案:

1.获取前端代码,得到表单数据,并将label送入LLM,返回填写内容后进行填写

2.使用OCR识别当前页面字段和对应的bbox,交给LLM判断是否是需要填写的字段并返回填写值

3.使用VLM识别当前页面字段和对应bbox,给出推荐值并进行填写

方案1:表单填写

优点:送入LLM的无关内容少,单次推理速度快

缺点:受到前端代码格式的限制,未必通用所有网页,需要开发油猴脚本

方案2:OCR + LLM

优点:适配各种网页,无需深扒前端代码

缺点:OCR识别全屏区域,传入LLM的无关字段很多,增加推理成本和速度

方案2:VLM

优点:适配各种网页,无需深扒前端代码;无需前置识别操作,开发简单

缺点:VLM输出的bbox偏移严重

相关推荐
在坚持一下我可没意见1 天前
Python 修仙修炼录 08:字典秘境,参悟键值玄机
开发语言·笔记·python·入门·字典
凌波粒1 天前
深度学习入门(鱼书)第1章笔记——Python 基础
笔记·python·深度学习
一只机电自动化菜鸟1 天前
一建机电备考笔记(38) 焊接技术—焊接质量检验(含考频+题型)
笔记·学习·职场和发展·生活·学习方法
sheeta19981 天前
LeetCode 每日一题笔记 日期:2026.05.15 题目:153. 寻找旋转排序数组中的最小值
笔记·算法·leetcode
二进制怪兽1 天前
[笔记] 系统分析师 目录
笔记
fanged1 天前
SI/PI基础(TODO)
笔记
xu_wenming1 天前
从熟悉概念到掌控工程——Zephyr 系统级项目实战笔记
笔记
阿萨德528号1 天前
纯前端RSA加密解密工具:基于JSEncrypt的浏览器端数据加解密实践
笔记·密码学
玄米乌龙茶1231 天前
LLM 应用开发学习笔记:RAG 评估、参数调优与 Transformer 注意力机制
笔记·学习
Stark-C1 天前
Obsidian官方同步贵?在NAS上自建服务器,实现多端笔记完美同步
运维·服务器·笔记