一、前言
最近在 GitHub 上发现了一个非常有意思的项目:GitHub链接。
该作者巧妙地结合 GPT
和 RPA
技术,打造了一个自动投简历助手。这是原作者分享的效果展示视频:B站视频链接。
然而,由于原项目存在以下问题:
- 代码使用 Python 编写,对于前端开发者不够友好。
- 运行该项目需要充值 OpenAI 账户,而且只支持使用国外的信用卡,国内用户想充钱都没地。
- 运行该项目还需要配置代理,对一些用户而言可能不太友好。
折腾无果,遂决定使用 Node.js 重新实现该项目,并且完全免费、一键运行,无需设置代理:GitHub项目地址。
在这个寒冷的招聘季,这个脚本能为您提供一些帮助,为您带来一些温暖。如果您觉得这个项目有价值,希望您能帮忙点个 star,将不胜感激。
二、整体思路
首先,我们会使用 selenium-webdriver 来模拟用户行为,该库是一个强大的自动化测试工具。它能够通过编程方式控制浏览器交互,通常用于自动化测试、网页抓取以及模拟用户交互等任务。
- 用 selenium-webdriver 模拟用户打开浏览器窗口,并导航至直聘网的主页。
- 等待页面加载完成,找到登录按钮的
DOM
节点,模拟用户点击触发登录,等待用户扫码操作。 - 在用户成功扫码登录后,进入招聘信息列表页面。
- 遍历招聘信息列表,对每一项进行以下操作:
- 点击招聘信息,找到该项招聘信息的职位描述信息
- 结合上传的简历信息与招聘信息传递给
GPT
,等待GPT
的响应 - 在
GPT
响应后,点击"立即沟通"按钮,进入沟通聊天界面 - 在聊天界面中找到输入框,将
GPT
返回的信息填入聊天框,并触发发送事件 - 返回招聘信息列表页面,点击下一项招聘信息
- 重复上述步骤,遍历下一项招聘信息的职位描述信息
三、具体实现
3.1、获取免费的 API Key 并初始化 OpenAI 客户端
做过 GPT 开发的应该知道,调用 GPT 的接口是要付费的,而且充值过程异常繁琐,需要使用境外银行卡。
为了简化这个过程,我在 GitCode 上找到了一个提供免费 API_KEY 的项目,只需使用 GitHub 账户登录即可轻松领取。
这样你就可以用免费的 API_KEY
来初始化 OpenAI 客户端。
js
// 初始化OpenAI客户端
const openai = new OpenAI({
// 代理地址,这样国内用户就可以访问了
baseURL: "https://api.chatanywhere.com.cn",
apiKey: "你的apiKey",
});
3.2、模拟用户打开浏览器并前往主页
在这一步中,我们要实现的是打开浏览器并导航至指定的 URL。具体操作就是调用 selenium-webdriver 的 API,直接上代码:
js
const { Builder, By, until } = require("selenium-webdriver");
const chrome = require("selenium-webdriver/chrome");
// 全局 WebDriver 实例
let driver;
// 使用指定的选项打开浏览器
async function openBrowserWithOptions(url, browser) {
const options = new chrome.Options();
options.addArguments("--detach");
if (browser === "chrome") {
// 初始化一个谷歌浏览器客户端
driver = await new Builder()
.forBrowser("chrome")
.setChromeOptions(options)
.build();
// 全屏打开浏览器
await driver.manage().window().maximize();
} else {
throw new Error("不支持的浏览器类型");
}
await driver.get(url);
// 等待直到页面包含登录按钮dom
const loginDom = By.xpath("//*[@id='header']/div[1]/div[3]/div/a");
await driver.wait(until.elementLocated(loginDom), 10000);
}
// 主函数
async function main(url, browserType) {
try {
// 打开浏览器
await openBrowserWithOptions(url, browserType);
} catch (error) {
console.error(`发生错误: ${error}`);
}
}
const url =
"https://www.zhipin.com/web/geek/job-recommend?ka=header-job-recommend";
const browserType = "chrome";
main(url, browserType);
3.3、找到登录按钮的DOM节点并点击
这一步中我们需要找到 登录按钮 的 DOM 节点,然后模拟点击登录。
js
// 省略上一步的代码
// 点击登录按钮,并等待登录成功
async function logIn() {
// 点击登录
const loginButton = await driver.findElement(
By.xpath("//*[@id='header']/div[1]/div[3]/div/a")
);
await loginButton.click();
// 等待微信登录按钮出现
const xpathLocatorWechatLogin =
"//*[@id='wrap']/div/div[2]/div[2]/div[2]/div[1]/div[4]/a";
await driver.wait(
until.elementLocated(By.xpath(xpathLocatorWechatLogin)),
10000
);
const wechatButton = await driver.findElement(
By.xpath("//*[@id='wrap']/div/div[2]/div[2]/div[2]/div[1]/div[4]/a")
);
// 选择微信扫码登录
await wechatButton.click();
const xpathLocatorWechatLogo =
"//*[@id='wrap']/div/div[2]/div[2]/div[1]/div[2]/div[1]/img";
await driver.wait(
until.elementLocated(By.xpath(xpathLocatorWechatLogo)),
10000
);
// 等待用户扫码,登录成功
const xpathLocatorLoginSuccess = "//*[@id='header']/div[1]/div[3]/ul/li[2]/a";
await driver.wait(
until.elementLocated(By.xpath(xpathLocatorLoginSuccess)),
60000
);
}
// 主函数
async function main(url, browserType) {
try {
// 打开浏览器
// 点击登录按钮,并等待登录成功
+ await logIn();
} catch (error) {
console.error(`发生错误: ${error}`);
}
}
3.4、遍历招聘信息列表
登录成功后进入到招聘信息列表页面,这一步中我们需要遍历招聘信息并依次点击,找到每一项招聘信息的职位描述信息,如图所示:
js
// 省略上一步的代码
// 根据索引获取职位描述
async function getJobDescriptionByIndex(index) {
try {
const jobSelector = `//*[@id='wrap']/div[2]/div[2]/div/div/div[1]/ul/li[${index}]`;
const jobElement = await driver.findElement(By.xpath(jobSelector));
// 点击招聘信息列表中的项
await jobElement.click();
// 找到描述信息节点并获取文字
const descriptionSelector =
"//*[@id='wrap']/div[2]/div[2]/div/div/div[2]/div/div[2]/p";
await driver.wait(
until.elementLocated(By.xpath(descriptionSelector)),
10000
);
const jobDescriptionElement = await driver.findElement(
By.xpath(descriptionSelector)
);
return jobDescriptionElement.getText();
} catch (error) {
console.log(`在索引 ${index} 处找不到工作。`);
return null;
}
}
// 主函数
async function main(url, browserType) {
try {
// 打开浏览器
// 点击登录按钮,并等待登录成功
// 开始的索引
+ let jobIndex = 1;
+ while (true) {
+ // 获取对应下标的职位描述
+ const jobDescription = await getJobDescriptionByIndex(jobIndex);
+ console.log(`职位描述信息/n:${jobDescription}`);
+ if (jobDescription) {
+ //
+ }
+ jobIndex += 1;
}
} catch (error) {
console.error(`发生错误: ${error}`);
}
}
接着结合上传的简历信息与招聘信息传递给 GPT
,等待 GPT
的响应:
js
// 省略上一步的代码
// 读取简历信息
const getResumeInfo = () => {
fs.readFile("./简历基本信息.txt", "utf8", (err, data) => {
if (err) {
console.error("读取文件时出错:", err);
return;
}
// 输出文件内容
return data;
});
};
// 与GPT进行聊天的函数
async function chat(jobDescription) {
// 获取简历信息
const resumeInfo = getResumeInfo();
const askMessage = `你好,这是我的简历:${resumeInfo},这是我所应聘公司的要求:${jobDescription}。我希望您能帮我直接给HR写一个礼貌专业的求职新消息,要求能够用专业的语言将简历中的技能结合应聘工作的描述,来阐述自己的优势,尽最大可能打动招聘者。并且请您始终使用中文来进行消息的编写,开头是招聘负责人。这是一封完整的求职信,不要包含求职信内容以外的东西,例如"根据您上传的求职要求和个人简历,我来帮您起草一封求职邮件:"这一类的内容,以便于我直接自动化复制粘贴发送,字数控制在80字左右为宜`;
try {
const completion = await openai.chat.completions.create({
messages: [
{
role: "system",
content: askMessage,
},
],
model: "gpt-3.5-turbo",
});
// 获取gpt返回的信息
const formattedMessage = completion.choices[0].message.content.replace(
/\n/g,
" "
);
return formattedMessage;
} catch (error) {
console.error(`gpt返回时发生错误: ${error}`);
const errorResponse = JSON.stringify({ error: String(error) });
return errorResponse;
}
}
// 主函数
async function main(url, browserType) {
try {
// 打开浏览器
// 点击登录按钮,并等待登录成功
// 开始的索引
while (true) {
// 获取对应下标的职位描述
if (jobDescription) {
// 发送描述到聊天并打印响应
+ const response = await chat(jobDescription);
+ console.log("gpt给的回复", response);
}
jobIndex += 1;
}
} catch (error) {
console.error(`发生错误: ${error}`);
}
}
GPT 响应完成后,找到 立即沟通按钮 并模拟点击,此时进入沟通聊天界面,如图所示:
js
// 省略上一步的代码
// 主函数
async function main(url, browserType) {
try {
// 打开浏览器
// 点击登录按钮,并等待登录成功
// 开始的索引
while (true) {
// 获取对应下标的职位描述
if (jobDescription) {
// 发送描述到聊天并打印响应
// 点击沟通按钮
+ const contactButton = await driver.findElement(
+ By.xpath(
+ "//*[@id='wrap']/div[2]/div[2]/div/div/div[2]/div/div[1]/div[2]/a[2]"
+ )
+ );
+ await contactButton.click();
}
jobIndex += 1;
}
} catch (error) {
console.error(`发生错误: ${error}`);
}
}
此时进入到聊天界面,将 GPT 的返回信息填入到输入框中,触发发送事件。
js
// 省略上一步的代码
// 发送响应到聊天框
async function sendResponseToChatBox(driver, response) {
try {
// 请找到聊天输入框
const chatBox = await driver.findElement(By.xpath("//*[@id='chat-input']"));
// 清除输入框中可能存在的任何文本
await chatBox.clear();
// 将响应粘贴到输入框
await chatBox.sendKeys(response);
await sleep(1000);
// 模拟按下回车键来发送消息
await chatBox.sendKeys(Key.RETURN);
await sleep(2000); // 模拟等待2秒
} catch (error) {
console.error(`发送响应到聊天框时发生错误: ${error}`);
}
}
// 主函数
async function main(url, browserType) {
try {
// 打开浏览器
// 点击登录按钮,并等待登录成功
// 开始的索引
while (true) {
// 获取对应下标的职位描述
if (jobDescription) {
// 发送描述到聊天并打印响应
// 点击沟通按钮
// 等待回复框出现
+ const chatBox = await driver.wait(
+ until.elementLocated(By.xpath("//*[@id='chat-input']")),
+ 10000
+ );
+ // 调用函数发送响应
+ await sendResponseToChatBox(driver, response);
+ // 返回到上一个页面
+ await driver.navigate().back();
+ await sleep(2000); // 模拟等待3秒
}
jobIndex += 1;
}
} catch (error) {
console.error(`发生错误: ${error}`);
}
}
发送完成后返回招聘列表页面,以此往复。
四、最后
该项目只是简单的将简历信息结合职位信息发送给 GPT,然后用 GPT 的回复发送给招聘者,实际上并没有什么难度,意在抛砖引玉。
这里其实还有更优雅的做法,比如将个人简历传给 GPT,让 GPT 去提炼有效信息(原作者就是这么做的)。但由于 GPT-API-free 项目 并没有提供 assistant 服务,实现这一点需要付费,有充值渠道的朋友可以尝试一下。
此外,对于有兴趣的朋友,还可以进一步深挖,例如:
- 根据职位详情进行分词权重分析,生成岗位热点词汇云图,帮助分析简历匹配度
- 自动过滤掉最近未活跃的 Boss 发布的信息,以免浪费每天的 100 次机会
- 设置过滤薪资范围,防止无效投递
- 自动检测上下文,排除【外包、外派、驻场】等字眼的职位信息
- ...
最后,这里重申原作者的观点:
希望不要有人拿着我的脚本割韭菜,都已经被逼到用这种脚本投简历的地步了,还有啥油水可去榨,当个人吧。