dp自动化登陆之hCaptcha 验证码

hCaptcha 是一种常见的验证码服务,用于区分人类用户和自动化程序。由于其基于图像识别和行为分析,下面介绍如何使用自动化点击验证码完成登陆。

思路:登陆目标网站触发验证码,截图并发给打码平台返回坐标,模拟人工点击完成验证

1、注册识别 hCaptcha API,获取授权

python 复制代码
import requests
def get_rect(base64_list, title_list):
	url = "https://api.acedata.cloud/captcha/recognition/hcaptcha"
	headers = {
	    "accept": "application/json",
	    "authorization": "授权码",
	    "content-type": "application/json"
	}
	payload = {
	      "queries": base64_list,
	      "question": ",".join(title_list)
	}
	response = requests.post(url, json=payload, headers=headers).json()
	return response

2、登陆目标网站,触发网站验证码

python 复制代码
co = ChromiumOptions().headless(False).auto_port()
co.set_argument('--enable-translate')
page = ChromiumPage(co)
co.incognito()
page.get('https://www.ebay.com/sh/ord/?filter=status%3AALL_ORDERS%2Ctimerange%3APREVIOUSMONTH')
if page.title != "Security Measure":
    login(page, username_str, password_str)

3、将验证码截图获取图片并转为base64编码

python 复制代码
def land():
	page.get_screenshot(path='tmp', name='pic.jpg', full_page=True)
	rangle = (74, 10, 474, 610)  # 左、上、右、下
	img = Image.open(r'tmp/pic.jpg')
	cropped_img = img.crop(rangle)
	# 保存裁剪后的图片
	cropped_img.save(r'tmp/cropped_image.png')
	title = (79, 15, 464, 130)
	img.crop(title).save(r"tmp/title.png")
	reader = easyocr.Reader(['ch_sim', 'en'])
    result = reader.readtext(img)
    title_list = []
    for detection in result:
        print(detection[1])
        title_list.append(detection[1])
	img1 = (79, 135, 209, 260)
	img.crop(img1).save(r"tmp/img1.png")
	img2 = (209, 135, 339, 260)
	img.crop(img2).save(r"tmp/img2.png")
	img3 = (339, 135, 469,260)
	img.crop(img3).save(r"tmp/img3.png")
	img4 = (79, 265, 209, 395)
	img.crop(img4).save(r"tmp/img4.png")
	img5 = (209, 265, 339, 395)
	img.crop(img5).save(r"tmp/img5.png")
	img6 = (339, 265, 469, 395)
	img.crop(img6).save(r"tmp/img6.png")
	img7 = (79, 395, 209, 525)
	img.crop(img7).save(r"tmp/img7.png")
	img8 = (209, 395, 339, 525)
	img.crop(img8).save(r"tmp/img8.png")
	img9 = (339, 395, 469, 525)
	img.crop(img9).save(r"tmp/img9.png")
	base64_list = []
	for i in range(1, 10):
	    with  open(f'tmp/img{i}.png', "rb") as img_file:
	        encoded_string = base64.b64encode(img_file.read()).decode('utf-8')
	        base64_list.append(encoded_string)
	return base64_list,title_list

4、将图片列表和标题传入图片识别api返回目标坐标,模拟完成点击

python 复制代码
res = get_rect(base64_list, 'tmp/title.png')
objects = res["solution"]["objects"]
img_list = [img1, img2, img3, img4, img5, img6, img7, img8, img9]
print("1111", objects)
for i in range(9):
    if objects[i]:
        target = ((int(img_list[i][0]) + int(img_list[i][2])) / 2, (int(img_list[i][1]) + int(img_list[i][3])) / 2)
        page.actions.move_to(target).click()
        time.sleep(1)
相关推荐
Gofarlic_OMS27 分钟前
Windchill的license合规使用报告自动化生成与审计追踪系统
大数据·运维·人工智能·云原生·自动化·云计算
徐先生 @_@|||28 分钟前
基于Translation插件实现在pycharm本地翻译并阅读英文资料
ide·python·pycharm
xcbrand38 分钟前
文旅行业品牌策划公司找哪家
大数据·运维·人工智能·python
好家伙VCC1 小时前
**发散创新:基于Rust的轻量级权限管理库设计与开源许可证实践**在现代分布式系统中,**权限控制(RBAC
java·开发语言·python·rust·开源
Dxy12393102161 小时前
Python序列标注模型上下文纠错详解
开发语言·python
ZhengEnCi1 小时前
P2H-Python字符串格式化完全指南-format和f-string的Python编程利器
python
HaiXCoder1 小时前
python从入门到精通-第5章: 函数式编程 — Python的函数式风格
python
HaiXCoder1 小时前
python从入门到精通-第0章: 思维模式碰撞
python
HaiXCoder1 小时前
python从入门到精通-第3章: 数据结构 — Python的"瑞士军刀
python
ZC跨境爬虫1 小时前
Scrapy多级请求实战:5sing伴奏网爬取踩坑与优化全记录(JSON提取+Xpath解析)
爬虫·scrapy·html·json