在公司上班闲的没事干,学点selenium
先安装selenium
bash
pip install selenium
出现报错
bash
Cannot uninstall certifi None
╰─> The package's contents are unknown: no RECORD file was found for certifi.
hint: You might be able to recover from this via: pip install --force-reinstall --no-deps certifi==2024.8.30

解决方式:
定位到site-packages
目录,删掉certifi
文件夹,和所有与.dist-info
相关的文件夹
之后执行
bash
pip install certifi selenium

即可安装成功
就可以开始写脚本了
写脚本过程中,需要验证一个图片的验证码,主要是4位数字的验证码
可以先使用pytesseract
识别验证码
使用的时候电脑要先安装ocr
https://github.com/UB-Mannheim/tesseract/wiki
安装成功之后,要修改对应的环境变量
具体使用方式
bash
from PIL import Image
import pytesseract
def recognize_png(image_path):
imge = Image.open(image_path)
text = pytesseract.image_to_string(imge,config='--psm 6 digits')
return text.strip()
print(recognize_png("img/captcha (1).png"))
验证码图片

识别的结果

看起来效率比较低,后期试了ddddocr
,效率比这个高一点