去掉自动化标识,绕过js,绕过ip
python
import time
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
# 去掉自动化标识,绕过js
option = Options()
option.add_experimental_option('excludeSwitches', ['enable-automation'])
option.add_argument('--disable-blink-features=AutomationControlled')
# 确定用户文件 ,绕过ip (要把其他已经打开的浏览器关掉)
option.add_argument(r'--user-data-dir=C:\Users\PC\AppData\Local\Google\Chrome\User Data')
time.sleep(2)
driver = webdriver.Chrome(options = option)
图形验证码获取
python
import ddddocr
from selenium import webdriver
# 定位到图片元素,获取验证码图片链接
imgelement = driver.find_element('xpath','/html/body/div[1]/div/div[2]/div/div[2]/div/div/div[3]/div[2]/div/div/img') # 定位验证码图片
imgelement.screenshot('captcha.jpg') #保存验证码截图
# 验证码识别
ocr = ddddocr.DdddOcr()
with open('captcha.jpg', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print('识别出的验证码为:' + res)
# 填写验证码
driver.find_element_by_id(yanzhengmaid).send_keys(res)
获取用户名的 动态id,并通过id定位元素
python
#selenium定位时,发现网页的用户名和密码的id是动态变化的,但有一定的规律
nameId=driver.find_element_by_xpath("//input[starts-with(@id,169)]").get_attribute("id") #此处是一个以169开头的动态id
driver.find_element_by_id(nameId).send_keys('yonghuming')#定位id,并输入值
passwordId=driver.find_element_by_xpath("//input[ends-with(@id,'ps-k')]").get_attribute("id") #此处是一个以ps-k结尾的动态id
driver.find_element_by_id(passwordId).send_keys('mima')
testId=driver.find_element_by_xpath("//input[contains(@id,'test')]").get_attribute("id") #此处是一个包含test的动态id
driver.find_element_by_id(testId).click()