python selenium 自动化登录页面

python 复制代码

import time
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

# 去掉自动化标识，绕过js
option = Options()
option.add_experimental_option('excludeSwitches', ['enable-automation'])
option.add_argument('--disable-blink-features=AutomationControlled')
# 确定用户文件 ，绕过ip （要把其他已经打开的浏览器关掉）
option.add_argument(r'--user-data-dir=C:\Users\PC\AppData\Local\Google\Chrome\User Data')
time.sleep(2)
driver = webdriver.Chrome(options = option)

python 复制代码

import ddddocr
from selenium import webdriver

# 定位到图片元素,获取验证码图片链接
imgelement = driver.find_element('xpath','/html/body/div[1]/div/div[2]/div/div[2]/div/div/div[3]/div[2]/div/div/img')  # 定位验证码图片
imgelement.screenshot('captcha.jpg')  #保存验证码截图
# 验证码识别
ocr = ddddocr.DdddOcr()
with open('captcha.jpg', 'rb') as f:
    img_bytes = f.read()
res = ocr.classification(img_bytes)
print('识别出的验证码为：' + res)
# 填写验证码
driver.find_element_by_id(yanzhengmaid).send_keys(res)

python 复制代码

#selenium定位时，发现网页的用户名和密码的id是动态变化的，但有一定的规律
nameId=driver.find_element_by_xpath("//input[starts-with(@id,169)]").get_attribute("id")  #此处是一个以169开头的动态id
driver.find_element_by_id(nameId).send_keys('yonghuming')#定位id，并输入值

passwordId=driver.find_element_by_xpath("//input[ends-with(@id,'ps-k')]").get_attribute("id")  #此处是一个以ps-k结尾的动态id
driver.find_element_by_id(passwordId).send_keys('mima')

testId=driver.find_element_by_xpath("//input[contains(@id,'test')]").get_attribute("id")  #此处是一个包含test的动态id
driver.find_element_by_id(testId).click（）

python selenium 自动化登录页面

去掉自动化标识，绕过js，绕过ip

图形验证码获取

获取用户名的动态id，并通过id定位元素

python selenium 自动化登录页面

去掉自动化标识，绕过js，绕过ip

图形验证码获取

获取用户名的 动态id，并通过id定位元素

获取用户名的动态id，并通过id定位元素