七、验证码
7.1 什么是验证码?
一种随机生成信息(文字、数字、图片)
7.2 验证码作用
防止恶意请求
7.3 验证码处理方式
1. 去掉验证码(项目在测试环境、公司自己的项目)
2. 设置万能验证码(测试环境或线上环境,公司自己项目)
3. 使用验证码识别技术 (由于现在的验证码千奇百怪,导致识别率太低)
4. 使用cookie解决(推荐)
7.4 cookie 介绍:
生成:由服务器生成
作用:标识一次对话的状态(登录的状态)
使用:浏览器自动记录cookie,在下一条请求时将cookis信息自动附加请求
7.5 应用:
方法:
1. driver.get_cookies() # 获取所有的cookie
2. driver.add_cookies({字典}) # 设置cookie
步骤:
1. 打开百度url driver.get("http://www.baidu.com")
2. 设置cookie信息: driver.add_cookie({"name":"BDUSS","value":"根据实际情况编写"})
3. 暂停2秒以上
4. 刷新操作
注意:
1. 以上百度BDUSS所需格式为百度网站特有,别的网站请自行测试。
2. 必须进行刷新操作。
python
# 导包
from selenium import webdriver
from time import sleep
# 获取浏览器驱动对象
driver = webdriver.Firefox()
# 最大化浏览器
driver.maximize_window()
# 隐式等待
driver.implicitly_wait(30)
# 打开url
# 设置cookie
url = "http://www.baidu.com"
driver.get(url)
driver.add_cookie({"name": "BDUSS", "value":"05VkJaelAtblhuV2hIQncxS0p2N1l4MVNrdmctZGxWREUwNWdYTjRwV1N3Y1pjRVFBQUFBJCQAAAAAAAAAAAEAAAD82ggPMTUwNjkxNTU1AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAJI0n1ySNJ9ca0"})
# 获取所有的cookies信息
# cookies = driver.get_cookies()
# print("cookies内容为:", cookies)
# for co in cookies:
# print(co['name'])
# cookie = driver.get_cookie("BDUSS")
# print("cookie:", cookie)
# 暂停2秒
# sleep(2)
# 刷新 必须进行刷新才能看到效果
# driver.refresh()
"""
目标: cookie操作
案例:
使用cookie绕过百度登录
步骤:
1. 手动登录百度网站
2. 手动获取登录后的cookies 'BDUSS'
3. 使用selenium内的add_cookie(name='BDUSS', value='xxxx')
"""
# 暂停 2
sleep(5)
# 关闭驱动对象
driver.quit()