selenium自动化chrome

复制代码
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from fake_useragent import UserAgent


# 启动 Chrome 浏览器
chrome_options = webdriver.ChromeOptions()
chrome_options.binary_location = r"C:\Program Files\Google\Chrome\Application\chrome.exe"
# chrome_options.add_argument("executable_path='C:\\Users\\wangkejun\\Downloads\\chromedriver-win64\\chromedriver.exe'")
chrome_options.add_argument('--disable-gpu')  # 禁用 GPU 加速
chrome_options.add_argument('--disable-images')  # 禁用图片加载
chrome_options.add_argument('--no-sandbox')  # 无沙盒模式
chrome_options.add_argument('disable-blink-features=AutomationControlled') #去掉webdriver痕迹
chrome_options.add_argument('--disable-javascript') # 禁用JavaScript
chrome_options.add_argument('-ignore-certificate-errors')#忽略证书错误
chrome_options.add_argument('-ignore -ssl-errors')    #忽略证书错误
chrome_options.add_argument('window-size=1377x768')#指定浏览器分辨率
chrome_options.add_argument('disable-infobars')# 隐藏Chrome正在受到自动软件的控制
chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])#设置开发者模式启动,该模式下webdriver属性为正常值

# 生成随机的 User-Agent
user_agent = UserAgent().random
chrome_options.add_argument(f'user-agent="{user_agent}"')


driver = webdriver.Chrome(options=chrome_options) 

# 执行 CDP 命令来修改 navigator.webdriver
script = """
Object.defineProperty(navigator, 'webdriver', {
    get: () => undefined
})
"""

driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {"source": script})
  1. chrome_options = webdriver.ChromeOptions() - 创建 Chrome 浏览器的选项对象。

  2. chrome_options.binary_location = r"C:\Program Files\Google\Chrome\Application\chrome.exe" - 指定 Chrome 浏览器的二进制文件路径。

  3. chrome_options.add_argument('--disable-gpu') - 禁用 GPU 加速,可以提高脚本在浏览器中的稳定性和性能。

  4. chrome_options.add_argument('--disable-images') - 禁用图片加载,可以加快页面加载速度。

  5. chrome_options.add_argument('--no-sandbox') - 在无沙盒模式下运行 Chrome 浏览器,可以解决某些特定环境下的问题。

  6. user_agent = UserAgent().random - 生成随机的 User-Agent,用于伪装浏览器身份。

  7. chrome_options.add_argument(f'user-agent="{user_agent}"') - 将生成的随机 User-Agent 添加到 Chrome 浏览器选项中。

  8. driver = webdriver.Chrome(options=chrome_options) - 使用指定的选项启动 Chrome 浏览器。

  9. script = """ ... """ - 定义一个 JavaScript 脚本,用于修改 navigator.webdriver 属性。

  10. driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {"source": script}) - 使用 Chrome DevTools Protocol (CDP) 的命令,在每个新页面加载时执行指定的 JavaScript 脚本,从而修改 navigator.webdriver 属性。这可以用于绕过一些反爬虫机制。

相关推荐
研究司马懿2 小时前
【ETCD】ETCD——confd配置管理
数据库·golang·自动化·运维开发·etcd·argocd·gitops
ToDetect3 小时前
Chrome & Edge 最新DNS泄露检测方法+指纹解析步骤(含工具)
chrome·edge·todetect·dns泄露检测
2501_915921433 小时前
Fastlane 结合 开心上架(Appuploader)命令行版本实现跨平台上传发布 iOS App 免 Mac 自动化上架实战全解析
android·macos·ios·小程序·uni-app·自动化·iphone
newxtc7 小时前
【湖北政务服务网-注册_登录安全分析报告】
人工智能·selenium·测试工具·安全·政务
软件测试小仙女7 小时前
简单但好用:4种Selenium截图方法
自动化测试·软件测试·selenium·测试工具·测试用例·接口测试·selenium截图
RPA机器人就用八爪鱼9 小时前
RPA自动化程序:企业数字化转型的智能引擎
运维·自动化·rpa
IT小哥哥呀10 小时前
Jenkins + Docker 打造自动化持续部署流水线
docker·微服务·自动化·jenkins·springboot·高并发·限流
一勺菠萝丶11 小时前
芋道后端部署后总自己挂?从 Nginx 报错到 OOM Kill 的完整排查与修复(2核2G 服务器实战)
服务器·chrome·nginx
2501_9159184111 小时前
Flutter 加固方案对比与实战,多工具组合的跨平台安全体系(Flutter App 加固/IPA 成品混淆/Ipa Guard CLI/自动化安全流程)
安全·flutter·ios·小程序·uni-app·自动化·iphone
007tg12 小时前
Telegram SCRM 系统构建指南:自动化营销与客户管理实战
大数据·运维·自动化