python Selenium

Selenium概述

Selenium是一个用于web应用程序测试的工具,模拟浏览器功能,自动执行网页中的is代码,实现动态加载

支持通过各种driver (FirfoxDriver,IternetExplorerDriver,OperaDriver,chromeDriver) 驱动直实浏览器完成测试,Selenium也是支持无界面浏览器操作的

Selenium安装

下载chrome驱动

根据chrome浏览器版本下载驱动

https://registry.npmmirror.com/binary.html?path=chromedriver/

移动至项目文件根目录

安装 selenium

python 复制代码
# 这里我选的是3.5.0版本 最好不要选择最新版本
pip install selenium -i  https://pypi.tuna.tsinghua.edu.cn/simple

Selenium的使用

python 复制代码
from selenium import webdriver

# 创建浏览器操作对象
browser = webdriver.Chrome("chromedriver.exe")

# 访问百度网站
url = 'https://www.baidu.com'

browser.get(url)

# 获取网页源码
content = browser.page_source

print(content)

Selenium元素定位

selenium的元素定位:webDriver提供很多定位元素的方法:

老版本写法

  • find_element by_id
  • find_elements_by_name
  • find**_elements_by_xpath**
  • find**** elements by_tag**** name
  • find**** elements**** by**** css**** selector
  • find**** elements**** by**** link**** text

新版本写法

  • find_element
  • find_elments
python 复制代码
# 根据xpath选择元素(最常用)
driver.find_element(By.XPATH, '//*[@id="kw"]') 
# 根据css选择器选择元素
driver.find_element(By.CSS_SELECTOR, '#kw') 
# 根据name属性值选择元素
driver.find_element(By.NAME, 'wd') 
# 根据类名选择元素
driver.find_element(By.CLASS_NAME, 's_ipt') 
# 根据链接文本选择元素
driver.find_element(By.LINK_TEXT, 'hao123') 
# 根据包含文本选择
driver.find_element(By.PARTIAL_LINK_TEXT, 'hao') 
# 根据标签名选择
# 目标元素在当前html中是唯一标签或众多标签第一个时候使用
driver.find_element(By.TAG_NAME, 'title') 
# 根据id选择
driver.find_element(By.ID, 'su') 

无界面浏览器使用

Phantomjs

Phantomjs是一个无界面的浏览器,支持页面元素查找,js的执行等,由于不进行css和gui渲染,运行效率要比真实的浏览器要快很多,可以保存快照查看

除phantomjs之外,还可以使用Chrome handless,不过 Chrome handless 有版本要求,这里不在演示

下载Phantomjs

下载地址: Download PhantomJS

使用无界面浏览器

python 复制代码
from selenium import webdriver
import time

# 创建浏览器操作对象
browser = webdriver.PhantomJS("phantomjs.exe")

# 访问百度网站
url = 'https://www.baidu.com'

browser.get(url)

# 保存快照
browser.save_screenshot('baidu.png')

time.sleep(2)

input = browser.find_element_by_id('kw')

input.send_keys("陈奕迅")

# 保存快照
browser.save_screenshot('陈奕迅.png')

验证快照

相关推荐
叫我:松哥几秒前
基于机器学习和flask的体育健身风险智能分析系统,系统集成DeepSeek、聚类算法、分类算法等,准确率达90%
人工智能·python·神经网络·算法·机器学习·flask·聚类
码云骑士1 分钟前
03-Python可变对象与不可变对象(下)-深浅拷贝的底层真相
开发语言·python
与代码不die不休2 分钟前
RTX5060显卡torch和torch_radon库安装避坑指南(仅linux系统)
linux·图像处理·python·深度学习
砍材农夫2 分钟前
python环境|pip|uv|venv|Conda区别
后端·python·conda·pip·uv
向量引擎3 分钟前
AI API 正在进入“请求生命周期治理”阶段:从模型迁移、Agent 接入到成本与安全排错的工程化方法
java·人工智能·python·aigc·ai编程·ai写作·gpu算力
sycmancia4 分钟前
Qt——自定义模型类
开发语言·qt
梦想不只是梦与想5 分钟前
Python 中的线程(Thread)
python·线程·thread
热心不起来的市民小周6 分钟前
100种动物语义分割数据集(A100-Seg)
python·深度学习·计算机视觉
DrMaker9 分钟前
【无标题】
软件测试·python·测试工具·pyqt
MATLAB代码顾问9 分钟前
Python数据分析项目实战:销售数据仪表盘
开发语言·python·数据分析