[Web自动化] Selenium简单使用

8.2 Selenium简单使用

在Selenium中,WebDriver是核心类,它代表了浏览器的一个实例。通过WebDriver,你可以控制浏览器执行各种操作,如打开网页输入文本点击按钮等。每个WebDriver实例都代表了一个独立的浏览器会话。
示例1:打开百度并搜索python

py 复制代码
from selenium import webdriver  
from selenium.webdriver.common.keys import Keys  
from selenium.webdriver.common.by import By  
import time
  
# 初始化WebDriver对象,这里以Chrome为例  
# 注意:如果ChromeDriver不在PATH中,需要指定完整路径  
driver = webdriver.Chrome()  
  
try:  
    # 打开百度网站  
    driver.get("https://www.baidu.com")  
      
    # 找到搜索框,这里通过id定位  
    search_box = driver.find_element(By.ID, "kw")  
      
    # 在搜索框中输入"python"  
    search_box.send_keys("python")  
      
    # 找到搜索按钮并点击,这里通过id定位  
    search_button = driver.find_element(By.ID, "su")  
    search_button.click()  
      
    # 等待搜索结果页面加载完成,这里简单等待5秒
	time.sleep(5) 
      
finally:  
    # 关闭浏览器
    driver.quit()

在这个示例中,我们首先导入了必要的Selenium库和模块,然后初始化了WebDriver对象,并打开了百度网站。接着,我们通过find_element方法定位到了搜索框和搜索按钮,分别进行了输入和点击操作。最后,我们关闭了浏览器实例。
示例2:访问「必应 (Bing)」并演示浏览器核心操作

py 复制代码
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import time

# 初始化Chrome浏览器驱动
# 如果你用的是Edge/Firefox,可替换为 webdriver.Edge() / webdriver.Firefox()
driver = webdriver.Chrome()

try:
    # 1. 浏览器窗口最大化(实用操作:方便查看页面内容)
    driver.maximize_window()
    print("✅ 浏览器窗口已最大化")

    # 2. 打开必应搜索主页
    driver.get("https://cn.bing.com")
    print(f"✅ 已打开网页:{driver.title}")  # 获取当前页面标题并打印

    # 3. 定位搜索框并输入关键词(通过name属性定位,新手常用定位方式)
    search_box = driver.find_element(By.NAME, "q")
    search_box.send_keys("Selenium 新手教程")  # 输入搜索内容
    print("✅ 已在搜索框输入关键词")

    # 4. 模拟按下回车键提交搜索(替代点击按钮,更快捷)
    search_box.send_keys(Keys.ENTER)
    time.sleep(3)  # 等待搜索结果加载
    print(f"✅ 搜索结果页面标题:{driver.title}")

    # 5. 向下滚动页面(查看更多搜索结果,常用操作)
    # 方式1:模拟按PageDown键(按一次翻一页)
    driver.find_element(By.TAG_NAME, "body").send_keys(Keys.PAGE_DOWN)
    time.sleep(2)
    # 方式2:通过JS滚动(更灵活,滚动到指定位置)
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight / 2);")
    time.sleep(2)

    # 6. 浏览器前进/后退操作
    driver.back()  # 回到必应主页
    time.sleep(2)
    print("✅ 已后退到必应主页")
    driver.forward()  # 回到搜索结果页
    time.sleep(2)
    print("✅ 已前进到搜索结果页")

    # 7. 获取页面关键信息(新手常用:提取文本/链接)
    # 定位第一个搜索结果的标题
    first_result = driver.find_element(By.CSS_SELECTOR, "li.b_algo h2 a")
    result_title = first_result.text  # 获取标题文本
    result_link = first_result.get_attribute("href")  # 获取链接地址
    print(f"\n🔍 第一个搜索结果:")
    print(f"标题:{result_title}")
    print(f"链接:{result_link}")

except Exception as e:
    # 捕获异常并打印(新手调试必备)
    print(f"❌ 运行出错:{e}")

finally:
    # 8. 关闭浏览器(无论是否出错,都确保关闭)
    time.sleep(3)  # 停留3秒,方便查看最终效果
    driver.quit()
    print("\n✅ 浏览器已关闭,程序结束")

这个示例覆盖了新手最常用的 8 类浏览器操作:窗口控制、页面跳转、输入 / 点击、滚动、前进后退、信息提取、异常处理、关闭浏览器。

代码加入了详细的打印信息和异常捕获,新手运行时能清晰看到每一步的执行结果,方便调试。

定位元素使用了 NAME/CSS_SELECTOR 等新手易理解的方式,同时标注了不同定位方式的特点,便于后续扩展学习。

相关推荐
摘星编程19 小时前
深入理解CANN ops-nn BatchNormalization算子:训练加速的关键技术
python
魔芋红茶19 小时前
Python 项目版本控制
开发语言·python
lili-felicity19 小时前
CANN批处理优化技巧:从动态批处理到流水线并行
人工智能·python
一个有梦有戏的人19 小时前
Python3基础:进阶基础,筑牢编程底层能力
后端·python
夏幻灵19 小时前
HTML5里最常用的十大标签
前端·html·html5
xiaobaibai15320 小时前
营销自动化终极形态:AdAgent 自主闭环工作流全解析
大数据·人工智能·自动化
摘星编程20 小时前
解析CANN ops-nn中的Transpose算子:张量维度变换的高效实现
python
Mr Xu_20 小时前
Vue 3 中 watch 的使用详解:监听响应式数据变化的利器
前端·javascript·vue.js
未来龙皇小蓝20 小时前
RBAC前端架构-01:项目初始化
前端·架构
Liekkas Kono20 小时前
RapidOCR Python 贡献指南
开发语言·python·rapidocr