[Web自动化] Selenium简单使用

8.2 Selenium简单使用

在Selenium中,WebDriver是核心类,它代表了浏览器的一个实例。通过WebDriver,你可以控制浏览器执行各种操作,如打开网页输入文本点击按钮等。每个WebDriver实例都代表了一个独立的浏览器会话。
示例1:打开百度并搜索python

py 复制代码
from selenium import webdriver  
from selenium.webdriver.common.keys import Keys  
from selenium.webdriver.common.by import By  
import time
  
# 初始化WebDriver对象,这里以Chrome为例  
# 注意:如果ChromeDriver不在PATH中,需要指定完整路径  
driver = webdriver.Chrome()  
  
try:  
    # 打开百度网站  
    driver.get("https://www.baidu.com")  
      
    # 找到搜索框,这里通过id定位  
    search_box = driver.find_element(By.ID, "kw")  
      
    # 在搜索框中输入"python"  
    search_box.send_keys("python")  
      
    # 找到搜索按钮并点击,这里通过id定位  
    search_button = driver.find_element(By.ID, "su")  
    search_button.click()  
      
    # 等待搜索结果页面加载完成,这里简单等待5秒
	time.sleep(5) 
      
finally:  
    # 关闭浏览器
    driver.quit()

在这个示例中,我们首先导入了必要的Selenium库和模块,然后初始化了WebDriver对象,并打开了百度网站。接着,我们通过find_element方法定位到了搜索框和搜索按钮,分别进行了输入和点击操作。最后,我们关闭了浏览器实例。
示例2:访问「必应 (Bing)」并演示浏览器核心操作

py 复制代码
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import time

# 初始化Chrome浏览器驱动
# 如果你用的是Edge/Firefox,可替换为 webdriver.Edge() / webdriver.Firefox()
driver = webdriver.Chrome()

try:
    # 1. 浏览器窗口最大化(实用操作:方便查看页面内容)
    driver.maximize_window()
    print("✅ 浏览器窗口已最大化")

    # 2. 打开必应搜索主页
    driver.get("https://cn.bing.com")
    print(f"✅ 已打开网页:{driver.title}")  # 获取当前页面标题并打印

    # 3. 定位搜索框并输入关键词(通过name属性定位,新手常用定位方式)
    search_box = driver.find_element(By.NAME, "q")
    search_box.send_keys("Selenium 新手教程")  # 输入搜索内容
    print("✅ 已在搜索框输入关键词")

    # 4. 模拟按下回车键提交搜索(替代点击按钮,更快捷)
    search_box.send_keys(Keys.ENTER)
    time.sleep(3)  # 等待搜索结果加载
    print(f"✅ 搜索结果页面标题:{driver.title}")

    # 5. 向下滚动页面(查看更多搜索结果,常用操作)
    # 方式1:模拟按PageDown键(按一次翻一页)
    driver.find_element(By.TAG_NAME, "body").send_keys(Keys.PAGE_DOWN)
    time.sleep(2)
    # 方式2:通过JS滚动(更灵活,滚动到指定位置)
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight / 2);")
    time.sleep(2)

    # 6. 浏览器前进/后退操作
    driver.back()  # 回到必应主页
    time.sleep(2)
    print("✅ 已后退到必应主页")
    driver.forward()  # 回到搜索结果页
    time.sleep(2)
    print("✅ 已前进到搜索结果页")

    # 7. 获取页面关键信息(新手常用:提取文本/链接)
    # 定位第一个搜索结果的标题
    first_result = driver.find_element(By.CSS_SELECTOR, "li.b_algo h2 a")
    result_title = first_result.text  # 获取标题文本
    result_link = first_result.get_attribute("href")  # 获取链接地址
    print(f"\n🔍 第一个搜索结果:")
    print(f"标题:{result_title}")
    print(f"链接:{result_link}")

except Exception as e:
    # 捕获异常并打印(新手调试必备)
    print(f"❌ 运行出错:{e}")

finally:
    # 8. 关闭浏览器(无论是否出错,都确保关闭)
    time.sleep(3)  # 停留3秒,方便查看最终效果
    driver.quit()
    print("\n✅ 浏览器已关闭,程序结束")

这个示例覆盖了新手最常用的 8 类浏览器操作:窗口控制、页面跳转、输入 / 点击、滚动、前进后退、信息提取、异常处理、关闭浏览器。

代码加入了详细的打印信息和异常捕获,新手运行时能清晰看到每一步的执行结果,方便调试。

定位元素使用了 NAME/CSS_SELECTOR 等新手易理解的方式,同时标注了不同定位方式的特点,便于后续扩展学习。

相关推荐
Fairy要carry17 小时前
面试-Agent Loop
前端·chrome
虚幻如影18 小时前
Selenium 自动化测试中 Chrome 浏览器弹出“您的连接不是私密连接”
chrome·selenium·测试工具
菜鸡儿齐19 小时前
Unsafe方法学习
java·python·学习
Surmon19 小时前
基于 Cloudflare 生态的 AI Agent 实现
前端·人工智能·架构
老师好,我是刘同学1 天前
Python执行命令并保存输出到文件
python
六月June June1 天前
自定义调色盘组件
前端·javascript·调色盘
SY_FC1 天前
实现一个父组件引入了子组件,跳转到其他页面,其他页面返回回来重新加载子组件函数
java·前端·javascript
糟糕好吃1 天前
我让 AI 操作网页之后,开始不想点按钮了
前端·javascript·后端
陈天伟教授1 天前
人工智能应用- 天文学家的助手:08. 星系定位与分类
前端·javascript·数据库·人工智能·机器学习
VaJoy1 天前
给到夯!前端工具链新标杆 Vite Plus 初探
前端·vite