8.2 Selenium简单使用
在Selenium中,WebDriver是核心类,它代表了浏览器的一个实例。通过WebDriver,你可以控制浏览器执行各种操作,如打开网页、输入文本、点击按钮等。每个WebDriver实例都代表了一个独立的浏览器会话。
示例1:打开百度并搜索python
py
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import time
# 初始化WebDriver对象,这里以Chrome为例
# 注意:如果ChromeDriver不在PATH中,需要指定完整路径
driver = webdriver.Chrome()
try:
# 打开百度网站
driver.get("https://www.baidu.com")
# 找到搜索框,这里通过id定位
search_box = driver.find_element(By.ID, "kw")
# 在搜索框中输入"python"
search_box.send_keys("python")
# 找到搜索按钮并点击,这里通过id定位
search_button = driver.find_element(By.ID, "su")
search_button.click()
# 等待搜索结果页面加载完成,这里简单等待5秒
time.sleep(5)
finally:
# 关闭浏览器
driver.quit()
在这个示例中,我们首先导入了必要的Selenium库和模块,然后初始化了WebDriver对象,并打开了百度网站。接着,我们通过find_element方法定位到了搜索框和搜索按钮,分别进行了输入和点击操作。最后,我们关闭了浏览器实例。
示例2:访问「必应 (Bing)」并演示浏览器核心操作
py
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import time
# 初始化Chrome浏览器驱动
# 如果你用的是Edge/Firefox,可替换为 webdriver.Edge() / webdriver.Firefox()
driver = webdriver.Chrome()
try:
# 1. 浏览器窗口最大化(实用操作:方便查看页面内容)
driver.maximize_window()
print("✅ 浏览器窗口已最大化")
# 2. 打开必应搜索主页
driver.get("https://cn.bing.com")
print(f"✅ 已打开网页:{driver.title}") # 获取当前页面标题并打印
# 3. 定位搜索框并输入关键词(通过name属性定位,新手常用定位方式)
search_box = driver.find_element(By.NAME, "q")
search_box.send_keys("Selenium 新手教程") # 输入搜索内容
print("✅ 已在搜索框输入关键词")
# 4. 模拟按下回车键提交搜索(替代点击按钮,更快捷)
search_box.send_keys(Keys.ENTER)
time.sleep(3) # 等待搜索结果加载
print(f"✅ 搜索结果页面标题:{driver.title}")
# 5. 向下滚动页面(查看更多搜索结果,常用操作)
# 方式1:模拟按PageDown键(按一次翻一页)
driver.find_element(By.TAG_NAME, "body").send_keys(Keys.PAGE_DOWN)
time.sleep(2)
# 方式2:通过JS滚动(更灵活,滚动到指定位置)
driver.execute_script("window.scrollTo(0, document.body.scrollHeight / 2);")
time.sleep(2)
# 6. 浏览器前进/后退操作
driver.back() # 回到必应主页
time.sleep(2)
print("✅ 已后退到必应主页")
driver.forward() # 回到搜索结果页
time.sleep(2)
print("✅ 已前进到搜索结果页")
# 7. 获取页面关键信息(新手常用:提取文本/链接)
# 定位第一个搜索结果的标题
first_result = driver.find_element(By.CSS_SELECTOR, "li.b_algo h2 a")
result_title = first_result.text # 获取标题文本
result_link = first_result.get_attribute("href") # 获取链接地址
print(f"\n🔍 第一个搜索结果:")
print(f"标题:{result_title}")
print(f"链接:{result_link}")
except Exception as e:
# 捕获异常并打印(新手调试必备)
print(f"❌ 运行出错:{e}")
finally:
# 8. 关闭浏览器(无论是否出错,都确保关闭)
time.sleep(3) # 停留3秒,方便查看最终效果
driver.quit()
print("\n✅ 浏览器已关闭,程序结束")
这个示例覆盖了新手最常用的 8 类浏览器操作:窗口控制、页面跳转、输入 / 点击、滚动、前进后退、信息提取、异常处理、关闭浏览器。
代码加入了详细的打印信息和异常捕获,新手运行时能清晰看到每一步的执行结果,方便调试。
定位元素使用了 NAME/CSS_SELECTOR 等新手易理解的方式,同时标注了不同定位方式的特点,便于后续扩展学习。