Python爬虫——selenium的安装和基本使用

1.什么是selenium?

  1. selenium是一个用于web应用程序测试的工具
  2. selenium测试直接运行在浏览器中,就像真正的用户在操作一样
  3. 支持通过各种driver(FrifoxDriver,ItenrentExploreDriver,OperaDriver,ChromeDriver )驱动
  4. selenium也是支持无界面浏览器操作的

2.为什么使用selenium?

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

3.安装selenium

  1. 查看谷歌浏览器版本

    谷歌浏览器右上角

    帮助-->关于

    查看浏览器版本

  2. 操作谷歌浏览器驱动下载地址
    http://npm.taobao.org/mirrors/chromedriver/下载完成解压

  3. 安装selenium

base 复制代码
pip install selenium==3.141.0

3.selenium的使用步骤

  1. 导入
python 复制代码
from selenium import webdriver
  1. 创建谷歌浏览器操作对象
python 复制代码
path = '谷歌浏览器驱动文件路径'
browser = webdriver.Chrome(path)
  1. 访问网址
python 复制代码
url = '要访问的网站地址'
browser.get(url)
  1. 获取网页源码
python 复制代码
# page_source 获取网页源码
content = browser.page_source

完整代码

python 复制代码
# 1.导入selenium
from selenium import webdriver

# 2.创建浏览器操作对象
path = 'files/chromedriver.exe'

browser = webdriver.Chrome(path)

# 3.访问网址
url = 'https://www.jd.com/'
browser.get(url)

# page_source 获取网页源码
content = browser.page_source
print(content)
相关推荐
love530love8 分钟前
Windows避坑部署CosyVoice多语言大语言模型
人工智能·windows·python·语言模型·自然语言处理·pycharm
掘金-我是哪吒1 小时前
分布式微服务系统架构第132集:Python大模型,fastapi项目-Jeskson文档-微服务分布式系统架构
分布式·python·微服务·架构·系统架构
xhdll2 小时前
egpo进行train_egpo训练时,keyvalueError:“replay_sequence_length“
python·egpo
Cchaofan2 小时前
lesson01-PyTorch初见(理论+代码实战)
人工智能·pytorch·python
网络小白不怕黑2 小时前
Python Socket编程:实现简单的客户端-服务器通信
服务器·网络·python
Ronin-Lotus3 小时前
程序代码篇---python获取http界面上按钮或者数据输入
python·http
不知道写什么的作者3 小时前
Flask快速入门和问答项目源码
后端·python·flask
孙胜完不了5 小时前
Day29
python
lkx097885 小时前
第四天的尝试
python
lcccyyy15 小时前
day 29
python