Python爬虫——selenium的安装和基本使用

1.什么是selenium?

  1. selenium是一个用于web应用程序测试的工具
  2. selenium测试直接运行在浏览器中,就像真正的用户在操作一样
  3. 支持通过各种driver(FrifoxDriver,ItenrentExploreDriver,OperaDriver,ChromeDriver )驱动
  4. selenium也是支持无界面浏览器操作的

2.为什么使用selenium?

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

3.安装selenium

  1. 查看谷歌浏览器版本

    谷歌浏览器右上角

    帮助-->关于

    查看浏览器版本

  2. 操作谷歌浏览器驱动下载地址
    http://npm.taobao.org/mirrors/chromedriver/下载完成解压

  3. 安装selenium

base 复制代码
pip install selenium==3.141.0

3.selenium的使用步骤

  1. 导入
python 复制代码
from selenium import webdriver
  1. 创建谷歌浏览器操作对象
python 复制代码
path = '谷歌浏览器驱动文件路径'
browser = webdriver.Chrome(path)
  1. 访问网址
python 复制代码
url = '要访问的网站地址'
browser.get(url)
  1. 获取网页源码
python 复制代码
# page_source 获取网页源码
content = browser.page_source

完整代码

python 复制代码
# 1.导入selenium
from selenium import webdriver

# 2.创建浏览器操作对象
path = 'files/chromedriver.exe'

browser = webdriver.Chrome(path)

# 3.访问网址
url = 'https://www.jd.com/'
browser.get(url)

# page_source 获取网页源码
content = browser.page_source
print(content)
相关推荐
张小生1801 分钟前
PyCharm中 argparse 库 的使用方法
python·pycharm
秃头佛爷1 分钟前
Python使用PDF相关组件案例详解
python
Dxy12393102163 分钟前
python下载pdf
数据库·python·pdf
叶知安4 分钟前
如何用pycharm连接sagemath?
ide·python·pycharm
weixin_432702268 分钟前
代码随想录算法训练营第五十五天|图论理论基础
数据结构·python·算法·深度优先·图论
菜鸟清风14 分钟前
ChromeDriver下载地址
python
deephub26 分钟前
Tokenformer:基于参数标记化的高效可扩展Transformer架构
人工智能·python·深度学习·架构·transformer
xiaoxiongip66628 分钟前
HTTP 和 HTTPS
网络·爬虫·网络协议·tcp/ip·http·https·ip
Open-AI43 分钟前
Python如何判断一个数是几位数
python
极客代码1 小时前
【Python TensorFlow】入门到精通
开发语言·人工智能·python·深度学习·tensorflow