Python爬虫——selenium的安装和基本使用

1.什么是selenium?

  1. selenium是一个用于web应用程序测试的工具
  2. selenium测试直接运行在浏览器中,就像真正的用户在操作一样
  3. 支持通过各种driver(FrifoxDriver,ItenrentExploreDriver,OperaDriver,ChromeDriver )驱动
  4. selenium也是支持无界面浏览器操作的

2.为什么使用selenium?

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

3.安装selenium

  1. 查看谷歌浏览器版本

    谷歌浏览器右上角

    帮助-->关于

    查看浏览器版本

  2. 操作谷歌浏览器驱动下载地址
    http://npm.taobao.org/mirrors/chromedriver/下载完成解压

  3. 安装selenium

base 复制代码
pip install selenium==3.141.0

3.selenium的使用步骤

  1. 导入
python 复制代码
from selenium import webdriver
  1. 创建谷歌浏览器操作对象
python 复制代码
path = '谷歌浏览器驱动文件路径'
browser = webdriver.Chrome(path)
  1. 访问网址
python 复制代码
url = '要访问的网站地址'
browser.get(url)
  1. 获取网页源码
python 复制代码
# page_source 获取网页源码
content = browser.page_source

完整代码

python 复制代码
# 1.导入selenium
from selenium import webdriver

# 2.创建浏览器操作对象
path = 'files/chromedriver.exe'

browser = webdriver.Chrome(path)

# 3.访问网址
url = 'https://www.jd.com/'
browser.get(url)

# page_source 获取网页源码
content = browser.page_source
print(content)
相关推荐
学历真的很重要7 分钟前
LangChain V1.0 Short-term Memory 详细指南
后端·python·语言模型·面试·langchain·agent·ai编程
interception33 分钟前
爬虫逆向:国家信息安全漏洞(加速乐),cookie反爬
爬虫
LitchiCheng1 小时前
Mujoco 基础:获取模型中所有 body 的 name, id 以及位姿
人工智能·python
老鱼说AI1 小时前
算法基础教学第一步:数据结构
数据结构·python·算法
2301_795167201 小时前
Python 高手编程系列八:缓存
开发语言·python·缓存
闲人编程2 小时前
Django测试框架深度使用:Factory Boy与Fixture对比
数据库·python·django·sqlite·钩子·fixture·codecapsule
梅花142 小时前
基于Django房屋租赁系统
后端·python·django·bootstrap·django项目·django网站
今天没有盐2 小时前
Python数据分析实战:从超市销售到教学评估
python·pycharm·编程语言
s***87272 小时前
Vllm进行Qwen2-vl部署(包含单卡多卡部署及爬虫请求)
爬虫
white-persist3 小时前
【攻防世界】reverse | IgniteMe 详细题解 WP
c语言·汇编·数据结构·c++·python·算法·网络安全