Python爬虫——selenium的安装和基本使用

1.什么是selenium?

  1. selenium是一个用于web应用程序测试的工具
  2. selenium测试直接运行在浏览器中,就像真正的用户在操作一样
  3. 支持通过各种driver(FrifoxDriver,ItenrentExploreDriver,OperaDriver,ChromeDriver )驱动
  4. selenium也是支持无界面浏览器操作的

2.为什么使用selenium?

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

3.安装selenium

  1. 查看谷歌浏览器版本

    谷歌浏览器右上角

    帮助-->关于

    查看浏览器版本

  2. 操作谷歌浏览器驱动下载地址
    http://npm.taobao.org/mirrors/chromedriver/下载完成解压

  3. 安装selenium

base 复制代码
pip install selenium==3.141.0

3.selenium的使用步骤

  1. 导入
python 复制代码
from selenium import webdriver
  1. 创建谷歌浏览器操作对象
python 复制代码
path = '谷歌浏览器驱动文件路径'
browser = webdriver.Chrome(path)
  1. 访问网址
python 复制代码
url = '要访问的网站地址'
browser.get(url)
  1. 获取网页源码
python 复制代码
# page_source 获取网页源码
content = browser.page_source

完整代码

python 复制代码
# 1.导入selenium
from selenium import webdriver

# 2.创建浏览器操作对象
path = 'files/chromedriver.exe'

browser = webdriver.Chrome(path)

# 3.访问网址
url = 'https://www.jd.com/'
browser.get(url)

# page_source 获取网页源码
content = browser.page_source
print(content)
相关推荐
用户64405360196541 分钟前
pip install 安装太慢的解决方法
python
Lemon_man_10 分钟前
基于Django创建一个WEB后端框架(DjangoRestFramework+MySQL)流程
python·mysql·django
补三补四17 分钟前
Django与视图
数据库·python·django·sqlite
木卯26 分钟前
5种创建型设计模式笔记(Python实现)
python·设计模式
张琪杭43 分钟前
pytorch tensor创建tensor
人工智能·pytorch·python
星星点点洲1 小时前
【RAG】RAG 系统的基本搭建流程(ES关键词检索示例)
python·elasticsearch
带娃的IT创业者1 小时前
《Python实战进阶》No18: 使用 Apache Spark 进行分布式计算
python·spark·apache
Tomorrow'sThinker1 小时前
Python零基础学习第三天:函数与数据结构
开发语言·windows·python
元媛媛2 小时前
Python - 轻量级后端框架 Flask
开发语言·python·flask
疏狂难除2 小时前
基于Rye的Django项目通过Pyinstaller用Github工作流简单打包
后端·python·django