Python爬虫——selenium的安装和基本使用

1.什么是selenium?

  1. selenium是一个用于web应用程序测试的工具
  2. selenium测试直接运行在浏览器中,就像真正的用户在操作一样
  3. 支持通过各种driver(FrifoxDriver,ItenrentExploreDriver,OperaDriver,ChromeDriver )驱动
  4. selenium也是支持无界面浏览器操作的

2.为什么使用selenium?

模拟浏览器功能,自动执行网页中的js代码,实现动态加载

3.安装selenium

  1. 查看谷歌浏览器版本

    谷歌浏览器右上角

    帮助-->关于

    查看浏览器版本

  2. 操作谷歌浏览器驱动下载地址
    http://npm.taobao.org/mirrors/chromedriver/下载完成解压

  3. 安装selenium

base 复制代码
pip install selenium==3.141.0

3.selenium的使用步骤

  1. 导入
python 复制代码
from selenium import webdriver
  1. 创建谷歌浏览器操作对象
python 复制代码
path = '谷歌浏览器驱动文件路径'
browser = webdriver.Chrome(path)
  1. 访问网址
python 复制代码
url = '要访问的网站地址'
browser.get(url)
  1. 获取网页源码
python 复制代码
# page_source 获取网页源码
content = browser.page_source

完整代码

python 复制代码
# 1.导入selenium
from selenium import webdriver

# 2.创建浏览器操作对象
path = 'files/chromedriver.exe'

browser = webdriver.Chrome(path)

# 3.访问网址
url = 'https://www.jd.com/'
browser.get(url)

# page_source 获取网页源码
content = browser.page_source
print(content)
相关推荐
算法小白(真小白)1 小时前
低代码软件搭建自学第二天——构建拖拽功能
python·低代码·pyqt
唐小旭1 小时前
服务器建立-错误:pyenv环境建立后python版本不对
运维·服务器·python
007php0071 小时前
Go语言zero项目部署后启动失败问题分析与解决
java·服务器·网络·python·golang·php·ai编程
Chinese Red Guest1 小时前
python
开发语言·python·pygame
骑个小蜗牛2 小时前
Python 标准库:string——字符串操作
python
黄公子学安全4 小时前
Java的基础概念(一)
java·开发语言·python
程序员一诺5 小时前
【Python使用】嘿马python高级进阶全体系教程第10篇:静态Web服务器-返回固定页面数据,1. 开发自己的静态Web服务器【附代码文档】
后端·python
数据小小爬虫5 小时前
利用Java爬虫获取苏宁易购商品详情
java·开发语言·爬虫
小木_.5 小时前
【Python 图片下载器】一款专门为爬虫制作的图片下载器,多线程下载,速度快,支持续传/图片缩放/图片压缩/图片转换
爬虫·python·学习·分享·批量下载·图片下载器