Python爬虫速成之路(6):Selenium的使用

hello hello~ ,这里是绝命Coding------老白~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹

💥个人主页绝命Coding-CSDN博客

💥 所属专栏后端技术分享

这里将会不定期更新有关后端、前端的内容,希望大家多多点赞关注收藏💖

爬虫就三大种实现方式。第一种是获取网页源代码来获取数据,这种也只能在特定网站生效;第二种是直接get或者post提交数据,这种难度有时候会较大,因为接口往往有一些限制;第三种就是直接模拟浏览器点击操作,第三种就比较无脑,可以实现很多第一第二种实现不了,比如Boss海投工具等。本文介绍的就是Selenium的基本用法。

Python3中使用Selenium进行Web自动化测试是一种非常常见的方法。

#Python3中Selenium使用方法(连载)  https://www.toutiao.com/a6425040355548397825/
# Selenium 调用IEDriverServer打开IE浏览器 - 天高地阔的专栏 - CSDN博客  
#2018/2/*
#http://blog.csdn.net/jichuang123/article/details/53008581
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time

brower = webdriver.Ie()
url = 'https://hao.360.cn/?wd_xp1'
brower.get(url)
intput = brower.find_element_by_id('search-kw')
intput.send_keys('python')
intput.send_keys(Keys.ENTER)
time.sleep(3)
brower.quit()

知识点

1.新版本的写法(需要写Service,否则好像会报错)

from selenium import webdriver  
from selenium.webdriver.chrome.service import Service  
from selenium import webdriver  
from webdriver_manager.chrome import ChromeDriverManager

s = Service(path)      # path为chromedriver安装路径
bro = webdriver.Chrome(service=s)  
bro.get("https://www.shixiseng.com/")

2.chromedriver安装对应浏览器版本的方法(推荐这种方法安装驱动!可以避免版本不一致的问题)

(会安装在类似"C:\Users\czh\.wdm\drivers\chromedriver\win32\107.0.5304\chromedriver.exe"的文件夹下)

from webdriver_manager.chrome import ChromeDriverManager
# 下载驱动  
def downdriver():  
    driver = webdriver.Chrome(ChromeDriverManager().install())

3.根据classname找元素的方法

(1)class name有空格的写法

bro.find_element('css selector', "[class='tiktok-q9aj5z-PCommentText e1g2efjf6']")

(2)class name(点开头)

bro.find_element('css selector', ".qaq")

4.根据class的id找元素的方法

class id(#开头)

bro.find_element('css selector', "#qaq")

5.点击按钮写法

button = bro.find_element('css selector', ".qaq")
button.click()

6.如果找同个classname的多个元素,在find_element补个s即可(然后用for循环遍历)

bro.find_elements('css selector', ".qaq")

7.如果等待页面加载出某个元素再进行下一步操作,用try,封装函数如下

# 检查存在再进行数据的  
def check_find_elements(bro,by,value):  
    # 等待元素加载完毕  
    while (True):  
        try:  
            # 注意.是class name的意思  
            bro.find_element(by, value)  
            #print(value + "找到")  
            break  
        except Exception:  
            continue  
    return bro.find_elements(by, value)  
  
# 检查存在再进行数据的  
def check_find_element(bro,by,value):  
    # 等待元素加载完毕  
    while (True):  
        try:  
            # 注意.是class name的意思  
            bro.find_element(by, value)  
            #print(value + "找到")  
            break  
        except Exception:  
            continue  
    return bro.find_element(by, value)

现在就可以写成check_find_element(bro, "css selector","[class='nickname']")就会在元素加载完成后再进行下步操作

8.打开了新窗口后,想进入新窗口完成操作,结束后回到上个窗口

# 进入新窗口
cls = bro.window_handles  
bro.switch_to.window(cls[1])

# 这里应该进行新窗口的操作

# 关闭新窗口,回到旧窗口
bro.close()  
bro.switch_to.window(cls[0])

9.浏览器最小化,窗口缩小

bro.set_window_size(300, 300)  
bro.minimize_window()       # 最小化窗口,不影响

更多历史精彩文章(篇幅过多,不一一列出):

(简历相关)

求职经验分享(1):一份合格的简历应该如何写?-CSDN博客(推荐)

求职经验分享(2):简历如何优化以及如何应对面试【后端篇】-CSDN博客

(项目亮点相关)

大厂面试官赞不绝口的后端技术亮点【后端项目亮点合集(1):Redis篇】-CSDN博客

大厂面试官赞不绝口的后端技术亮点【后端项目亮点合集(2)】-CSDN博客

(八股文)
大厂面试官问我:Redis处理点赞,如果瞬时涌入大量用户点赞(千万级),应当如何进行处理?【后端八股文一:Redis点赞八股文合集】_java中redis如何实现点赞-CSDN博客

大厂面试官问我:布隆过滤器有不能扩容和删除的缺陷,有没有可以替代的数据结构呢?【后端八股文二:布隆过滤器八股文合集】_布隆过滤器不能扩容-CSDN博客

.........

(算法篇)
大厂面试:算法考前必看汇总(全)_大厂面试算法题-CSDN博客
感兴趣的小伙伴可以给个三连~

相关推荐
鸽芷咕13 分钟前
【Python报错已解决】ModuleNotFoundError: No module named ‘paddle‘
开发语言·python·机器学习·bug·paddle
子午24 分钟前
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
人工智能·python·cnn
风等雨归期32 分钟前
【python】【绘制小程序】动态爱心绘制
开发语言·python·小程序
Adolf_199338 分钟前
Flask-JWT-Extended登录验证, 不用自定义
后端·python·flask
冯宝宝^39 分钟前
基于mongodb+flask(Python)+vue的实验室器材管理系统
vue.js·python·flask
叫我:松哥1 小时前
基于Python flask的医院管理学院,医生能够增加/删除/修改/删除病人的数据信息,有可视化分析
javascript·后端·python·mysql·信息可视化·flask·bootstrap
Eiceblue1 小时前
Python 复制Excel 中的行、列、单元格
开发语言·python·excel
NLP工程化2 小时前
对 Python 中 GIL 的理解
python·gil
极客代码2 小时前
OpenCV Python 深度指南
开发语言·人工智能·python·opencv·计算机视觉
liO_Oil2 小时前
(2024.9.19)在Python的虚拟环境中安装GDAL
开发语言·python·gdal安装