【《python爬虫入门教程11--重剑无峰168》】

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

【《python爬虫入门教程11--selenium的安装与使用》】


前言

selenium就是一个可以实现python自动化的模块

提示:以下是本篇文章正文内容,下面案例可供参考

一、Chrome的版本查找?-- 如果用edge也是类似的

1.chrome://version -- 找到chrome的版本号

2.chromedriver的下载 -- 选择相同的版本好下载

这个就是下载的链接https://googlechromelabs.github.io/chrome-for-testing/

二、selenium的安装,这里记住如果安装的版本很高,可能会出现闪退,就是你没有让浏览器退出,它自动运行完退出,就是可以安装一个指定的版本。

python 复制代码
pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple 

# 如果要指定安装什么版本的话
pip install selenium==4.1.1 -i https://pypi.tuna.tsinghua.edu.cn/simple 

代码展示

python 复制代码
# 首先下载浏览器的驱动
# 例如用chrome 那么就下载chrmoedriver

# 安装selenium 清华镜像

# (1) 导入selenium
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
# (2) 创建浏览器操作对象
# path = 'chromedriver.exe'
# brower = webdriver.Chrome(path) 不知道为社么会报错
brower = webdriver.Chrome(service=Service(r'chromedriver.exe'))

# (3)访问网站
url = 'https://pro.jd.com/mall/active/4AP3tAH2TrGite1X6eBDXEFBvox6/index.html'
brower.get(url)

# (4)获取page_source的网页源码
content = brower.page_source
print(content)

总结

后续将更新更多selenium的语法知识,欢迎关注,也可以去看看我帖子里的其他爬虫教学案例,以及可以实现的爬虫代码,都是最近写好的。感谢呢,继续努力!

相关推荐
paishishaba2 分钟前
处理Web请求路径参数
java·开发语言·后端
七七七七073 分钟前
C++类对象多态底层原理及扩展问题
开发语言·c++
51713 分钟前
Django中序列化与反序列化
后端·python·django
lxiaoj11113 分钟前
Python文件操作笔记
笔记·python
谢娘蓝桥34 分钟前
[Xmos] Xmos架构
开发语言·架构·xmos
yi.Ist41 分钟前
数据结构 —— 栈(stack)在算法思维中的巧妙运用
开发语言·数据结构
Tomorrow'sThinker1 小时前
✍️ Python 批量设置 Word 文档多级字体样式(标题/正文/名称/小节)
python·自动化·word·excel
[纳川]1 小时前
把word中表格转成excle文件
开发语言·c#·word
秋难降1 小时前
Python 知识点详解(三)
python·编程语言
华科云商xiao徐1 小时前
冷门但好用的Python库写个爬虫代码
爬虫