利用Python和Selenium编程,实现定时自动检索特定网页,发现特定网页内容发生变化后,向管理员发送提醒邮件(一)

一、项目需求

要求爬取某单位网站,登录后台查看是否有新增"网友提问",如果有新的提问,向特定邮箱发出提醒邮件。

二、项目分析

(一)判断是否可用爬虫爬取相关内容

首先查看该网站的robots.txt文件,发现不存在该文件,由于未禁止,可用爬取取相关信息。

(二)操作流程分析

查看是否有网友提问的操作流程如下。

1、登录网站后台管理页面

2、登录成功后,点击"互动平台" 。

3、点击互动平台后,浏览器会打开新页面(互动平台)

4、互动平台页面上端有一个选项卡,在选项卡中可以选择"依申请公开"或是"网上问答",但已选项显示内容是"依申请公开"还是"网上问答",无法预见,这其由最后一次对选项卡的操作决定。互动平台页面右侧显示的是待办办件,这里显示的就是需要提醒的内容。

在这里,我们需要查看"网上问答"部分有无新的问题,有新问题的话需要通过邮件提醒管理员。

三、解决方案和所需知识

由于访问特定信息需要进行一系列操作互动,由于Selenium可以操作浏览器,不用理会涉及页面渲染一类的复杂问题,所以这里我们选择Selenium作为爬虫解决方案。

第一步需要通过Python和Selenium实现对浏览器的相关操作,获取特定网页中的内容。

第二步是通过电子邮件将提醒内容发至管理员。

需要学习Python、HTML、Selenium,以及如何通过Python利用SMTP服务器发送信息有关的知识。

下面我们分几步进行学习,首先学习如何利用Python和Selenium操作浏览器和获取页面中的信息。

相关推荐
重生之我是数学王子3 分钟前
QT基础 编码问题 定时器 事件 绘图事件 keyPressEvent QT5.12.3环境 C++实现
开发语言·c++·qt
Ai 编码助手5 分钟前
使用php和Xunsearch提升音乐网站的歌曲搜索效果
开发语言·php
学习前端的小z9 分钟前
【前端】深入理解 JavaScript 逻辑运算符的优先级与短路求值机制
开发语言·前端·javascript
神仙别闹17 分钟前
基于C#和Sql Server 2008实现的(WinForm)订单生成系统
开发语言·c#
XINGTECODE18 分钟前
海盗王集成网关和商城服务端功能golang版
开发语言·后端·golang
zwjapple34 分钟前
typescript里面正则的使用
开发语言·javascript·正则表达式
小五Five35 分钟前
TypeScript项目中Axios的封装
开发语言·前端·javascript
前端每日三省37 分钟前
面试题-TS(八):什么是装饰器(decorators)?如何在 TypeScript 中使用它们?
开发语言·前端·javascript
好看资源平台1 小时前
网络爬虫——综合实战项目:多平台房源信息采集与分析系统
爬虫·python
凡人的AI工具箱1 小时前
15分钟学 Go 第 60 天 :综合项目展示 - 构建微服务电商平台(完整示例25000字)
开发语言·后端·微服务·架构·golang