python项目练习——15.网页爬虫应用程序

这个项目可以让用户输入一个网址,然后爬取该网页的内容,并提取出其中的信息,比如标题、链接等。这个项目涉及到网络请求、HTML 解析、数据提取等方面的技术。

代码示例:

import tkinter as tk # 导入 Tkinter 库

from tkinter import scrolledtext # 导入 scrolledtext 模块

import requests # 导入 requests 库

from bs4 import BeautifulSoup # 导入 BeautifulSoup 库

class WebScraperApp:

def init(self, master):

self.master = master

self.master.title('简易网页爬虫')

创建界面组件

self.label_url = tk.Label(master, text='网址:')

self.label_url.grid(row=0, column=0)

self.entry_url = tk.Entry(master)

self.entry_url.grid(row=0, column=1)

self.btn_scrape = tk.Button(master, text='爬取', command=self.scrape_website)

self.btn_scrape.grid(row=0, column=2)

self.textbox = scrolledtext.ScrolledText(master, width=40, height=10)

self.textbox.grid(row=1, column=0, columnspan=3)

def scrape_website(self):

url = self.entry_url.get()

if url:

try:

response = requests.get(url) # 发送请求获取网页内容

soup = BeautifulSoup(response.text, 'html.parser') # 使用 BeautifulSoup 解析网页内容

提取网页标题并显示在文本框中

title = soup.title.string.strip()

self.textbox.insert(tk.END, f'标题: {title}\n')

提取所有链接并显示在文本框中

links = soup.find_all('a')

for link in links:

href = link.get('href')

self.textbox.insert(tk.END, f'链接: {href}\n')

except Exception as e:

self.textbox.insert(tk.END, f'爬取网页失败: {e}\n')

else:

self.textbox.insert(tk.END, '请输入网址\n')

if name == 'main':

root = tk.Tk() # 创建主窗口

app = WebScraperApp(root) # 创建网页爬虫应用程序实例

root.mainloop() # 运行主事件循环

代码逻辑分析:

使用 Tkinter 库创建了一个简单的图形界面网页爬虫应用程序。用户可以在输入框中输入网址,点击爬取按钮将网页内容爬取下来,并提取其中的标题和链接,并在界面上显示出来。网页内容通过 requests 库发送请求获取,然后通过 BeautifulSoup 库解析 HTML 内容提取信息。

相关推荐
yaoh.wang16 小时前
力扣(LeetCode) 13: 罗马数字转整数 - 解法思路
python·程序人生·算法·leetcode·面试·职场和发展·跳槽
醇氧16 小时前
【Windows】优雅启动:解析一个 Java 服务的后台启动脚本
java·开发语言·windows
石像鬼₧魂石16 小时前
如何配置Fail2Ban的Jail?
linux·学习·ubuntu
小鸡吃米…17 小时前
Python PyQt6教程七-控件
数据库·python
MapGIS技术支持17 小时前
MapGIS Objects Java计算一个三维点到平面的距离
java·开发语言·平面·制图·mapgis
程序员zgh17 小时前
C++ 互斥锁、读写锁、原子操作、条件变量
c语言·开发语言·jvm·c++
1916zz17 小时前
Extreme programing 方利喆 _ 江贤晟
python
长安牧笛17 小时前
智能鞋柜—脚气终结者,内置温湿度传感器和紫外线灯,晚上回家,把鞋放进去,自动检测湿度,湿度超标就启动烘干+紫外线杀菌,第二天穿鞋干燥无异味。
python
小灰灰搞电子17 小时前
Qt 重写QRadioButton实现动态radioButton源码分享
开发语言·qt·命令模式
weixin_4577600017 小时前
PIL库将图片位深度是1、8、32统一转换为24的方法
python