python爬虫代码

创建一个Python爬虫通常涉及到几个步骤,包括发送网络请求、解析网页内容、提取所需的数据以及存储数据。下面是一个简单的Python爬虫示例,使用了requests库来发送网络请求和BeautifulSoup库来解析HTML内容。

首先,你需要安装这两个:

bash 复制代码
pip install requests beautifulsoup4

然后,可以使用以下代码来创建一个简单的爬虫:

python 复制代码
import requests
from bs4 import BeautifulSoup

# 目标网页的URL
url = 'http://example.com'

# 发送GET请求
response = requests.get(url)

# 检查请求是否成功
if response.status_code == 200:
    # 使用BeautifulSoup解析HTML内容
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # 提取网页的标题
    title = soup.find('title').text
    print(f'网页标题: {title}')
    
    # 根据需要提取其他数据,例如提取所有的链接
    links = soup.find_all('a')
    for link in links:
        print(link.get('href'))
else:
    print('请求失败,状态码:', response.status_code)
相关推荐
缺点内向几秒前
Java: 为PDF批量添加图片水印实用指南
java·开发语言·pdf
闲人编程14 分钟前
构建一个基于Flask的URL书签管理工具
后端·python·flask·url·codecapsule·书签管理
西西学代码15 分钟前
Flutter---异步编程
开发语言·前端·javascript
song85460113421 分钟前
锁的初步学习
开发语言·python·学习
重整旗鼓~27 分钟前
38.附近商户实现
java·开发语言
Dcs34 分钟前
提升 Python 性能的 10 个智能技巧
python
❀͜͡傀儡师1 小时前
JDK 25 新特性速览
java·开发语言
兮动人1 小时前
主流JDK版本支持时间
java·开发语言·主流jdk版本支持时间
深蓝电商API1 小时前
0 基础入门爬虫:Python+requests 环境搭建保姆级教程
开发语言·爬虫·python
2501_930707781 小时前
使用C#代码在 Word 文档中查找并替换文本
开发语言·c#·word