python爬虫代码

创建一个Python爬虫通常涉及到几个步骤,包括发送网络请求、解析网页内容、提取所需的数据以及存储数据。下面是一个简单的Python爬虫示例,使用了requests库来发送网络请求和BeautifulSoup库来解析HTML内容。

首先,你需要安装这两个:

bash 复制代码
pip install requests beautifulsoup4

然后,可以使用以下代码来创建一个简单的爬虫:

python 复制代码
import requests
from bs4 import BeautifulSoup

# 目标网页的URL
url = 'http://example.com'

# 发送GET请求
response = requests.get(url)

# 检查请求是否成功
if response.status_code == 200:
    # 使用BeautifulSoup解析HTML内容
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # 提取网页的标题
    title = soup.find('title').text
    print(f'网页标题: {title}')
    
    # 根据需要提取其他数据,例如提取所有的链接
    links = soup.find_all('a')
    for link in links:
        print(link.get('href'))
else:
    print('请求失败,状态码:', response.status_code)
相关推荐
湖边看客11 分钟前
antd x6 + vue3
开发语言·javascript·vue.js
小离a_a29 分钟前
flex垂直布局,容器间距相等
开发语言·javascript·ecmascript
BBB努力学习程序设计40 分钟前
Python面向对象编程:从代码搬运工到架构师
python·pycharm
傻啦嘿哟1 小时前
物流爬虫实战:某丰快递信息实时追踪技术全解析
java·开发语言·数据库
rising start1 小时前
五、python正则表达式
python·正则表达式
码力码力我爱你1 小时前
Harmony OS C++实战
开发语言·c++
茄子凉心1 小时前
android 开机启动App
android·java·开发语言
低客的黑调1 小时前
了解JVM 结构和运行机制,从小白编程Java 大佬
java·linux·开发语言
想唱rap1 小时前
C++ map和set
linux·运维·服务器·开发语言·c++·算法
FuckPatience1 小时前
C# 实现元素索引由1开始的链表
开发语言·链表·c#