macos 使用vscode 开发python 爬虫(开发二)

以下是一个示例,用于爬取一个公开的示例网站(http://books.toscrape.com),并提取书籍的标题和价格:

python 复制代码
import requests
from bs4 import BeautifulSoup

# 发起请求并获取网页内容
url = '可以用上面的链接🔗'
response = requests.get(url)
html_content = response.text

# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')

# 提取书籍标题和价格
books = soup.find_all('article', class_='product_pod')

for book in books:
    title = book.h3.a['title']
    price = book.find('p', class_='price_color').text

    print('书名:', title)
    print('价格:', price)
    print('---')

这个示例使用了一个公开的书籍网站(http://books.toscrape.com),通过发送HTTP请求获取网页内容,并使用BeautifulSoup解析网页内容。然后,它找到所有的书籍信息,并提取书名和价格,并将它们打印出来。

运行脚本

powershell 复制代码
python spider.py

请确保你已经安装了所需的Python库(requests和beautifulsoup4)以及它们的依赖项。你可以使用以下命令来安装这些库:

powershell 复制代码
pip install requests beautifulsoup4

如果想要图片

powershell 复制代码
print("Runoob")

import requests
from bs4 import BeautifulSoup

# 发起请求并获取网页内容
url = '可以用上面的链接🔗'
response = requests.get(url)
html_content = response.text

# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')

# 提取书籍标题和价格
books = soup.find_all('article', class_='product_pod')

for book in books:
    img_element = book.find('img', class_='thumbnail')
    img_url = img_element.get('src')
    title = book.h3.a['title']
    price = book.find('p', class_='price_color').text

    print('图片:', img_url)
    print('书名:', title)
    print('价格:', price)
    print('---')
相关推荐
友善的猴子1 小时前
App Cleaner Pro for Mac 中 Mac软件卸载工具
macos
唐家麦兜1 小时前
Mac 关闭浏览器左右滑动切换页面的问题
macos
起个破名想半天了3 小时前
Sklearn入门之datasets的基本用法
人工智能·python·机器学习·sklearn
大雄野比3 小时前
【scikit-learn基础】--『预处理』之 缺失值处理
python·机器学习·scikit-learn
小鑫仔_x4 小时前
selenium之Token
python·selenium·测试工具
神仙别闹4 小时前
基于Python(Django)+SQLite 实现(Web) 点菜管理系统
python·django·sqlite
Thanks_ks4 小时前
探秘 Python 网络编程:构建简单聊天服务器
python·网络编程·socket·tcp·客户端·套接字·聊天服务器
小羊的 utopia5 小时前
第P10周:Pytorch实现车牌识别
pytorch·python·机器学习
[太阳]885 小时前
Spark Core
linux·windows·python
风为你而吹6 小时前
【玩泰山派】MISC(杂项)- 使用vscode远程连接泰山派进行开发
ide·vscode·编辑器