python小案例

以下是采集店铺链接并去重的代码示例:

复制代码
import requests
from bs4 import BeautifulSoup

def get_shop_links(item_url):
    # 访问宝贝详情页面
    response = requests.get(item_url)
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # 获取必逛好店的店铺链接
    shop_links = []
    must_visit_shop_list = soup.find('div', class_='must-visit-shops').find_all('a')
    for shop in must_visit_shop_list:
        shop_link = shop['href']
        shop_links.append(shop_link)
    
    return shop_links

def remove_duplicate_links(links):
    unique_links = list(set(links))
    return unique_links

# 提供宝贝地址
item_url = 'http://item.taobao.com/item.htm?id=638673761014'
# 获取店铺链接
shop_links = get_shop_links(item_url)
# 去重店铺链接
unique_shop_links = remove_duplicate_links(shop_links)

print(unique_shop_links)

以上代码会根据提供的宝贝地址获取必逛好店的店铺链接,并对链接进行去重操作。你可以根据需要将该代码集成到你的采集过程中。

本文由mdnice多平台发布

相关推荐
AAD555888995 小时前
数字仪表LCD显示识别与读数:数字0-9、小数点及单位kwh检测识别实战
python
开源技术7 小时前
Python Pillow 优化,打开和保存速度最快提高14倍
开发语言·python·pillow
Li emily8 小时前
解决港股实时行情数据 API 接入难题
人工智能·python·fastapi
wfeqhfxz25887828 小时前
农田杂草检测与识别系统基于YOLO11实现六种杂草自动识别_1
python
mftang8 小时前
Python 字符串拼接成字节详解
开发语言·python
0思必得08 小时前
[Web自动化] Selenium设置相关执行文件路径
前端·爬虫·python·selenium·自动化
石去皿9 小时前
大模型面试通关指南:28道高频考题深度解析与实战要点
人工智能·python·面试·职场和发展
jasligea9 小时前
构建个人智能助手
开发语言·python·自然语言处理
测试秃头怪9 小时前
面试大厂就靠这份软件测试八股文了【含答案】
自动化测试·软件测试·python·功能测试·面试·职场和发展·单元测试
测试杂货铺9 小时前
软件测试面试题大全,你要的都在这。。
自动化测试·软件测试·python·功能测试·面试·职场和发展·测试用例