Python批量采集亚马逊商品数据

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

[python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取](#python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取)

知识点:

  • 爬虫基本流程

  • 非结构化数据解析

开发环境:

  • python 3.8 解释器, 运行代码

  • pycharm 随便 配置 python解释器

  • DrissionPage >>> pip install DrissionPage

DrissionPage是第三方模块,win + R 输入cmd 输入安装命令 pip install DrissionPage安装即可,re 是自带的模块,无需安装。

代码实现步骤

  1. 发送请求

  2. 获取数据

  3. 解析数据

  4. 保存数据

代码展示

python 复制代码
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:926207505
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
from DataRecorder import Recorder
from DrissionPage import WebPage        # 自动化模块


r = Recorder('data.xlsx')
r.add_data(['title', 'price', 'href', 'img_url'])  # 添加数据
r.record()  # 记录数据
url = 'https://origin-www.amazon.cn/s?rh=n%3A106200071&fs=true&ref=lp_106200071_sar'
wp = WebPage()
# 1. 打开网页
wp.get(url)
# 2. 取数据
for page in range(5):
    data = []
    # //div[@class="a-section a-spacing-base"]
    # div.a-section.a-spacing-base
    goods = wp.eles('xpath://div[@class="a-section a-spacing-base"]')
    for good in goods:
        href = good.ele('xpath:.//a[@class="a-link-normal s-no-outline"]').attr('href')
        img_url = good.ele('xpath:.//img[@class="s-image"]').attr('src')
        title = good.ele('xpath:.//span[@class="a-size-base-plus a-color-base a-text-normal"]').text
        price = good.ele('xpath:.//span[@class="a-price"]/span[@class="a-offscreen"]').text
        print(title, price, href, img_url)
        data.append([title, price, href, img_url])
    r.add_data(data)
    r.record()
    wp.ele('xpath://a[@class="s-pagination-item s-pagination-next s-pagination-button s-pagination-separator"]').click()

尾语

最后感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇

相关推荐
MATLAB代码顾问4 小时前
5大智能算法优化标准测试函数对比(Python实现)
开发语言·python
ting94520004 小时前
Tornado 全栈技术深度指南:从原理到实战
人工智能·python·架构·tornado
果汁华4 小时前
Browserbase Skills:让 Claude Agent 真正“看见“网页世界
人工智能·python
ZhengEnCi4 小时前
04-缩放点积注意力代码实现 💻
人工智能·python
DeepReinforce5 小时前
三、AI量化投资:使用akshare获取A股主板20260430所有的涨停股票
python·量化·akshare·龙头战法
段一凡-华北理工大学5 小时前
【高炉炼铁领域炉温监测、预警、调控智能体设计与应用】~系列文章08:多模态数据融合:让数据更聪明
人工智能·python·高炉炼铁·ai赋能·工业智能体·高炉炉温
万粉变现经纪人5 小时前
如何解决 pip install llama-cpp-python 报错 未安装 CMake/Ninja 或 CPU 不支持 AVX 问题
开发语言·python·开源·aigc·pip·ai写作·llama
清风明月一壶酒6 小时前
OpenClaw自动处理Word文档全流程
开发语言·c#·word
其实防守也摸鱼6 小时前
CTF密码学综合教学指南--第五章
开发语言·网络·笔记·python·安全·网络安全·密码学
网络工程小王6 小时前
【LangChain 大模型6大调用指南】调用大模型篇
linux·运维·服务器·人工智能·学习