Ozon 商品页数据解析与提取 API

Ozon 官方 Seller API 没有直接提供 "关键词搜索商品页" 的公开接口 ,只能获取自己店铺 的商品数据。要实现 "关键词→商品列表→详情解析提取",主流方案是:第三方采集 API(无需卖家权限)自建爬虫。下面是完整方案与可用接口。


一、第三方关键词商品页数据 API(推荐,开箱即用)

1. TMAPI(Ozon 关键词搜索 + 详情采集)

  • 接口GET https://api.tmapi.top/ozon/search
  • 参数
    • keyword:俄语关键词(如 ноутбук
    • page:页码(默认 1)
    • limit:每页数量(默认 50)
    • token:你的密钥
  • 返回:关键词搜索结果列表(商品 ID、标题、价格、主图、店铺、评分、销量、是否广告)
  • 详情补全 :拿到 product_id 后,调用 https://api.tmapi.top/ozon/item/detail?product_id=xxx 拉取完整详情(属性、描述、多图、规格、库存、评论)

2. OzonRobots(萝卜头)关键词采集 API

  • 接口POST https://api.ozontool.com/v1/search/keyword
  • 参数keywordpagesort(价格 / 销量 / 评分)
  • 返回:商品列表 + 排名、广告位、物流时效、评价数、评分
  • 优势:支持批量关键词、自动翻页、导出 Excel/JSON

3. iWeb Data Scraping Ozon Keyword API

  • 接口GET https://api.iwebdatascraping.com/ozon/keyword-search
  • 参数qcountrypage
  • 返回:结构化商品数据,含价格、库存、卖家、类目、URL

二、自建方案:关键词搜索页爬虫 + 详情解析(技术可控)

1. 关键词搜索页抓取(示例 URL)

  • 搜索 URL:https://www.ozon.ru/search/?from_global=true&text={俄语关键词}
  • 翻页:&page={n}
  • 排序:&sorting={price/price_desc/score/activity}

2. 商品详情页抓取(示例 URL)

  • 详情 URL:https://www.ozon.ru/product/{product_id}-{slug}/

3. 解析提取核心字段(JSON 结构示例)

json

复制代码
{
  "keyword": "ноутбук",
  "page": 1,
  "products": [
    {
      "product_id": 12345678,
      "title": "Ноутбук Lenovo IdeaPad 5 15ITL05",
      "price": 59990,
      "old_price": 69990,
      "discount": 14,
      "brand": "Lenovo",
      "category": "Ноутбуки",
      "images": ["https://..."],
      "rating": 4.7,
      "reviews_count": 1245,
      "seller": "ООО ТехноМаркет",
      "is_ad": false,
      "stock": "В наличии",
      "attributes": {
        "Процессор": "Intel Core i5-1135G7",
        "Оперативная память": "16 ГБ",
        "Накопитель": "512 ГБ SSD"
      },
      "description": "Полное описание товара..."
    }
  ]
}

4. 技术栈建议

  • Pythonrequests + BeautifulSoup / parsel(轻量)
  • Scrapy:适合大规模批量采集
  • 代理:必须使用俄罗斯 / 欧洲住宅代理(防封)
  • 反爬:随机 UA、请求间隔≥3 秒、验证码处理(可接入 2Captcha)
相关推荐
ZC跨境爬虫2 分钟前
Scrapy工作空间搭建与目录结构解析:从初始化到基础配置全流程
前端·爬虫·python·scrapy·自动化
Freak嵌入式17 分钟前
MicroPython LVGL基础知识和概念:时序与动态效果
开发语言·python·github·php·gui·lvgl·micropython
深蓝电商API1 小时前
分布式爬虫在海淘数据采集中的应用
爬虫·反向海淘
小白学大数据1 小时前
Scrapy 分布式爬虫:大规模采集汽车之家电车评论
开发语言·分布式·爬虫·scrapy
跨境麦香鱼1 小时前
Playwright vs Puppeteer:2026自动化任务与爬虫工具如何选?
运维·爬虫·自动化
北冥有羽Victoria1 小时前
OpenCLI 操作网页 从0到1完整实操指南
vscode·爬虫·python·github·api·ai编程·opencli
深蓝电商API2 小时前
反向海淘商品信息爬虫开发实战
爬虫·跨境电商·反向海淘
小恰学逆向2 小时前
【爬虫JS逆向之旅】某球网参数“md5__1038”逆向
javascript·爬虫
fengci.3 小时前
php反序列化(复习)(第三章)
android·开发语言·学习·php
说实话起个名字真难啊3 小时前
Docker 入门之网络基础
网络·docker·php