Ozon 商品页数据解析与提取 API

Ozon 官方 Seller API 没有直接提供 "关键词搜索商品页" 的公开接口 ,只能获取自己店铺 的商品数据。要实现 "关键词→商品列表→详情解析提取",主流方案是:第三方采集 API(无需卖家权限)自建爬虫。下面是完整方案与可用接口。


一、第三方关键词商品页数据 API(推荐,开箱即用)

1. TMAPI(Ozon 关键词搜索 + 详情采集)

  • 接口GET https://api.tmapi.top/ozon/search
  • 参数
    • keyword:俄语关键词(如 ноутбук
    • page:页码(默认 1)
    • limit:每页数量(默认 50)
    • token:你的密钥
  • 返回:关键词搜索结果列表(商品 ID、标题、价格、主图、店铺、评分、销量、是否广告)
  • 详情补全 :拿到 product_id 后,调用 https://api.tmapi.top/ozon/item/detail?product_id=xxx 拉取完整详情(属性、描述、多图、规格、库存、评论)

2. OzonRobots(萝卜头)关键词采集 API

  • 接口POST https://api.ozontool.com/v1/search/keyword
  • 参数keywordpagesort(价格 / 销量 / 评分)
  • 返回:商品列表 + 排名、广告位、物流时效、评价数、评分
  • 优势:支持批量关键词、自动翻页、导出 Excel/JSON

3. iWeb Data Scraping Ozon Keyword API

  • 接口GET https://api.iwebdatascraping.com/ozon/keyword-search
  • 参数qcountrypage
  • 返回:结构化商品数据,含价格、库存、卖家、类目、URL

二、自建方案:关键词搜索页爬虫 + 详情解析(技术可控)

1. 关键词搜索页抓取(示例 URL)

  • 搜索 URL:https://www.ozon.ru/search/?from_global=true&text={俄语关键词}
  • 翻页:&page={n}
  • 排序:&sorting={price/price_desc/score/activity}

2. 商品详情页抓取(示例 URL)

  • 详情 URL:https://www.ozon.ru/product/{product_id}-{slug}/

3. 解析提取核心字段(JSON 结构示例)

json

复制代码
{
  "keyword": "ноутбук",
  "page": 1,
  "products": [
    {
      "product_id": 12345678,
      "title": "Ноутбук Lenovo IdeaPad 5 15ITL05",
      "price": 59990,
      "old_price": 69990,
      "discount": 14,
      "brand": "Lenovo",
      "category": "Ноутбуки",
      "images": ["https://..."],
      "rating": 4.7,
      "reviews_count": 1245,
      "seller": "ООО ТехноМаркет",
      "is_ad": false,
      "stock": "В наличии",
      "attributes": {
        "Процессор": "Intel Core i5-1135G7",
        "Оперативная память": "16 ГБ",
        "Накопитель": "512 ГБ SSD"
      },
      "description": "Полное описание товара..."
    }
  ]
}

4. 技术栈建议

  • Pythonrequests + BeautifulSoup / parsel(轻量)
  • Scrapy:适合大规模批量采集
  • 代理:必须使用俄罗斯 / 欧洲住宅代理(防封)
  • 反爬:随机 UA、请求间隔≥3 秒、验证码处理(可接入 2Captcha)
相关推荐
码界奇点9 小时前
基于Python的新浪微博数据爬虫系统设计与实现
数据库·爬虫·python·毕业设计·新浪微博·源代码管理
2401_8734794011 小时前
企业安全团队如何配合公安协查?IP查询在电子取证中的技术实践
tcp/ip·安全·网络安全·php
L16247611 小时前
Win11 共享→Windows Server 访问故障总结(极简可复用)
开发语言·windows·php
niucloud-admin13 小时前
PHP V6 单商户常见问题——本地phpstudy部署,访问域名/admin 、域名/wap无法自动跳转对应首页问题
php
tang7778913 小时前
代理IP质量检测实战:Python实现IP可用性、延迟、匿名度自动测试脚本
大数据·爬虫·python·网络协议·tcp/ip
隔窗听雨眠14 小时前
MySQL主从延迟根因诊断法
开发语言·php
niucloud-admin15 小时前
PHP V6 单商户常见问题——运行内存太小导致的报错处理
php
nbwenren16 小时前
办公AI实测:Gemini3、GPT-4o、Claude3.5谁更强?
服务器·数据库·php
hopetomorrow17 小时前
学习路之PHP --PHP 常用扩展及作用表
开发语言·学习·php
幽络源小助理17 小时前
影视脚本分镜在线协作系统源码 PHP剧本创作平台
开发语言·php