Ozon 商品页数据解析与提取 API

Ozon 官方 Seller API 没有直接提供 "关键词搜索商品页" 的公开接口 ,只能获取自己店铺 的商品数据。要实现 "关键词→商品列表→详情解析提取",主流方案是:第三方采集 API(无需卖家权限)自建爬虫。下面是完整方案与可用接口。


一、第三方关键词商品页数据 API(推荐,开箱即用)

1. TMAPI(Ozon 关键词搜索 + 详情采集)

  • 接口GET https://api.tmapi.top/ozon/search
  • 参数
    • keyword:俄语关键词(如 ноутбук
    • page:页码(默认 1)
    • limit:每页数量(默认 50)
    • token:你的密钥
  • 返回:关键词搜索结果列表(商品 ID、标题、价格、主图、店铺、评分、销量、是否广告)
  • 详情补全 :拿到 product_id 后,调用 https://api.tmapi.top/ozon/item/detail?product_id=xxx 拉取完整详情(属性、描述、多图、规格、库存、评论)

2. OzonRobots(萝卜头)关键词采集 API

  • 接口POST https://api.ozontool.com/v1/search/keyword
  • 参数keywordpagesort(价格 / 销量 / 评分)
  • 返回:商品列表 + 排名、广告位、物流时效、评价数、评分
  • 优势:支持批量关键词、自动翻页、导出 Excel/JSON

3. iWeb Data Scraping Ozon Keyword API

  • 接口GET https://api.iwebdatascraping.com/ozon/keyword-search
  • 参数qcountrypage
  • 返回:结构化商品数据,含价格、库存、卖家、类目、URL

二、自建方案:关键词搜索页爬虫 + 详情解析(技术可控)

1. 关键词搜索页抓取(示例 URL)

  • 搜索 URL:https://www.ozon.ru/search/?from_global=true&text={俄语关键词}
  • 翻页:&page={n}
  • 排序:&sorting={price/price_desc/score/activity}

2. 商品详情页抓取(示例 URL)

  • 详情 URL:https://www.ozon.ru/product/{product_id}-{slug}/

3. 解析提取核心字段(JSON 结构示例)

json

复制代码
{
  "keyword": "ноутбук",
  "page": 1,
  "products": [
    {
      "product_id": 12345678,
      "title": "Ноутбук Lenovo IdeaPad 5 15ITL05",
      "price": 59990,
      "old_price": 69990,
      "discount": 14,
      "brand": "Lenovo",
      "category": "Ноутбуки",
      "images": ["https://..."],
      "rating": 4.7,
      "reviews_count": 1245,
      "seller": "ООО ТехноМаркет",
      "is_ad": false,
      "stock": "В наличии",
      "attributes": {
        "Процессор": "Intel Core i5-1135G7",
        "Оперативная память": "16 ГБ",
        "Накопитель": "512 ГБ SSD"
      },
      "description": "Полное описание товара..."
    }
  ]
}

4. 技术栈建议

  • Pythonrequests + BeautifulSoup / parsel(轻量)
  • Scrapy:适合大规模批量采集
  • 代理:必须使用俄罗斯 / 欧洲住宅代理(防封)
  • 反爬:随机 UA、请求间隔≥3 秒、验证码处理(可接入 2Captcha)
相关推荐
JaguarJack1 天前
告别 Laravel 缓慢的 Blade!Livewire Blaze 来了,为你的 Laravel 性能提速
后端·php·laravel
郑州光合科技余经理2 天前
代码展示:PHP搭建海外版外卖系统源码解析
java·开发语言·前端·后端·系统架构·uni-app·php
QQ5110082852 天前
python+springboot+django/flask的校园资料分享系统
spring boot·python·django·flask·node.js·php
WeiXin_DZbishe2 天前
基于django在线音乐数据采集的设计与实现-计算机毕设 附源码 22647
javascript·spring boot·mysql·django·node.js·php·html5
longxiangam2 天前
Composer 私有仓库搭建
php·composer
cipher2 天前
crawl4ai:AI时代的数据采集利器——从入门到实战
后端·爬虫·python
上海云盾-高防顾问2 天前
DNS异常怎么办?快速排查+解决指南
开发语言·php
ShoreKiten2 天前
关于解决本地部署sqli-labs无法安装低版本php环境问题
开发语言·php
liliangcsdn2 天前
深入探索TD3算法的推理过程
开发语言·php
troublea2 天前
ThinkPHP vs Laravel:PHP框架终极对决
开发语言·php·laravel