【淘宝采集项目经验分享】商品评论采集 |商品详情采集 |关键词搜索商品信息采集

商品评论采集

1、输入商品ID

2、筛选要抓取评论类型

3、填写要抓取的页数

4、立刻提交-启动测试

5、等爬虫结束后就可以到"爬取结果"里面下载数据

商品详情采集

1、输入商品ID

2、立刻提交-启动爬虫

3、等爬虫结束后就可以到"爬取结果"里面下载数据

taobao.item_get

公共参数

名称 类型 必须 描述
key String 调用key(必须以GET方式拼接在URL中)
secret String 调用密钥
api_name String API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cache String [yes,no]默认yes,将调用缓存的数据,速度比较快
result_type String [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
lang String [cn,en,ru]翻译语言,默认cn简体中文
version String API版本

请求参数

请求参数:num_iid=652874751412&is_promotion=1

参数说明:num_iid:淘宝商品ID

is_promotion:是否获取取促销价

响应参数

Version: Date:2022-04-04

名称 类型 必须 示例值 描述
item item[] 1 宝贝详情数据

关键词搜索商品信息采集关键词搜索商品信息采集

1、搜索关键词

2、相关分类id(选填)

3、价格开始区间(选填)

4、价格结束区间(选填)

5、获取页数(选填)

6、排序(选填)

7、立刻提交-启动爬虫

8、等爬虫结束后就可以到"爬取结果"里面下载数据

公共参数

名称 类型 必须 描述
key String 调用key(必须以GET方式拼接在URL中)
secret String 调用密钥
api_name String API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cache String [yes,no]默认yes,将调用缓存的数据,速度比较快
result_type String [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
lang String [cn,en,ru]翻译语言,默认cn简体中文
version String API版本

请求参数

请求参数:q=女装&start_price=0&end_price=0&page=1&cat=0&discount_only=&sort=&page_size=&seller_info=&nick=&ppath=&imgid=&filter=

参数说明:q:搜索关键字

page:页数

响应参数

Version: Date:

名称 类型 必须 示例值 描述
title String 0 法式复古山本超仙chic仙女赫本网红初春很仙法国小众裙子两件套装 商品标题
pic_url String 0 //img.alicdn.com/bao/uploaded/i3/3083218865/O1CN012FMDaiwxkenJGaM_!!0-item_pic.jpg 宝贝图片
promotion_price Float 0 178.00 优惠价
price Float 0 178.00 价格
num_iid Bigint 0 577437133060 宝贝ID
area String 0 山东 店铺所在地
detail_url String 0 //detail.tmall.com/item.htm?id=586794298909&ns=1&abbucket=0 宝贝链接
相关推荐
2401_8288906413 分钟前
使用 BERT 实现意图理解和实体识别
人工智能·python·自然语言处理·bert·transformer
Chan1629 分钟前
【智能协同云图库】基于统一接口架构构建多维度分析功能、结合 ECharts 可视化与权限校验实现用户 / 管理员图库统计、通过 SQL 优化与流式处理提升数据
java·spring boot·后端·sql·spring·intellij-idea·echarts
qq_312920111 小时前
Nginx限流与防爬虫与安全配置方案
运维·爬虫·nginx·安全
float_六七1 小时前
预编译SQL:安全与性能的双重保障
sql·安全·oracle
多恩Stone1 小时前
【3DV 进阶-2】Hunyuan3D2.1 训练代码详细理解下-数据读取流程
人工智能·python·算法·3d·aigc
xiaopengbc2 小时前
在 Python 中实现观察者模式的具体步骤是什么?
开发语言·python·观察者模式
Python大数据分析@2 小时前
python用selenium怎么规避检测?
开发语言·python·selenium·网络爬虫
ThreeAu.2 小时前
Miniconda3搭建Selenium的python虚拟环境全攻略
开发语言·python·selenium·minicoda·python环境配置
yddddddy2 小时前
SQLite的基本操作
数据库·sqlite