【淘宝采集项目经验分享】商品评论采集 |商品详情采集 |关键词搜索商品信息采集

商品评论采集

1、输入商品ID

2、筛选要抓取评论类型

3、填写要抓取的页数

4、立刻提交-启动测试

5、等爬虫结束后就可以到"爬取结果"里面下载数据

商品详情采集

1、输入商品ID

2、立刻提交-启动爬虫

3、等爬虫结束后就可以到"爬取结果"里面下载数据

taobao.item_get

公共参数

名称 类型 必须 描述
key String 调用key(必须以GET方式拼接在URL中)
secret String 调用密钥
api_name String API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cache String [yes,no]默认yes,将调用缓存的数据,速度比较快
result_type String [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
lang String [cn,en,ru]翻译语言,默认cn简体中文
version String API版本

请求参数

请求参数:num_iid=652874751412&is_promotion=1

参数说明:num_iid:淘宝商品ID

is_promotion:是否获取取促销价

响应参数

Version: Date:2022-04-04

名称 类型 必须 示例值 描述
item item[] 1 宝贝详情数据

关键词搜索商品信息采集关键词搜索商品信息采集

1、搜索关键词

2、相关分类id(选填)

3、价格开始区间(选填)

4、价格结束区间(选填)

5、获取页数(选填)

6、排序(选填)

7、立刻提交-启动爬虫

8、等爬虫结束后就可以到"爬取结果"里面下载数据

公共参数

名称 类型 必须 描述
key String 调用key(必须以GET方式拼接在URL中)
secret String 调用密钥
api_name String API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cache String [yes,no]默认yes,将调用缓存的数据,速度比较快
result_type String [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
lang String [cn,en,ru]翻译语言,默认cn简体中文
version String API版本

请求参数

请求参数:q=女装&start_price=0&end_price=0&page=1&cat=0&discount_only=&sort=&page_size=&seller_info=&nick=&ppath=&imgid=&filter=

参数说明:q:搜索关键字

page:页数

响应参数

Version: Date:

名称 类型 必须 示例值 描述
title String 0 法式复古山本超仙chic仙女赫本网红初春很仙法国小众裙子两件套装 商品标题
pic_url String 0 //img.alicdn.com/bao/uploaded/i3/3083218865/O1CN012FMDaiwxkenJGaM_!!0-item_pic.jpg 宝贝图片
promotion_price Float 0 178.00 优惠价
price Float 0 178.00 价格
num_iid Bigint 0 577437133060 宝贝ID
area String 0 山东 店铺所在地
detail_url String 0 //detail.tmall.com/item.htm?id=586794298909&ns=1&abbucket=0 宝贝链接
相关推荐
iracole39 分钟前
深度学习训练Camp:第R5周:天气预测
人工智能·python·深度学习
Java开发-楠木2 小时前
【js逆向】某预约票网站 (webpack技术)
爬虫
梦丶晓羽3 小时前
自然语言处理:最大期望值算法
人工智能·python·自然语言处理·高斯混合模型·最大期望值算法
酒酿祺子4 小时前
蓝队第三次
sql
君科程序定做4 小时前
PDFMathTranslate安装使用
python
Linzerox5 小时前
Pycharm 取消拼写错误检查(Typo:in word xxx)
python·pycharm
千里码aicood5 小时前
[含文档+PPT+源码等]精品基于Python实现的校园小助手小程序的设计与实现
开发语言·前端·python
SRC_BLUE_176 小时前
[网络爬虫] 动态网页抓取 — Selenium 入门操作
网络·爬虫·selenium·测试工具
Icomi_6 小时前
【神经网络】0.深度学习基础:解锁深度学习,重塑未来的智能新引擎
c语言·c++·人工智能·python·深度学习·神经网络
蠟筆小新工程師6 小时前
Deepseek可以通过多种方式帮助CAD加速工作
开发语言·python·seepdeek