【淘宝采集项目经验分享】商品评论采集 |商品详情采集 |关键词搜索商品信息采集

商品评论采集

1、输入商品ID

2、筛选要抓取评论类型

3、填写要抓取的页数

4、立刻提交-启动测试

5、等爬虫结束后就可以到"爬取结果"里面下载数据

商品详情采集

1、输入商品ID

2、立刻提交-启动爬虫

3、等爬虫结束后就可以到"爬取结果"里面下载数据

taobao.item_get

公共参数

名称 类型 必须 描述
key String 调用key(必须以GET方式拼接在URL中)
secret String 调用密钥
api_name String API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cache String [yes,no]默认yes,将调用缓存的数据,速度比较快
result_type String [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
lang String [cn,en,ru]翻译语言,默认cn简体中文
version String API版本

请求参数

请求参数:num_iid=652874751412&is_promotion=1

参数说明:num_iid:淘宝商品ID

is_promotion:是否获取取促销价

响应参数

Version: Date:2022-04-04

名称 类型 必须 示例值 描述
item item[] 1 宝贝详情数据

关键词搜索商品信息采集关键词搜索商品信息采集

1、搜索关键词

2、相关分类id(选填)

3、价格开始区间(选填)

4、价格结束区间(选填)

5、获取页数(选填)

6、排序(选填)

7、立刻提交-启动爬虫

8、等爬虫结束后就可以到"爬取结果"里面下载数据

公共参数

名称 类型 必须 描述
key String 调用key(必须以GET方式拼接在URL中)
secret String 调用密钥
api_name String API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cache String [yes,no]默认yes,将调用缓存的数据,速度比较快
result_type String [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
lang String [cn,en,ru]翻译语言,默认cn简体中文
version String API版本

请求参数

请求参数:q=女装&start_price=0&end_price=0&page=1&cat=0&discount_only=&sort=&page_size=&seller_info=&nick=&ppath=&imgid=&filter=

参数说明:q:搜索关键字

page:页数

响应参数

Version: Date:

名称 类型 必须 示例值 描述
title String 0 法式复古山本超仙chic仙女赫本网红初春很仙法国小众裙子两件套装 商品标题
pic_url String 0 //img.alicdn.com/bao/uploaded/i3/3083218865/O1CN012FMDaiwxkenJGaM_!!0-item_pic.jpg 宝贝图片
promotion_price Float 0 178.00 优惠价
price Float 0 178.00 价格
num_iid Bigint 0 577437133060 宝贝ID
area String 0 山东 店铺所在地
detail_url String 0 //detail.tmall.com/item.htm?id=586794298909&ns=1&abbucket=0 宝贝链接
相关推荐
2301_818419016 分钟前
Python内存管理机制:垃圾回收与引用计数
jvm·数据库·python
qq_4176950510 分钟前
构建一个桌面版的天气预报应用
jvm·数据库·python
cm65432011 分钟前
Python在金融科技(FinTech)中的应用
jvm·数据库·python
小陈的进阶之路14 分钟前
Selenium 常用操作 API
python·自动化·pytest
2301_8166512216 分钟前
如何从Python初学者进阶为专家?
jvm·数据库·python
umeelove3526 分钟前
SQL中的DISTINCT、SQL DISTINCT详解、DISTINCT的用法、DISTINCT注意事项
java·数据库·sql
2501_9181269127 分钟前
学习所有python写服务器的语句
服务器·人工智能·python·学习·个人开发
@insist12327 分钟前
数据库系统工程师-嵌入式 SQL 与存储过程核心原理与应试指南
数据库·sql·软考·数据库系统工程师·软件水平考试
j_xxx404_32 分钟前
爬虫对抗:ZLibrary反爬机制实战分析 (三) - 突破高频访问限制与TLS指纹(JA3)风控
爬虫
m0_5698814733 分钟前
使用Python自动收发邮件
jvm·数据库·python