前言
做无货源、电商铺货、淘系精细化运营的朋友,最大痛点莫过于人工盯盘选品效率太低:每天手动翻找爆款、记录价格波动、跟踪销量变化,动辄耗费大半天,还容易错过新品红利、低价货源窗口期。传统浏览器爬虫又频繁遭遇反爬、验证码封禁、IP 受限,稳定性极差。
最近在用开源自动化框架 OpenClaw(圈内戏称小龙虾)对接第三方标准化淘宝商品详情 API(item_get_pro),不用自建爬虫、不用处理页面加密,依靠接口实时拉取全维度商品数据,搭配定时任务实现 7×24 小时自动监控、筛选潜力爆款,实测个人小团队单日可高效筛选上百个优质商品。本文从原理、环境部署、接口接入、代码落地、筛选逻辑全流程拆解,代码复制改密钥即可运行。
一、方案选型:API+OpenClaw 为什么优于传统爬虫?
1. item_get_pro 接口核心优势(对接的淘宝商品详情高级接口)
该接口是成熟商用标准化接口,区别于淘宝官方开放平台繁琐的资质报备、类目权限审核,开箱即用,核心返回字段覆盖选品全要素,也是我们选品的数据根基:
- 基础信息:商品标题、sku 规格、一口价 / 活动价、原价、上下架时间、商品 ID、类目 ID、品牌信息
- 销售数据:月销量、总销量、收货人数、好评率、sku 库存数据(核心选品指标)
- 营销信息:优惠券面额、满减活动、淘客佣金比例、是否参与平台活动(618 / 百亿补贴)
- 店铺信息:店铺层级、开店时长、动态评分(DSR 三项)、主营类目,用来筛选优质货源店铺
2. OpenClaw 框架的价值
OpenClaw 是开源 AI 自动化代理框架,核心能力是任务调度 + 定时轮询 + 数据清洗 + 告警推送,不用手写复杂定时脚本,天然适配 API 批量调用、数据入库、条件筛选,支持自然语言配置监控规则,新手不用深耕运维也能搭建自动化系统:
- 内置定时调度引擎:自定义每 1/3/6 小时轮询目标商品池
- 多源数据整合:API 返回 JSON 一键解析,对接 Excel/MySQL 存储
- 消息提醒:筛选出符合条件的潜力品自动推送企业微信 / 钉钉消息
- 低代码扩展:后续可叠加关键词搜索接口,批量抓取类目新品
整体链路:OpenClaw 定时发起请求→调用 item_get_pro 获取淘宝商品全量数据→Python 脚本清洗数据→自定义筛选规则(价格、销量、佣金)→达标商品入库 + 自动告警
二、前期环境准备(三步搞定,Windows/Mac/ 云服务器通用)
1. 环境依赖安装
本地提前装好 Python3.8 及以上版本,打开终端执行依赖安装:
# 安装接口请求、数据处理、表格存储依赖
pip install requests pandas openpyxl
# OpenClaw一键安装命令(官方安装脚本)
npx clawhub@latest install EcommerceCrawlSkill PriceMonitorSkill
EcommerceCrawlSkill:OpenClaw 电商数据采集技能;PriceMonitorSkill:价格 & 销量监控核心技能,两个是对接 API 必装插件。
2. 接口账号申请与参数准备
- 前往接口服务商平台注册账号,获取API 密钥(apikey)、秘钥(secret)(接口请求鉴权必备)
- 接口固定请求地址:
- 提前整理需要监控的商品 ID 清单(excel 存放,后续代码批量读取),支持淘宝 / 天猫全品类商品 ID
3. OpenClaw 初始化配置
终端输入初始化指令,配置本地服务(默认本地 127.0.0.1 访问,避免公网暴露风险):
openclaw config set bind_ip 127.0.0.1
openclaw restart
三、完整实操代码(两段:API 请求 + OpenClaw 定时选品筛选,可直接复制)
说明:代码分两部分,第一部分是独立 Python 接口调用脚本,实现单商品 / 批量商品数据拉取;第二部分嵌入 OpenClaw 定时任务,自动执行选品规则、数据落表、达标提醒,替换 appkey 即可运行。
代码 1:taobao_item_api.py|调用 item_get_pro 接口拉取商品数据
import requests
import pandas as pd
import json
from datetime import datetime
# ==========用户自定义配置区【只改这里参数即可】==========
APP_KEY = "你的接口申请的appkey" # 替换成自己密钥
API_URL = "https://api.open.onebound.cn/taobao/item_get_pro"
# 待监控商品ID列表,可手动填写,也可从excel批量读取
ITEM_ID_LIST = ["725896325412", "693258741259", "598741236985"]
SAVE_EXCEL_PATH = "./淘宝选品监控数据表.xlsx" # 数据保存路径
# ======================================================
def get_taobao_item_info(item_id):
"""调用item_get_pro高级接口,获取单品全量详情数据"""
params = {
"appkey": APP_KEY,
"item_id": item_id,
"lang": "zh-CN"
}
try:
resp = requests.get(url=API_URL, params=params, timeout=15)
result = resp.json()
# 接口异常捕获
if result.get("code") != 0:
print(f"商品{item_id}查询失败:{result.get('msg')}")
return None
item_data = result["data"]
# 筛选选品核心字段,剔除无用冗余数据
filter_data = {
"抓取时间": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
"商品ID": item_id,
"商品标题": item_data.get("title", ""),
"现价": item_data.get("price", 0),
"原价": item_data.get("orig_price", 0),
"月销量": item_data.get("month_sold", 0),
"总销量": item_data.get("total_sold", 0),
"佣金比例%": item_data.get("tk_rate", 0),
"好评率": item_data.get("good_rate", 0),
"店铺评分": item_data.get("shop_dsr", ""),
"优惠券金额": item_data.get("coupon_price", 0),
"商品链接": item_data.get("item_url", "")
}
return filter_data
except Exception as e:
print(f"接口请求异常:{str(e)}")
return None
def batch_get_item():
"""批量遍历商品ID,全量采集数据并保存Excel"""
save_list = []
for item in ITEM_ID_LIST:
item_info = get_taobao_item_info(item)
if item_info:
save_list.append(item_info)
# 数据写入Excel,追加存储历史数据
if save_list:
df_new = pd.DataFrame(save_list)
try:
df_old = pd.read_excel(SAVE_EXCEL_PATH)
df_all = pd.concat([df_old, df_new], ignore_index=True)
except:
df_all = df_new
df_all.to_excel(SAVE_EXCEL_PATH, index=False)
print(f"本轮成功采集{len(save_list)}个商品,数据已存入表格")
return save_list
if __name__ == "__main__":
batch_get_item()
代码 2:openclaw_monitor.py|接入 OpenClaw 定时任务 + 自定义选品筛选规则
核心筛选规则(可自行修改参数适配自己类目):月销量 300~5000、佣金≥15%、现价低于原价 6 折、好评率>92%,满足即判定为潜力爆款,自动记录到「优质选品清单」
from openclaw import scheduler # OpenClaw内置定时调度模块
from taobao_item_api import batch_get_item
import pandas as pd
# ==========自定义选品阈值(按需修改)==========
MIN_MONTH_SOLD = 300 # 最低月销
MAX_MONTH_SOLD = 5000 # 最高月销(避开头部红海爆款)
MIN_COMMISSION = 15 # 最低淘客佣金%
MIN_GOOD_RATE = 0.92 # 最低好评率
DISCOUNT_RATE = 0.6 # 低于原价6折
GOOD_ITEM_SAVE = "./潜力爆款清单.xlsx"
# ============================================
def select_good_product():
"""筛选符合条件的潜力商品"""
item_data = batch_get_item()
good_item_list = []
for data in item_data:
# 计算折扣:现价/原价
try:
discount = float(data["现价"]) / float(data["原价"]) if float(data["原价"]) > 0 else 1
except:
discount = 1
# 选品逻辑判断
if (MIN_MONTH_SOLD <= int(data["月销量"]) <= MAX_MONTH_SOLD
and float(data["佣金比例%"]) >= MIN_COMMISSION
and float(data["好评率"]) >= MIN_GOOD_RATE
and discount <= DISCOUNT_RATE):
good_item_list.append(data)
print(f"✅挖到潜力品:{data['商品标题']},商品ID:{data['商品ID']}")
# 优质商品单独存表
if good_item_list:
df_good = pd.DataFrame(good_item_list)
try:
df_history = pd.read_excel(GOOD_ITEM_SAVE)
df_final = pd.concat([df_history, df_good], ignore_index=True)
except:
df_final = df_good
df_final.to_excel(GOOD_ITEM_SAVE, index=False)
# OpenClaw内置消息推送,可对接钉钉/企业微信
scheduler.msg_send(title="新发现淘宝潜力选品", content=f"本轮筛选出{len(good_item_list)}个优质货源,请查看表格")
# OpenClaw配置定时:每4小时自动执行一次全量监控
scheduler.add_job(
func=select_good_product,
trigger="interval",
hours=4,
id="taobao_product_monitor",
replace_existing=True
)
# 启动定时任务
if __name__ == "__main__":
print("OpenClaw淘宝选品监控服务启动成功,每4小时自动轮询筛选...")
scheduler.start()
四、代码运行与落地优化技巧
1. 启动运行
- 先运行
python taobao_item_api.py测试单次接口调用,确认能正常生成 Excel 商品数据表; - 再新开终端运行
python openclaw_monitor.py,OpenClaw 定时任务常驻后台,自动循环监控。
2. 进阶优化(适配批量类目选品)
- 批量导入商品 ID :把全类目商品 ID 存到 csv 文件,用
pd.read_csv读取替换代码里ITEM_ID_LIST,一次监控几百上千商品; - 新增价格异动监控:新增规则:商品 3 天降价超 20% 自动标记,抓取短期低价清仓货源;
- 存储升级 MySQL:替换 Excel 存储,改用 pymysql 入库,方便长期大数据筛选、历史价格回溯;
- OpenClaw 自然语言配置 :不用改代码,在 OpenClaw 控制台输入自然语言修改筛选规则:
把佣金门槛改成12%,月销最低改成200,框架自动更新筛选参数。
五、避坑总结(新手高频踩坑点)
- 接口请求超限:商用接口大多有每日免费额度,大批量轮询时控制单次请求间隔(代码可加 time.sleep (1)),避免短时间高频调用被限流;
- 商品 ID 失效:淘宝商品下架后接口返回空数据,代码已做异常捕获,失效商品自动跳过不影响整体采集;
- OpenClaw 后台挂掉 :部署在云服务器时搭配 nohup 后台常驻,
nohup python openclaw_monitor.py &,服务器关机重启自动重启任务。
六、拓展玩法
基于这套基础架构,后续可继续对接淘宝关键词搜索 API,输入类目关键词批量抓取上新商品 ID,自动加入监控池,实现「新品上线→实时抓取→自动筛选→优质品预警」全链路自动化选品,摆脱每天手动找品的低效模式。