Scrapy多级请求实战:5sing伴奏网爬取踩坑与优化全记录(JSON提取+Xpath解析)前言:本次实战围绕5sing伴奏网热榜歌曲爬取展开,核心需求是获取首页热榜歌曲基础信息,并深入详情页提取歌曲分类、格式、大小、下载量等完整数据。开发过程中,核心突破点在于发现网站数据存储的差异化的特点——首页热榜数据以JSON字段形式嵌入页面源码,详情页则为标准HTML结构,由此完成了从Xpath解析到正则提取的切换,同时实现Scrapy多级请求(即大家常说的“二次爬取”,专业表述为Scrapy多级请求/二级页面爬取),全程踩坑不断,最终完成优化落地,特此整理成实战笔记,供各位爬虫爱好者参考避坑。