爬虫案例-爬取某狗音乐

文章目录

1、爬取代码

python 复制代码
import time
import requests
import hashlib
import jsonpath
import os

url = "https://wwwapi.kugou.com/play/songinfo"

#伪造请求头
header= {
    "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36 QuarkPC/2.3.0.256"

}
#uuid = str(int(time.time()))
clinenttime = str(int(time.time()*1000))

#print(uuid)
#print(clinenttime)
# 数据列表
data_list = [
"NVPh5oo715z5DIWAeQlhMDsWXXQV4hwt",
"appid=1014",
f"clienttime={clinenttime}",
"clientver=20000",
"dfid=2UHWk60sDseo11EBHT1lYwCJ",
"encode_album_audio_id=c2bdq0fc",
"mid=51d94f366e27b4cd47c2f46aa11ac7e6",
"platid=4",
"srcappid=2919",
"token=a062aa8f897a25ed7b96c1e3919c42febd73e21a1a775fafd959f2ff63e36697",
"userid=2307953011",
"uuid=51d94f366e27b4cd47c2f46aa11ac7e6",
"NVPh5oo715z5DIWAeQlhMDsWXXQV4hwt"
]

# 将列表拼接成一个完整的字符串
data = "".join(data_list)
#MD5加密
md5_hash = hashlib.md5(data.encode()).hexdigest()
#md5 = md5_hash.upper()
#print(md5_hash)


params= {
    "srcappid":"2919",
    "clientver":"20000",
    "clienttime":{clinenttime},
    "mid":"51d94f366e27b4cd47c2f46aa11ac7e6",
    "uuid":"51d94f366e27b4cd47c2f46aa11ac7e6",
    "dfid":"2UHWk60sDseo11EBHT1lYwCJ",
    "appid":"1014",
    "platid":"4",
    "encode_album_audio_id":"c2bdq0fc",
    "token":"a062aa8f897a25ed7b96c1e3919c42febd73e21a1a775fafd959f2ff63e36697",
    "userid":"2307953011",
    "signature":{md5_hash}
}
#请求URL
request = requests.get(url,headers=header,params=params)
json = request.json()
#print(json)

#提取音乐名称、下载音乐地址
muisc_info = {
        "音乐名称": jsonpath.jsonpath(json,"$..audio_name")[0],
        "下载音乐地址" :  jsonpath.jsonpath(json,"$..play_url")[0]
}
print(muisc_info['音乐名称'],muisc_info['下载音乐地址'])
# 创建输出目录
output_folder = r"C:/Users/zzx/Desktop/音乐" + "/"
if not os.path.exists(output_folder):
    os.makedirs(output_folder)

# 下载音乐文件
music_url = muisc_info["下载音乐地址"]
music_response = requests.get(music_url, headers=header)

# 保存音乐文件
music_filename = os.path.join(output_folder, f"{muisc_info['音乐名称']}.mp3")
with open(music_filename, mode="wb") as f:
    f.write(music_response.content)

print(f"音乐已保存到: {music_filename}")

2、效果图


相关推荐
隔窗听雨眠15 小时前
大模型加爬虫上篇:技术融合与架构革新
爬虫·架构
Super Scraper19 小时前
如何批量抓取 TikTok 数据而不被封锁?完整指南
爬虫·ai·自动化·抖音·tiktok·ai agent
深蓝电商API20 小时前
自动化录屏 + 截图:打造爬虫调试的上帝视角
爬虫
tang7778921 小时前
市场调研自动化采集架构:基于住宅IP轮换的APP数据抓取与反风控方案
爬虫·动态代理ip·爬虫代理ip·爬虫动态ip·住宅代理ip·动态住宅ip
数据知道21 小时前
指纹浏览器环境的导入、导出、快照与云端同步机制
爬虫·数据采集·指纹浏览器
星川皆无恙21 小时前
大数据k-means聚类算法:基于k-means聚类算法+NLP微博舆情数据爬虫可视化分析推荐系统(新版)
大数据·人工智能·爬虫·算法·机器学习·自然语言处理·kmeans
小二·1 天前
Rust 爬虫与数据处理实战:大规模并发抓取 + 流式处理
开发语言·爬虫·rust
在放️1 天前
Python 爬虫 · 第三方代理接入与合规使用
开发语言·爬虫·python
隔窗听雨眠1 天前
大模型加爬虫中篇:工程实践与应用场景
爬虫