爬虫案例-爬取某狗音乐

文章目录

1、爬取代码

python 复制代码
import time
import requests
import hashlib
import jsonpath
import os

url = "https://wwwapi.kugou.com/play/songinfo"

#伪造请求头
header= {
    "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36 QuarkPC/2.3.0.256"

}
#uuid = str(int(time.time()))
clinenttime = str(int(time.time()*1000))

#print(uuid)
#print(clinenttime)
# 数据列表
data_list = [
"NVPh5oo715z5DIWAeQlhMDsWXXQV4hwt",
"appid=1014",
f"clienttime={clinenttime}",
"clientver=20000",
"dfid=2UHWk60sDseo11EBHT1lYwCJ",
"encode_album_audio_id=c2bdq0fc",
"mid=51d94f366e27b4cd47c2f46aa11ac7e6",
"platid=4",
"srcappid=2919",
"token=a062aa8f897a25ed7b96c1e3919c42febd73e21a1a775fafd959f2ff63e36697",
"userid=2307953011",
"uuid=51d94f366e27b4cd47c2f46aa11ac7e6",
"NVPh5oo715z5DIWAeQlhMDsWXXQV4hwt"
]

# 将列表拼接成一个完整的字符串
data = "".join(data_list)
#MD5加密
md5_hash = hashlib.md5(data.encode()).hexdigest()
#md5 = md5_hash.upper()
#print(md5_hash)


params= {
    "srcappid":"2919",
    "clientver":"20000",
    "clienttime":{clinenttime},
    "mid":"51d94f366e27b4cd47c2f46aa11ac7e6",
    "uuid":"51d94f366e27b4cd47c2f46aa11ac7e6",
    "dfid":"2UHWk60sDseo11EBHT1lYwCJ",
    "appid":"1014",
    "platid":"4",
    "encode_album_audio_id":"c2bdq0fc",
    "token":"a062aa8f897a25ed7b96c1e3919c42febd73e21a1a775fafd959f2ff63e36697",
    "userid":"2307953011",
    "signature":{md5_hash}
}
#请求URL
request = requests.get(url,headers=header,params=params)
json = request.json()
#print(json)

#提取音乐名称、下载音乐地址
muisc_info = {
        "音乐名称": jsonpath.jsonpath(json,"$..audio_name")[0],
        "下载音乐地址" :  jsonpath.jsonpath(json,"$..play_url")[0]
}
print(muisc_info['音乐名称'],muisc_info['下载音乐地址'])
# 创建输出目录
output_folder = r"C:/Users/zzx/Desktop/音乐" + "/"
if not os.path.exists(output_folder):
    os.makedirs(output_folder)

# 下载音乐文件
music_url = muisc_info["下载音乐地址"]
music_response = requests.get(music_url, headers=header)

# 保存音乐文件
music_filename = os.path.join(output_folder, f"{muisc_info['音乐名称']}.mp3")
with open(music_filename, mode="wb") as f:
    f.write(music_response.content)

print(f"音乐已保存到: {music_filename}")

2、效果图


相关推荐
源码之家21 小时前
计算机毕业设计:Python智慧交通大数据分析平台 Flask框架 requests爬虫 出行速度预测 拥堵预测(建议收藏)✅
大数据·hadoop·爬虫·python·数据分析·flask·课程设计
心疼你的一切21 小时前
【矛与盾的博弈:ZLibrary反爬机制实战分析与绕过技术全解析】
人工智能·爬虫·python·网络爬虫
axinawang21 小时前
XPath与lxml解析库
爬虫·python
亿牛云爬虫专家1 天前
爬虫踩坑实录:OkHttp 接入爬虫代理报 Too many tunnel connections attempted 深度解析
爬虫·okhttp·https·爬虫代理·connect·隧道代理·ip 切换
源码之家1 天前
计算机毕业设计:Python汽车销量数据采集分析可视化系统 Flask框架 requests爬虫 可视化 车辆 大数据 机器学习 hadoop(建议收藏)✅
大数据·爬虫·python·django·flask·课程设计·美食
遇事不決洛必達1 天前
AST反混淆脚本
javascript·爬虫·nodejs·ast·ob混淆
Data 实验室1 天前
TaskPyro “小龙虾版本”专业爬虫管理平台来了:AI+分布式+IM 机器人,一套搞定企业级爬虫调度
人工智能·分布式·爬虫
源码之家1 天前
计算机毕业设计:Python二手车交易价格预测分析平台 Django框架 随机森林 可视化 数据分析 汽车 车辆 大数据 hadoop(建议收藏)✅
大数据·爬虫·python·机器学习·django·汽车·课程设计
小白学大数据1 天前
高并发场景下:平衡搜索引擎收录与爬虫流量负载方案
爬虫·搜索引擎·pycharm
TU不秃头1 天前
JS逆向实战五:某海关公示平台分析(瑞数加密)
javascript·爬虫