视频爬虫:解析m3u8文件 python m3u8库,m3u8文件中.ts视频流的解密下载

一、引用的库

这里需要引用的库是:from Crypto.Cipher import AES

有坑哈,python3.0之后直接安装crypto你会发现不管怎么着都会报错。

经过查找资料找到了原因,原来是20年之后crypto已经被pycryptohome替换掉啦,

如果之前安装过crypyo 活pycrypto需要先卸载

bash 复制代码
pip uninstall crypyo 
pip uninstall pycrypyo 

然后再安装pycryptohome就可以啦

bash 复制代码
pip install pycryptohome

二、解密的过程

首先我们需要确定m3u8是不是被加密的

打开m3u8文件

看是否存在这一行:#EXT-X-KEY:METHOD=AES-128,URI=

这就代表文件被加密了,这时候你下载下来的.ts文件是无法播放的

那就让我呢吧解读一下这一段:AES-128代表加密方式

后面跟的url='key.key'是key的链接地址,这个很关键,我们解密就需要用到key

接下来的步骤就是我们访问key的链接获取到返回信息,然后调用AES自带的解密方法解密并下载文件

三、解密的方法

首先是需要通过key链接获取返回值

python 复制代码
key = requests.get(key_url).content

然后我们就可以对key进行解密

python 复制代码
cryptor = AES.new(key, AES.MODE_CBC,key)

最后调用解密结果实现下载

python 复制代码
ts.write(cryptor.decrypt(res_ts))

四、实现方式

代码:

python 复制代码
import requests
from Crypto.Cipher import AES

key_url = 'https://www.atstudy.com/api/courseMedia/GetKey?edk=CiBnHz2yhhWf9TMN2QQATvr3dtnOPmVYldMtBjyDipZMVRCO08TAChiaoOvUBCokZGVkZmJkYjQtNDdhYy00NDQxLTkxYzMtYWY3NTQ3ZTgzZTZm&fileId=3701925920444339591&keySource=VodBuildInKMS.key'
ts_url = 'https://1400200613.vod2.myqcloud.com/32a2cf22vodtranssh1400200613/496eef453701925920444339591/drm/v.f230.ts'
key = requests.get(key_url).content
res_ts = requests.get(ts_url).content

下载ts文件

python 复制代码
with open('D:\\test1\\11.ts','wb') as ts:
    # 解密
    cryptor = AES.new(key, AES.MODE_CBC,key)
    ts.write(cryptor.decrypt(res_ts))
    print('下载完成')

完整代码

python 复制代码
import time
from Crypto.Util.Padding import pad
from Crypto.Cipher import AES
import requests
import m3u8

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"
}





def AESDecrypt(cipher_text, key, iv):
    cipher_text = pad(data_to_pad=cipher_text, block_size=AES.block_size)
    aes = AES.new(key=key, mode=AES.MODE_CBC, iv=key)
    cipher_text = aes.decrypt(cipher_text)
    return cipher_text


def download_m3u8_video(url, save_name):
    playlist = m3u8.load(uri=url, headers=headers)
    key = requests.get(playlist.keys[-1].uri, headers=headers).content

    n = len(playlist.segments)
    size = 0
    start = time.time()
    for i, seg in enumerate(playlist.segments, 1):
        r = requests.get(seg.absolute_uri, headers=headers)
        data = r.content
        data = AESDecrypt(data, key=key, iv=key)
        size += len(data)
        with open(save_name, "ab" if i != 1 else "wb") as f:
            f.write(data)
        print(
            f"\r下载进度({i}/{n}),已下载:{size/1024/1024:.2f}MB,下载已耗时:{time.time()-start:.2f}s", end=" ")


download_m3u8_video('https://xxx/playlist.m3u8', 'xxxxxx.mp4')

若在运行的时候出现No module named m3u8

bash 复制代码
python # ImportError: No module named m3u8

在终端执行以下代码进行安装

bash 复制代码
pip install m3u8

说明:
如果视频无加密,可以去除加密部分的代码,直接遍历请求每个ts链接,然后写入文件,再合并即可

相关推荐
万粉变现经纪人12 分钟前
如何解决pip安装报错ModuleNotFoundError: No module named ‘sympy’问题
python·beautifulsoup·pandas·scikit-learn·pyqt·pip·scipy
xiaohouzi11223335 分钟前
Python读取视频-硬解和软解
python·opencv·ffmpeg·视频编解码·gstreamer
念念不忘 必有回响39 分钟前
Pygame模块化实战:从零构建Aliens射击游戏全流程(一)
python·游戏·pygame
☼←安于亥时→❦8 小时前
PyTorch 梯度与微积分
人工智能·pytorch·python
程序员三藏8 小时前
2025最新的软件测试面试八股文(800+道题)
自动化测试·软件测试·python·功能测试·测试工具·面试·职场和发展
Pocker_Spades_A9 小时前
Python快速入门专业版(二十三):for循环基础:遍历字符串、列表与range()函数(计数案例)
python
闲人编程9 小时前
图像去雾算法:从物理模型到深度学习实现
图像处理·人工智能·python·深度学习·算法·计算机视觉·去雾
Kyln.Wu10 小时前
【python实用小脚本-211】[硬件互联] 桌面壁纸×Python梦幻联动|用10行代码实现“开机盲盒”自动化改造实录(建议收藏)
开发语言·python·自动化
杨天天.11 小时前
小程序原生实现音频播放器,下一首上一首切换,拖动进度条等功能
前端·javascript·小程序·音视频
Ms_Big11 小时前
ppliteseg改rknn,部署在嵌入式板,加速模型
人工智能·python·深度学习