下载盗版网站视频并将.ts视频文件合并

.

1.分析视频请求

1

通过抓包观察我们发现视频是由.ts文件拼接成的每一个.ts文件代表一小段

2


通过观察0.ts和1.ts的url我们发现他们只有最后一段不同我们网上找到url获取的包

3

我们发现index.m3u8中储存着所有的.ts文件名在拼接上前面固定的url就可以获取到.ts文件

2.数据获取和拼接

python 复制代码
import shutil
import requests
import re
import os
from multiprocessing.dummy import Pool

url ='https://vip.lz-cdn.com/20221109/37176_faf59775/1200k/hls/mixed.m3u8' # m3u8网址

res = requests.get(url).text
print(res)
# 正则提取内容
ts=re.findall(r",\n(.*?)\d+.ts",res,flags=re.S)[0]
print(ts)
ts2=re.findall(r"(\d+).ts",res,flags=re.S)
print(ts2)
start=int(ts2[0])
end=int(ts2[-1])
def xlx(i):
    i=ts+str(i)
        # 拼接完整的ts文件下载链接
    u = 'https://vip.lz-cdn.com/20221109/37176_faf59775/1200k/hls/' + i + ".ts"#拼接url
    r = requests.get(url=u).content
    print(i, u)
        # 二进制写入到本地

    with open('./nihao/' + i + '.ts', mode="wb") as file:
        file.write(r)


if not os.path.exists('./nihao'):
    os.mkdir('./nihao')
else:
    shutil.rmtree('./nihao')
    os.mkdir('./nihao')



pool = Pool(100)                                     #开启线程池
        # 定义循环数
origin_num = [ x for x in range(start,end+1)]

pool.map(xlx, origin_num)

os.system('copy /b ' + r'E:\python\xinfadi\nihao\*.ts ' + r'E:\python\xinfadi\new.mp4')
print("合并成功")
相关推荐
_.Switch10 分钟前
Python机器学习模型的部署与维护:版本管理、监控与更新策略
开发语言·人工智能·python·算法·机器学习
Hoper.J30 分钟前
PyTorch 模型保存与加载的三种常用方式
人工智能·pytorch·python
弱冠少年1 小时前
websockets库使用(基于Python)
开发语言·python·numpy
技术无疆2 小时前
【Python】Streamlit:为数据科学与机器学习打造的简易应用框架
开发语言·人工智能·python·深度学习·神经网络·机器学习·数据挖掘
羊小猪~~2 小时前
机器学习/数据分析--用通俗语言讲解时间序列自回归(AR)模型,并用其预测天气,拟合度98%+
人工智能·python·机器学习·数据挖掘·数据分析·回归·时序数据库
qq_273900232 小时前
解析TMalign文本文件中的转换矩阵
python·生物信息学
阿华的代码王国3 小时前
【JavaEE】——文件IO的应用
开发语言·python
电饭叔3 小时前
《python语言程序设计》2018版第8章19题几何Rectangle2D类(下)-头疼的几何和数学
开发语言·python
程序猿小D4 小时前
第二百六十七节 JPA教程 - JPA查询AND条件示例
java·开发语言·前端·数据库·windows·python·jpa
cuijiecheng20184 小时前
音视频入门基础:FLV专题(13)——FFmpeg源码中,解析任意Type值的SCRIPTDATAVALUE类型的实现
ffmpeg·音视频