python下载m3u8格式视频

一、安装 m3u8库

复制代码
pip install requests 
pip install requests m3u8

二、编码实现

复制代码
import os
import re
import requests
import subprocess


# 下载ts文件
def down_ts_file(base_url, m3u8_url, download_dir):
    # 从m3u8文件中获取所有ts的分片名称信息
    response = requests.get(base_url + m3u8_url)
    ts_urls = re.findall(r'(\S+\.ts)', response.text)
    ts_file_list = []
    for i, ts_url in enumerate(ts_urls):
        # ts网络地址全路径    
        response = requests.get(base_url + ts_url, stream=True)
        ts_file_list.append(download_dir + f'segment{i}.ts')
        filename = os.path.join(download_dir, f'segment{i}.ts')
        with open(filename, 'wb') as f:
            for chunk in response.iter_content(chunk_size=1024):
                if chunk:
                    f.write(chunk)
        print("分片{}下载完成".format(i))
    return ts_file_list


# 合并ts文件转成MP4
def merge_ts(ts_file_list, output_filename):
    args = '|'.join(ts_file_list)
    print("merge_ts args----"+args)
    command = f'ffmpeg -i "concat:{args}" -c copy {output_filename}'
    subprocess.run(command, shell=True)


def do_crawler():
    m3u8_url = 'mixed.m3u8'
    base_url_list = ["https://v.cdnlz19.com/20241016/50350_17769e38/2000k/hls/"]
    base_download_dir = 'E:/usr/data/UserData/download/{}'
    for i, base_url in enumerate(base_url_list):
        download_dir = base_download_dir.format(i + 1) + "/"
        if not os.path.exists(download_dir):
            os.makedirs(download_dir)
        # 下载的ts分片数据地址,存放在列表中
        ts_file_list = down_ts_file(base_url, m3u8_url, download_dir)
        print(ts_file_list)
        # ts合并后文件的名称
        output_filename = base_download_dir.format(i) + ".mp4"
        merge_ts(ts_file_list, output_filename)
        os.remove(download_dir)
相关推荐
IVEN_7 小时前
只会Python皮毛?深入理解这几点,轻松进阶全栈开发
python·全栈
Ray Liang8 小时前
用六边形架构与整洁架构对比是伪命题?
java·python·c#·架构设计
AI攻城狮8 小时前
如何给 AI Agent 做"断舍离":OpenClaw Session 自动清理实践
python
千寻girling8 小时前
一份不可多得的 《 Python 》语言教程
人工智能·后端·python
AI攻城狮11 小时前
用 Playwright 实现博客一键发布到稀土掘金
python·自动化运维
曲幽12 小时前
FastAPI分布式系统实战:拆解分布式系统中常见问题及解决方案
redis·python·fastapi·web·httpx·lock·asyncio
孟健1 天前
Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析
python
码路飞1 天前
写了个 AI 聊天页面,被 5 种流式格式折腾了一整天 😭
javascript·python
曲幽1 天前
FastAPI压力测试实战:Locust模拟真实用户并发及优化建议
python·fastapi·web·locust·asyncio·test·uvicorn·workers