爬某网站延禧宫率第一集视频

python 复制代码
import requests
import re
from tqdm import tqdm
# 网址链接:https://v.ijujitv.cc/play/24291-1-1.html
url = 'https://v6.1080pzy.co/20220801/urxniJCN/hls/index.m3u8'
headers = {
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36",
    "Referer":"https://jx.ijujitv.cc/"
}

m3u8_data = requests.get(url=url,headers=headers).text
m3u8_data = re.sub("#EXTM3U",'',m3u8_data)
m3u8_data = re.sub("#EXT-X-VERSION:\d",'',m3u8_data)
m3u8_data = re.sub("#EXT-X-TARGETDURATION:\d",'',m3u8_data)
m3u8_data = re.sub("#EXT-X-PLAYLIST-TYPE:VOD",'',m3u8_data)
m3u8_data = re.sub("#EXT-X-MEDIA-SEQUENCE:\d",'',m3u8_data)
m3u8_data = re.sub("#EXTINF:\d\.\d+,",'',m3u8_data)
m3u8_data = re.sub("#EXTINF:\d,",'',m3u8_data)
m3u8_data = re.sub("#EXT-X-ENDLIST",'',m3u8_data).split()
for m3u8_url in tqdm(m3u8_data):
    content = requests.get(url=m3u8_url,headers=headers).content
    with open('延禧宫率'+'.mp4',mode='ab') as f:
        f.write(content)

爬取的页面如下:

爬取步骤:

又点击检查-network-xhr,发现有许多ts文件,复制浏览即会下载。-在搜索框搜索m3u8,找到一个html的包,如下。

点开后发现其为:

得到了所有ts的包,进行访问提取所有的ts路径代码。

相关推荐
猿小猴子4 小时前
Python3 爬虫 中间人爬虫
开发语言·爬虫·python
YONG823_API4 小时前
电商平台数据批量获取自动抓取的实现方法分享(API)
java·大数据·开发语言·数据库·爬虫·网络爬虫
罔闻_spider5 小时前
爬虫prc技术----小红书爬取解决xs
爬虫·python·算法·机器学习·自然语言处理·中文分词
易辰君6 小时前
python爬虫 - 深入requests模块
开发语言·爬虫·python
985小水博一枚呀21 小时前
【对于Python爬虫的理解】数据挖掘、信息聚合、价格监控、新闻爬取等,附代码。
爬虫·python·深度学习·数据挖掘
大神薯条老师1 天前
Python从入门到高手5.1节-Python简单数据类型
爬虫·python·深度学习·机器学习·数据分析
镜花照无眠1 天前
Python爬虫使用实例-mdrama
开发语言·爬虫·python
小白学大数据1 天前
User-Agent在WebMagic爬虫中的重要性
开发语言·爬虫·http
大神薯条老师2 天前
Python从入门到高手4.3节-掌握跳转控制语句
后端·爬虫·python·深度学习·机器学习·数据分析
wdxylb2 天前
Pyhton爬虫使用Selenium实现浏览器自动化操作抓取网页
爬虫·selenium·测试工具