制作语音数据集: 爬取B站音视频+基于whisper语音识别标注

本文以制作小学课堂音频数据集为例子

1. 搜索关键字获取音视频链接

python 复制代码
if __name__ == "__main__":
    
    with sync_playwright() as playwright:
        searcher = BLVideoSearch(playwright, headless=True)
        url = searcher.make_url(keyword=["小学公开课"])
        searcher.run(url, outfile="videos_url.txt")

得到链接列表

2. 批量下载和实时视频转音频

you-get: 根据链接下载视频文件

ffmpeg: 将视频实时转音频

subprocess: 通过子进程执行上述命令

2.1 多线程批量下载 (you-get)

you-get 子进程:

python 复制代码
command = [YOUGET, "-o", self.video_dir, "-O", utt, task]
                    subprocess.run(command, check=True, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)

2.2 实时视频转音频

ffmpeg 子进程:

python 复制代码
command = [FFMPEG, "-i", video_file, '-ac', '1', '-ar', '16000', audio_file]
                    subprocess.run(command, check=True, stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)

下载视频文件信息如下:

最终保存为音频文件

3. 使用whisper进行断句和语音识别

相关推荐
Yutengii15 分钟前
b站视频下载到电脑本地的方法有哪些
音视频
summerkissyou19872 小时前
Android13-Audio-AudioTrack-播放流程
android·音视频
minhuan2 小时前
大模型应用:文本转语音实践:Tacotron2预训练模型和SpeechT5模型应用.19
人工智能·语音识别·tacotron2 声学模型·speecht5模型·tts语音模型
Black蜡笔小新3 小时前
安防监控/录像存储EasyCVR视频汇聚平台无法启动的原因排查
音视频
xingqing87y4 小时前
祝寿视频怎么制作:4步制作创意祝寿视频
音视频
qq_256247054 小时前
Spring Boot + NATS 实战:如何让 IM 系统处理图片/视频像处理文本一样快?
spring boot·后端·音视频
何包蛋H5 小时前
医疗视频播放组件开发实战:支持病灶标注、缓存播放与性能优化
微信小程序·音视频·notepad++
好游科技6 小时前
使用WebRTC开发直播系统源码与音视频语聊房实践指南
音视频·webrtc·im即时通讯·社交软件·社交语音视频软件
思通数科多模态大模型7 小时前
多业态连锁环境管理系统:AI + 机器人闭环,坪效提升 16%
人工智能·深度学习·目标检测·机器学习·计算机视觉·数据挖掘·语音识别
一点晖光8 小时前
ffmpeg合成的视频在ios浏览器不能播放的问题
ffmpeg·音视频