【Python音视频技术】玩AI视频创作引发写Python音视频技术系列文章1---视频添加字幕

最近对视频创作感兴趣, 详情见之前写的几篇文章。

【AI+应用】模仿爆款视频二次创作短视频操作步骤

【人工智能】AI数字人视频演示

【人工智能】AI视频二次创作演示

作为程序员出身的我,看到一些功能, 我都有猎奇的习惯, 想着自己用什么技术来实现它呢。

处理音视频,大家很容易想到大名鼎鼎的ffmpeg。FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。它提供了录制、转换以及流化音视频的完整解决方案。 2013年那时候做流媒体直播的时候我就有所了解。既然我这里选择python,这里介绍2个python库,一个是ffmpeg-python , 一个是moviepy。

这里以mac为例, windows或linux思路类似。

一、ffmpeg-python, python代码来操作ffmpeg

1、ffmpeg下载地址: https://ffmpeg.org//download.html , 选择自己合适的版本

2、下载解压后,vi /etc/profile修改环境变量,

export PATH=$PATH:/Users/xxxx/software/ffmpeg/bin

3、pip install ffmpeg-python

二、moviePy,是一个用于视频编辑Python库:切割、拼接、标题插入,视频合成,视频处理和自定义效果的创造。

1、必须先安装imagemagick , brew install imagemagick

这个安装比较扯,安装各种缺包,我秉持缺少安装什么 brew install xx的原则,所幸全部安装成功了, 主要是因为我之前已经换成国内源了。

如果你安装不成功,可以尝试换一下中科院的源。https://mirrors.ustc.edu.cn/brew.git

2、pip3 install moviepy

三、这里给一个 moviepy视频添加字幕的简单demo, 网上摘录的代码。

from moviepy.editor import CompositeVideoClip, VideoFileClipfrom moviepy.video.VideoClip import TextClipimport osimport argparse
# Define the base directorybase_dir = os.path.dirname(os.path.abspath(__file__))
# Define CLI argumentsparser = argparse.ArgumentParser()parser.add_argument(    '-f',    type=str,    help='The file path of target video. '    + 'ex. /Users/lwj/video/example.mp4.\nDefault value is "demo.mp4"',    default=base_dir + '/demo.mp4')parser.add_argument(    '-t',    type=str,    help='The text you want to add to video top. '    + 'ex. "Hellow Video"',    default='This is demo example')parser.add_argument(    '-s',    type=int,    help='The font size of video watermark. '    + 'ex. 30',    default='30')parser.add_argument(    '-n',    type=str,    help='The new file name.\n'    + 'Default value is {current file name}_title.mp4',)
# Define Variableargs = parser.parse_args()video_path = args.fvideo_watermark = args.tfont_size = args.s
# Check whether or not the input video path is valid. If not, ask user to input again.while True:    try:        video = VideoFileClip(video_path)        print('video resultion: ', video.size)        break    except Exception:        print(            'Directory or file is not valid,'            + ' please enter a valid file directory ...')        video_path = str(input('Enter the video path again (absolute path without space): '))
origin_file = (lambda x: x.split('/')[-1])(video_path)
if args.n:    new_file = args.nelse:    new_file = f'{origin_file.split(".")[0]}_title.{origin_file.split(".")[1]}'

def add_text(content, font_size):    '''    add text on the top of video stream    '''    # txt_clip = (TextClip(content, fontsize=font_size, color='white')    #             .set_position('top')    #             .set_duration(video.duration))    txt_clip = (TextClip(content, fontsize=font_size, color='red')                .set_position('bottom')                .set_duration(1))    result = CompositeVideoClip([video, txt_clip])    result.write_videofile(new_file)

def main():    add_text(video_watermark, font_size)

if __name__ == '__main__':    main()

命令执行: python3 video-textadder.py -f demo.mp4 -t "hello world"

改一下字幕位置、颜色。

未完待续,后续找个时间继续水。 自己不止更新技术类文章, 如果想了解更多,可以关注同名公众号《子晓聊技术》

相关推荐
池央23 分钟前
AI性能极致体验:通过阿里云平台高效调用满血版DeepSeek-R1模型
人工智能·阿里云·云计算
我们的五年24 分钟前
DeepSeek 和 ChatGPT 在特定任务中的表现:逻辑推理与创意生成
人工智能·chatgpt·ai作画·deepseek
Yan-英杰25 分钟前
百度搜索和文心智能体接入DeepSeek满血版——AI搜索的新纪元
图像处理·人工智能·python·深度学习·deepseek
Fuweizn27 分钟前
富唯智能可重构柔性装配产线:以智能协同赋能制造业升级
人工智能·智能机器人·复合机器人
weixin_307779131 小时前
Azure上基于OpenAI GPT-4模型验证行政区域数据的设计方案
数据仓库·python·云计算·aws
玩电脑的辣条哥2 小时前
Python如何播放本地音乐并在web页面播放
开发语言·前端·python
taoqick2 小时前
对PosWiseFFN的改进: MoE、PKM、UltraMem
人工智能·pytorch·深度学习
suibian52352 小时前
AI时代:前端开发的职业发展路径拓宽
前端·人工智能
预测模型的开发与应用研究3 小时前
数据分析的AI+流程(个人经验)
人工智能·数据挖掘·数据分析
源大模型4 小时前
OS-Genesis:基于逆向任务合成的 GUI 代理轨迹自动化生成
人工智能·gpt·智能体