视频剪辑的重磅AI神器:FunClip

内空摘要

  • 基于阿里巴巴通义实验室自研并开源的FunASR工具包
  • 集成了阿里巴巴开源的工业级模型Paraformer-Large
  • 集成了SeACo-Paraformer的热词定制化功能,提升识别效果
  • 集成了CAM++说话人识别模型,自动识别出的说话人ID
  • 支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕
  • 项目仓库:https://github.com/alibaba-damo-academy/FunClip
  • 博文地址:https://blog.i68.ltd/archives/funclip

主要特点

  • FunClip集成了多种大语言模型调用方式并提供了prompt配置接口,尝试通过大语言模型进行视频裁剪
  • FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,Modelscope下载量1300w+次,并且能够一体化的准确预测时间戳。
  • FunClip集成了SeACo-Paraformer的热词定制化功能,在ASR过程中可以指定一些实体词、人名等作为热词,提升识别效果。
  • FunClip集成了CAM++说话人识别模型,用户可以将自动识别出的说话人ID作为裁剪目标,将某一说话人的段落裁剪出来。
  • 通过Gradio交互实现上述功能,安装简单使用方便,并且可以在服务端搭建服务通过浏览器使用。
  • FunClip支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕,使用简单方便。

安装使用

安装imagemagick(可选)

  1. 如果你希望使用自动生成字幕的视频裁剪功能,需要安装imagemagick
  • Ubuntu

    apt-get -y update && apt-get -y install ffmpeg imagemagick
    sed -i 's/none/read,write/g' /etc/ImageMagick-6/policy.xml

  • MacOS

    brew install imagemagick
    sed -i 's/none/read,write/g' /usr/local/Cellar/imagemagick/7.1.1-8_1/etc/ImageMagick-7/policy.xml

  • Windows

首先下载并安装imagemagick ImageMagick -- Download

然后确定您的Python安装位置,在其中的site-packages\moviepy\config_defaults.py文件中修改IMAGEMAGICK_BINARY为imagemagick的exe路径

  1. 下载你需要的字体文件,这里我们提供一个默认的黑体字体文件

    wget https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ClipVideo/STHeitiMedium.ttc -O font/STHeitiMedium.ttc

使用FunClip

A.在本地启动Gradio服务

复制代码
python funclip/launch.py
# '-l en' for English audio recognize
# '-p xxx' for setting port number
# '-s True' for establishing service for public accessing

随后在浏览器中访问localhost:7860即可看到如下图所示的界面,按如下步骤即可进行视频剪辑

  1. 上传你的视频(或使用下方的视频用例)
  2. (可选)设置热词,设置文件输出路径(保存识别结果、视频等)
  3. 点击识别按钮获取识别结果,或点击识别+区分说话人在语音识别基础上识别说话人ID
  4. 将识别结果中的选段复制到对应位置,或者将说话人ID输入到对应为止
  5. (可选)配置剪辑参数,偏移量与字幕设置等
  6. 点击"裁剪"或"裁剪+字幕"按钮

使用大语言模型裁剪请参考如下教程

B.通过命令行调用使用FunClip的相关功能

复制代码
# 步骤一:识别
python funclip/videoclipper.py --stage 1 \
                       --file examples/2022云栖大会_片段.mp4 \
                       --output_dir ./output
# ./output中生成了识别结果与srt字幕等
# 步骤二:裁剪
python funclip/videoclipper.py --stage 2 \
                       --file examples/2022云栖大会_片段.mp4 \
                       --output_dir ./output \
                       --dest_text '我们把它跟乡村振兴去结合起来,利用我们的设计的能力' \
                       --start_ost 0 \
                       --end_ost 100 \
                       --output_file './output/res.mp4'

C.通过创空间与Space体验FunClip

FunClip@Modelscope创空间⭐

FunClip@HuggingFace Space🤗

相关推荐
大千AI助手1 分钟前
汉明距离:度量差异的基石与AI应用
人工智能·机器学习·距离度量·汉明距离·大千ai助手·hammingdistance·纠错码
我很哇塞耶1 分钟前
AWS AgentCore重磅升级,三大新功能重塑AI代理开发体验
人工智能·ai·大模型
说私域3 分钟前
社群媒体时代下“开源AI智能名片链动2+1模式S2B2C商城小程序”对社群运营的重要性研究
人工智能·开源·媒体
Akamai中国4 分钟前
加速采用安全的企业级 Kubernetes 环境
人工智能·云计算·云服务·云存储
AI科技星7 分钟前
时空的几何之歌:论统一场论动量公式 P = m(C - V) 的完备重构、量化哲学诠释与终极验证
数据结构·人工智能·算法·机器学习·计算机视觉·重构
子午9 分钟前
【农作物谷物识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法
人工智能·python·深度学习
断春风9 分钟前
Java 集成 AI 大模型最佳实践:从零到一打造智能化后端
java·人工智能·ai
大千AI助手10 分钟前
基于实例的学习:最近邻算法及其现代演进
人工智能·算法·机器学习·近邻算法·knn·大千ai助手·基于实例的学习
淘源码d11 分钟前
智慧工地企项一体化平台,Spring Cloud +UniApp 智慧工地源码,BIM+AI+物联网,施工全过程数字化智慧工地管理平台
java·人工智能·物联网·智慧工地·智慧工地源码·智慧工地app·数字工地
神算大模型APi--天枢64612 分钟前
聚合模型 API 算力平台:前端开发的强劲助力
大数据·人工智能·科技·架构·gpu算力