开源项目:FlyCut Caption智能视频字幕裁剪工具

核心功能

  • 🎤 智能语音识别:基于 Whisper 模型的高精度语音转文字,支持多种语言
  • ✂️ 可视化字幕编辑:直观的字幕片段选择和删除界面
  • 🎬 实时视频预览:与字幕同步的视频播放器,支持区间播放
  • 📤 多格式导出:支持 SRT、JSON 字幕格式以及视频文件导出
  • 🎨 字幕样式定制:自定义字幕字体、颜色、位置等样式
  • 🌐 国际化支持:组件化国际化设计,支持中文、英文、自定义语言包(如日语示例)

🔧 技术特色

  • ⚡ 现代化技术栈:React 19 + TypeScript + Vite + Tailwind CSS
  • 🧠 本地 AI 处理:使用 Hugging Face Transformers.js 在浏览器本地运行 AI 模型
  • 🎯 Web Workers:ASR 处理在后台线程运行,不阻塞主界面
  • 📱 响应式设计:适配不同屏幕尺寸的现代化界面
  • 🎪 组件化架构:模块化设计,易于维护和扩展

快速开始

环境要求

  • Node.js 18+
  • pnpm (推荐) 或 npm

安装步骤

  1. 克隆项目
复制代码
git clone https://github.com/x007xyz/flycut-caption.git
cd flycut-caption
  1. 安装依赖
复制代码
pnpm install
  1. 启动开发服务器
复制代码
pnpm dev
  1. 打开浏览器

    http://localhost:5173

构建生产版本

复制代码
# 构建项目
pnpm build

# 预览构建结果
pnpm preview

📋 使用指南

1. 上传视频文件

  • 支持格式:MP4, WebM, AVI, MOV
  • 支持音频:MP3, WAV, OGG
  • 拖拽文件到上传区域或点击选择文件
相关推荐
Leon_Chenl1 天前
【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统
深度学习·opencv·yolo·ffmpeg·音视频·边缘计算·人脸识别+检测
我是发哥哈1 天前
三款主流AI视频生成模型商用能力对比与选型分析
大数据·人工智能·学习·ai·chatgpt·aigc·音视频
潜创微科技1 天前
IT6622:HDMI1.4 发射 + eARC 音频接收 单芯片高清音视频方案
音视频
彷徨而立1 天前
【音频编解码】音频编码格式 G.722、G.722.1、G.722.1.C 的区别
音视频
诸葛亮的芭蕉扇1 天前
iOS视频自动全屏问题解决方案
ios·音视频
牛大兵1 天前
播放网络摄像头视频支持ONVIF/RTSP
网络·python·音视频
这是程序猿1 天前
ComfyUI 教程合集|AI绘图、ControlNet、Lora、IPAdapter、视频生成全攻略
大数据·人工智能·windows·音视频
ai产品老杨2 天前
解构企业级AI视频中台:基于X86/ARM与GPU/NPU异构架构的深度演进与源码交付实践
arm开发·人工智能·音视频
AI服务老曹2 天前
打破设备割裂:基于 GB28181 与 RTSP 的边缘计算 AI 视频平台架构解析(附源码交付与 Docker 部署)
人工智能·音视频·边缘计算