开源项目:FlyCut Caption智能视频字幕裁剪工具

核心功能

  • 🎤 智能语音识别:基于 Whisper 模型的高精度语音转文字,支持多种语言
  • ✂️ 可视化字幕编辑:直观的字幕片段选择和删除界面
  • 🎬 实时视频预览:与字幕同步的视频播放器,支持区间播放
  • 📤 多格式导出:支持 SRT、JSON 字幕格式以及视频文件导出
  • 🎨 字幕样式定制:自定义字幕字体、颜色、位置等样式
  • 🌐 国际化支持:组件化国际化设计,支持中文、英文、自定义语言包(如日语示例)

🔧 技术特色

  • ⚡ 现代化技术栈:React 19 + TypeScript + Vite + Tailwind CSS
  • 🧠 本地 AI 处理:使用 Hugging Face Transformers.js 在浏览器本地运行 AI 模型
  • 🎯 Web Workers:ASR 处理在后台线程运行,不阻塞主界面
  • 📱 响应式设计:适配不同屏幕尺寸的现代化界面
  • 🎪 组件化架构:模块化设计,易于维护和扩展

快速开始

环境要求

  • Node.js 18+
  • pnpm (推荐) 或 npm

安装步骤

  1. 克隆项目
复制代码
git clone https://github.com/x007xyz/flycut-caption.git
cd flycut-caption
  1. 安装依赖
复制代码
pnpm install
  1. 启动开发服务器
复制代码
pnpm dev
  1. 打开浏览器

    http://localhost:5173

构建生产版本

复制代码
# 构建项目
pnpm build

# 预览构建结果
pnpm preview

📋 使用指南

1. 上传视频文件

  • 支持格式:MP4, WebM, AVI, MOV
  • 支持音频:MP3, WAV, OGG
  • 拖拽文件到上传区域或点击选择文件
相关推荐
骄傲的心别枯萎2 小时前
RV1126 NO.40:OPENCV图形计算面积、弧长API讲解
人工智能·opencv·计算机视觉·音视频·rv1126
撬动未来的支点13 小时前
【音视频】MP4文件格式
音视频
刀客Doc20 小时前
复盘Netflix的2025:广告业务、线下业态和视频播客
人工智能·音视频
EasyGBS1 天前
EasyGBS助力智慧医院打造全方位视频监控联网服务体系
网络·音视频
数字孪生家族1 天前
视频孪生与空间智能:重构物理世界的时空认知范式
音视频·空间智能·数字孪生头部企业·视频孪生与空间智能融合
Tracy9731 天前
XMAU7118_VC1:16通道PDM到I²S/TDM音频转换器产品介绍
嵌入式硬件·音视频·智能硬件·xmos模组固件
做萤石二次开发的哈哈1 天前
萤石开放平台机器人音视频对接流程
机器人·音视频
Tracy9731 天前
OT83211_VC1:4通道 ASRC OTG(44.1kHz~192kHz)音频采样率转换器产品介绍
嵌入式硬件·音视频·xmos 模组·xmos模组固件
电鱼智能的电小鱼1 天前
基于电鱼 AI 工控机的智慧工地视频智能分析方案——边缘端AI检测,实现无人值守下的实时安全预警
网络·人工智能·嵌入式硬件·算法·安全·音视频
音视频牛哥1 天前
从协议规范和使用场景探讨为什么SmartMediaKit没有支持DASH
人工智能·音视频·大牛直播sdk·dash·dash还是rtmp·dash还是rtsp·dash还是hls