电影台词搜索引擎开源源码

剪影 --- 电影台词搜索引擎

剪影是一款轻量级、本地部署的电影台词搜索引擎。它能让你在海量字幕文件中快速定位任何一句台词,并根据字幕时间轴精准截取视

频片段或画面截图,打通「文字 → 影像」的完整链路。

一、核心功能

  1. 全文台词搜索

输入关键词即可跨所有已导入电影进行全文检索。搜索结果包含:

  • 关键词高亮 --- 匹配文本以醒目标记突出显示

  • 上下文台词 --- 自动展示匹配行的前一句和后一句,帮助你还原对话语境

  • 时间轴信息 --- 每条结果精确到 时:分:秒,毫秒 的起止时间

  • 按电影筛选 --- 可在搜索结果中进一步筛选特定电影

  • 分页浏览 --- 大量结果时自动分页,每页 20 条

  1. 字幕文件管理
  • 拖拽上传 --- 直接将 .srt 字幕文件拖入页面即可导入

  • 自动解析 --- 解析 SRT 格式的序号、时间轴、对白文本,自动去除 HTML 标签并合并多行文本

  • 去重机制 --- 相同文件名的字幕不会重复导入

  • 影片管理 --- 查看已收录电影列表、每部电影的台词数量,支持删除电影及其全部字幕

  1. 视频关联

为每部电影关联对应的视频文件,支持两种方式:

  • 本地路径 --- 直接填写本机视频文件路径(如 D:\movies\film.mp4)

  • 上传文件 --- 上传视频文件到服务器(支持 mp4、mkv、avi、mov、flv、wmv、webm 格式,上限 500MB)

关联后即可使用截图和片段截取功能。

  1. 视频截图

在任意搜索结果上点击「截图」,系统会根据该句台词的起始时间戳,调用 ffmpeg 从视频中截取对应画面,生成 JPG

图片并支持直接下载。

  1. 片段截取

点击「截取片段」,系统会根据该句台词的起止时间,自动裁剪出对应的视频片段(MP4

格式),截取完成后可在线预览和下载。采用流拷贝(-c copy)模式,速度快且不损失画质。

  1. 搜索历史
  • 自动记录最近 10 条搜索关键词,存储于浏览器本地

  • 点击搜索框时展示历史记录下拉列表

  • 支持单条删除和一键清空

  1. 结果导出

搜索结果可一键导出为 TXT 文本文件,内容包含关键词、筛选条件、导出时间以及所有匹配台词及其上下文。

  1. 电影详情页

点击电影名可进入详情视图,浏览该电影的全部台词(分页),每条台词均可执行截图和片段截取操作。


五、适用场景

  • 影迷检索 --- 想找某句经典台词出自哪部电影的哪个时间点

  • 视频剪辑 --- 按台词关键词定位素材,一键截取所需片段

  • 内容创作 --- 快速获取影视截图用于图文、短视频二创

  • 字幕研究 --- 浏览和分析电影字幕文本,支持导出


六、快速启动

安装依赖

pip install flask

启动服务

python app.py

浏览器访问

http://localhost:5000

启动后,subtitles/ 目录下的示例字幕文件会自动导入。在页面上传 .srt 文件即可添加更多电影。

下载地址: https://pan.quark.cn/s/befa14e0ea27

相关推荐
a11177613 小时前
html制作的PPT(各种风格)提示词
前端·开源·html
Elastic 中国社区官方博客14 小时前
Elasticsearch 9.4 推动 Elastic AI 生态系统的下一阶段:Dell AI Data Platform 与 NVIDIA
大数据·人工智能·elasticsearch·搜索引擎·全文检索
坚果的博客14 小时前
Flutter 三方库(Flutter-New-Badge)适配开源鸿蒙教程
flutter·开源·harmonyos
繁星星繁14 小时前
【项目】boost搜索引擎(一)
搜索引擎
sbjdhjd15 小时前
从 0 到 1 构建高可用企业级 NoSql 数据库 Redis 集群
linux·运维·redis·云原生·kubernetes·开源·云计算
Ws_15 小时前
Git + Gerrit 第五课:rebase 变基与提交历史整理
大数据·elasticsearch·搜索引擎
柚鸥ASO优化15 小时前
微信正在变成“搜索引擎”:小程序SEO机会全面爆发
搜索引擎·微信·小程序·小程序优化
坚果的博客15 小时前
AtomCode 助力开源鸿蒙跨平台三方库生态共建
华为·开源·harmonyos
醉颜凉15 小时前
Lucene底层原理:倒排索引实现原理与代码实战,彻底吃透搜索引擎核心
搜索引擎·mybatis·lucene