使用 AI 如何高效解析视频内容?生成思维导图或分时段概括总结

一、前言

AI 发展的如此迅速,有人想通过 AI 提效对视频的解析,怎么做呢?

豆包里面有 AI 视频总结的功能,可以解析bilibili网站上部分视频,如下图所示:

但有的视频解析时提示:

所以呢,使用豆包 AI 去解析视频,目前来看局限性是比较大的,不好用的。

我们来想一下,AI 解析视频的内部逻辑,肯定是解析语音,然后生成文字,最后 AI 拿到视频中的所有文字,进行一个详细的视频总结,这其实就是我们想要的效果,那么有没有好用的工具呢?答案是有,继续往下看。

二、通义听悟 + DeepSeek

通义听悟地址:https://tingwu.aliyun.com/。普通用户首次注册登录得10小时转写时长以及20G的存储空间,每天签到就会赠送10个小时的转写时长。

1、视频下载

我们可以将视频下载到本地,然后上传到「通义听悟」,导入方式支持以下 4 种:
可以上传本地视频或阿里云盘。

2、视频解析

我同样选择了bilibili上的视频,地址:https://tingwu.aliyun.com/doc/transcripts/4l6xqapz7x3pqm2y。这个视频挺好的,建议大家都读一下,肯定有收获。

给大家分享一个下载视频的好工具:https://mbd.pub/o/bread/mbd-ZJ6Ulpdp,按需收藏。

视频上传后,「通义听悟」会自动将视频进行解析,需要一段时间。解析后效果特别全面,如下图所示:

  • 首先是视频本身,
  • 然后是智能速览:
    • 关键词
    • 全文概要
    • 章节速览
    • 发言总结
    • 要点回顾
  • 原文
    • 视频文字稿,可以区分发言人。
    • 视频文字稿可以标记:重点、问题、待办
  • 上方工具栏
    • 搜索:根据关键词跳转到视频某处
    • 批量摘取,可一键摘取视频全部原文
    • 筛选:只看标记内容;或只看某发言人
    • 翻译:可一键将内容翻译为源语言、英语、日语
    • AI 改写
  • 右侧文本框:可以记录自己的灵感和思考。一键摘取视频原文,也是将原文内容显示在右侧文本框。
3、前往 DeepSeek

这里我用的是腾讯元宝中的 DeepSeek 模型,地址:https://yuanbao.tencent.com/。

取消"联网搜索"的原因是,这样 DeepSeek 只会基于你给的内容来深度思考,不会出现 AI 幻觉或无中生有的问题。

上图,我是将视频全部原文发给他,然后给了提示语:"帮我将以下内容整理成markdown格式的层次式思维导图",让他给我生成思维导图。

按照我的要求,他以 markdown 格式输出了思维导图内容,现在我们继续用工具将思维导图画出来。使用的工具是:https://www.min2k.com/tools/markmap/。

将 DeepSeek 给的回答粘在左侧,右侧就输出了思维导图,如下图所示:

这视频我看完了,总结的思维导图很详细,很正确。

我们不光可以基于视频原文内容,生成思维导图,还可以随便问。比如:"两位状元的访谈,能为我们带来什么人生道理和启示"等,都可以,看你自身需要。

三、总结

好了,本文到这里基本上就结束了,本文主要讲解了如何使用 AI 快速总结视频内容。利用了「通义听悟」将视频原文内容解析出来,解析出来的效果就很棒。同时获取了视频文字后,我们可以利用 DeepSeek 大模型(别的模型也可以)基于视频文字来进行问答,比如绘制思维导图,比如继续挖掘文字价值等。

请问,你学会了吗?可以拿个自己感兴趣的视频练练手。如果你有想法或更好的方案,欢迎与我沟通,我们下期再见。

相关推荐
fundroid2 小时前
Androidify:谷歌官方 AI + Android 开源示例应用
android·人工智能·开源
居然JuRan2 小时前
大模型瘦身术:量化与蒸馏技术全解析
人工智能
艾莉丝努力练剑2 小时前
【优选算法必刷100题】第031~32题(前缀和算法):连续数组、矩阵区域和
大数据·人工智能·线性代数·算法·矩阵·二维前缀和
不去幼儿园2 小时前
【启发式算法】灰狼优化算法(Grey Wolf Optimizer, GWO)详细介绍(Python)
人工智能·python·算法·机器学习·启发式算法
remaindertime2 小时前
基于Ollama和Spring AI:实现本地大模型对话与 RAG 功能
人工智能·后端·ai编程
y***54882 小时前
Vue语音识别开发
人工智能·语音识别
S***H2832 小时前
Vue语音识别案例
前端·vue.js·语音识别
sdjnled2292 小时前
山东裸眼3D立体LED显示屏专业服务商
人工智能·3d
不解不惑2 小时前
OpenAI whisper 语音识别服务器搭建
服务器·whisper·语音识别
忘却的旋律dw3 小时前
使用LLM模型的tokenizer报错AttributeError: ‘dict‘ object has no attribute ‘model_type‘
人工智能·pytorch·python