AudioNotes -将音频内容转 markdown

文章目录


一、关于 AudioNotes

AudioNotes 能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读。基于 FunASR 和 Qwen2 构建。


效果展示


音视频识别和整理

与音视频内容对话

二、使用方法


1、安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download


2、拉取模型

我以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2

shell 复制代码
ollama pull qwen2:7b

3、部署服务

有两种部署方式,一种是使用 Docker 部署,另一种是本地部署


3.1 Docker部署(推荐)🐳
shell 复制代码
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后,访问 http://localhost:15433/

登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)


3.2 本地部署 📦

需要有可访问的 postgresql 数据库

shell 复制代码
conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

.env.example 重命名为 .env,修改相关配置信息

shell 复制代码
chainlit run main.py

服务启动后,访问 http://localhost:8000/

登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)


2024-08-24(六)

相关推荐
花千树-01020 小时前
IndexTTS2 推理性能分析
人工智能·深度学习·ai·语音识别·tts
dax eursir2 天前
Qwen3-VL-2B vs BLIP-2:轻量视觉模型部署效率对比分析
qwen·视觉语言模型·多模态ai·ocr识别
七夜zippoe3 天前
OpenClaw TTS 语音合成详解:让 AI 助手开口说话
人工智能·ai·语音合成·tts·openclaw
iceslime4 天前
Windows10系统静音修复相关
windows·音频·修复
汀江游非侠4 天前
模型下载与使用
qwen·ai模型下载
aosky6 天前
OmniVoice:支持 600+ 语言的零样本语音克隆 TTS 系统
人工智能·tts
张涛酱1074568 天前
Markdown从入门到精通(三):进阶语法——让文档更丰富
markdown
木斯佳8 天前
前端八股文面经大全:字节广告交易前端一面(2026-03-31)·面经深度解析
前端·markdown·虚拟列表·流式数据
憨波个8 天前
【说话人日志】从 BLSTM 到 Self-Attention:SA-EEND
人工智能·transformer·音频·语音识别
gujunge8 天前
Spring with AI (6): 记忆保持——会话与长期记忆
ai·大模型·llm·openai·qwen·rag·spring ai·deepseek