AudioNotes -将音频内容转 markdown

文章目录


一、关于 AudioNotes

AudioNotes 能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读。基于 FunASR 和 Qwen2 构建。


效果展示


音视频识别和整理

与音视频内容对话

二、使用方法


1、安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download


2、拉取模型

我以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2

shell 复制代码
ollama pull qwen2:7b

3、部署服务

有两种部署方式,一种是使用 Docker 部署,另一种是本地部署


3.1 Docker部署(推荐)🐳
shell 复制代码
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后,访问 http://localhost:15433/

登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)


3.2 本地部署 📦

需要有可访问的 postgresql 数据库

shell 复制代码
conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

.env.example 重命名为 .env,修改相关配置信息

shell 复制代码
chainlit run main.py

服务启动后,访问 http://localhost:8000/

登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)


2024-08-24(六)

相关推荐
木亦汐丫1 天前
【TTS】基于GRPO的流匹配文本到语音改进:F5R-TTS
强化学习·tts·grpo·wer·sim·文本到语音·nar
charlee443 天前
使用Vditor将Markdown文档渲染成网页(Vite+JS+Vditor)
前端·javascript·vite·markdown·vditor
AIGC_北苏3 天前
Windows安装Docker部署dify,接入阿里云api-key进行rag测试
docker·容器·qwen·dify
shaziln3 天前
Android Studio 解决报错 not support JCEF 记录
android studio·markdown
Pluchon3 天前
硅基计划2.0 学习总结 伍 类的继承 初稿
java·开发语言·学习·算法·markdown
哦***74 天前
华为FreeArc能和其他华为产品共用充电线吗?
华为·音频
放羊郎5 天前
从零实现本地语音识别(FunASR)
人工智能·语音识别·asr·funasr·语音转文字
人猿泰飞7 天前
【大模型应用开发】Qwen2.5-VL-3B识别视频
python·大模型·qwen·视觉模型·ai应用开发
逢着11 天前
Pandoc3.7新特性:存在合并单元格的 HTML 表格会被保留为嵌入的 HTML 表格
python·html·markdown·pandoc·pypandoc·文件类型转换·pandoc-binary