AudioNotes -将音频内容转 markdown

文章目录


一、关于 AudioNotes

AudioNotes 能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读。基于 FunASR 和 Qwen2 构建。


效果展示


音视频识别和整理

与音视频内容对话

二、使用方法


1、安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download


2、拉取模型

我以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2

shell 复制代码
ollama pull qwen2:7b

3、部署服务

有两种部署方式,一种是使用 Docker 部署,另一种是本地部署


3.1 Docker部署(推荐)🐳
shell 复制代码
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后,访问 http://localhost:15433/

登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)


3.2 本地部署 📦

需要有可访问的 postgresql 数据库

shell 复制代码
conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

.env.example 重命名为 .env,修改相关配置信息

shell 复制代码
chainlit run main.py

服务启动后,访问 http://localhost:8000/

登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)


2024-08-24(六)

相关推荐
北极象3 小时前
千问大模型接入示例
ios·iphone·qwen
yuhaiqun19892 天前
Typora 技能进阶:从会写 Markdown 到玩转配置 + 插件高效学习笔记
经验分享·笔记·python·学习·学习方法·ai编程·markdown
Aspect of twilight2 天前
Qwen1/2/2.5/3 VL的图像处理与位置编码方式讲解
qwen·qwen2 vl
臼犀2 天前
孩子,那不是说明书,那是祈祷文
人工智能·程序员·markdown
用户298698530142 天前
如何在 C# .NET 中将 Markdown 转换为 PDF 和 Excel:完整指南
后端·c#·markdown
SPFFC189380330532 天前
抗干扰磁环排线 | Magnetic Ring Flat Cable - 高磁导率EMI抑制解决方案
服务器·数码相机·车载系统·机器人·音频·智能音箱·智能电视
OpenBayes2 天前
教程上新丨微软开源VibeVoice,可实现90分钟4角色自然对话
人工智能·深度学习·机器学习·大语言模型·tts·对话生成·语音生成
星夜落月2 天前
从零开始:在服务器上部署Material for MkDocs完全指南
运维·markdown·建站
Luke Ewin2 天前
基于FunASR开发的可私有化部署的语音转文字接口 | FunASR接口开发 | 语音识别接口私有化部署
人工智能·python·语音识别·fastapi·asr·funasr
草帽lufei3 天前
VSCode+PicGo实现Markdown图床自动同步
markdown·visual studio code