AudioNotes -将音频内容转 markdown

文章目录


一、关于 AudioNotes

AudioNotes 能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读。基于 FunASR 和 Qwen2 构建。


效果展示


音视频识别和整理

与音视频内容对话

二、使用方法


1、安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download


2、拉取模型

我以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2

shell 复制代码
ollama pull qwen2:7b

3、部署服务

有两种部署方式,一种是使用 Docker 部署,另一种是本地部署


3.1 Docker部署(推荐)🐳
shell 复制代码
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后,访问 http://localhost:15433/

登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)


3.2 本地部署 📦

需要有可访问的 postgresql 数据库

shell 复制代码
conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

.env.example 重命名为 .env,修改相关配置信息

shell 复制代码
chainlit run main.py

服务启动后,访问 http://localhost:8000/

登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)


2024-08-24(六)

相关推荐
shao9185163 小时前
第11章 Streaming(中):高级音频应用(1)——项目六:语音克隆、变声器与文本转录器
语音识别·tts·语音克隆·elevenlabs·stt·变声器·音乐api
天恩软件1 天前
一分钟学会绘制Mermaid流程图
markdown
夜魔0092 天前
Dify插件 Markdown Exporter 3.6.9离线安装包制作
markdown·exporter·dify·离线安装·dify 1.13.3·3.6.9·内网安装
深念Y2 天前
AI时代办公格式的演进:PPT与Word的替代已现,Excel将走向何方?
数据库·人工智能·html·word·powerpoint·excel·markdown
声光界3 天前
《信号处理赋能智能体音感知》
人工智能·音频·信号处理·声学
凛_Lin~~3 天前
Android录音、试听功能实现
android·音频·安卓
搬砖魁首3 天前
基础能力系列 - 如何安全养虾? - 容器化部署龙虾
docker·qwen·openclaw·龙虾
憨波个5 天前
【说话人日志】多说话人数据仿真 Property-Aware Simulation
人工智能·深度学习·音频·语音识别
Anesthesia丶5 天前
Qwen2.5-1.5b 模型部署与LORA训练笔记
pytorch·python·lora·llm·qwen·vllm
憨波个5 天前
【说话人日志】Sortformer:将说话人日志接入多说话人 ASR
人工智能·机器学习·音频·语音识别·聚类