MeetingMind:AI 会议助手,支持自动转录音频并提取会议中的关键信息

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. MeetingMind 是一款 AI 驱动的会议助手,能够自动转录音频并提取关键信息。
  2. 支持录音文件上传、AI 转录、自动提取任务、决策、问题等关键信息。
  3. 基于 Langflow、Next.js 和 Groq 构建,适用于企业会议、远程团队等多种应用场景。

正文(附运行示例)

MeetingMind 是什么

MeetingMind 是一款 AI 驱动的会议助手,能够自动转录音频并提取关键信息,如任务、决策和问题,帮助用户轻松捕获和分析会议内容,采取行动。工具用 Langflow、Next.js 和基于 Groq 的快速转录服务构建,提高会议效率和执行力。

MeetingMind 的主要功能

  • 录音和文件上传:支持用户直接上传会议的音频文件,无需手动输入会议内容。
  • 人工智能驱动的转录:用 AI 技术将会议音频自动转换成文本,提高会议记录的效率。
  • 自动提取关键信息:识别、提取会议中的关键信息,包括任务、决策、问题、见解、截止日期、出席者、后续行动和风险等。
  • 仪表板展示:在仪表板中展示提取的信息,方便用户快速查看和理解会议内容。
  • 行动指导:基于提取的信息,提供行动指导,帮助用户根据会议结果执行后续任务。

MeetingMind 的技术原理

  • 音频处理:MeetingMind 首先接收会议的音频文件,是基于录音功能或用户上传获得的。
  • AI 转录服务:基于 Groq 的快速转录服务,将音频文件转换成文本数据。过程涉及到语音识别技术,将语音信号转换为可读的文本。
  • 自然语言处理(NLP):转录后的文本基于 NLP 技术进行分析,能识别和提取会议中的关键信息和行动点。
  • 信息提取与分类:AI 模型被训练识别不同类型的信息,如任务、决策等,将其分类。
  • 数据展示:提取的信息通过用户界面展示,一般是一个仪表板,用户在这里查看、筛选和执行会议中的关键点。
  • Langflow 集成:MeetingMind 集成 Langflow,用于构建和运行数据处理流程的工具,帮助管理和自动化 AI 转录和信息提取的过程。

如何运行 MeetingMind

Prerequisites

  • Node.js 14.x 或更高版本
  • npm 或 yarn
  • 本地运行的 LangFlow 服务器
  • Git(用于克隆仓库)

Caution

⚠️ 重要提示: Groq Whisper 用于转录和分析,目前仅支持最大 25 MB 的文件。如果音频文件大于 25 MB,需要压缩后再上传。这可能会影响较长会议或高质量录音的处理。

安装步骤

  1. 克隆仓库:
bash 复制代码
git clone https://github.com/yourusername/meetingmind.git
cd meetingmind
  1. 安装依赖:
bash 复制代码
npm install
# 或
yarn install
  1. 设置 LangFlow:
  • 安装并运行 LangFlow 后端服务器
  • 上传位于 utils/langflow_flow/Meeting Mind.json 的 flow 文件
  • 记下 LangFlow 服务器的 URL
  1. 创建 .env.local 文件并在根目录中添加 LangFlow URL:
ini 复制代码
LANGFLOW_FLOW_URL="http://127.0.0.1:7860/api/v1/run/5781a690-e689-4b26-b636-45da76a91915"

将 URL 替换为实际的 LangFlow 服务器 URL。

app/api/transcribe/route.ts 文件中找到 payload 对象并更新 Groq 组件名称,例如:

typescript 复制代码
const payload = {
  output_type: "text",
  input_type: "text",
  tweaks: {
    YourGroqComponentName: {
      audio_file: filePath,
    },
  },
};

'YourGroqComponentName' 替换为 LangFlow 中的实际组件名称。

  1. 设置数据库:

本项目使用 Prisma 作为 ORM,默认配置为使用 SQLite 数据库。

a. 使用本地 SQLite 数据库:

  • 确保 .env 文件包含:
ini 复制代码
DATABASE_URL="file:./dev.db"
  • 运行以下命令设置数据库:
bash 复制代码
npx prisma generate
npx prisma migrate dev --name init

b. 使用其他数据库(例如 PostgreSQL):

  • 更新 .env 文件中的连接字符串:
ini 复制代码
DATABASE_URL="postgresql://username:password@host:port/database?schema=public"
  • 更新 prisma/schema.prisma 文件中的 provider
prisma 复制代码
datasource db {
    provider = "postgresql"
    url      = env("DATABASE_URL")
}
  • 运行上述 Prisma 命令生成客户端并执行迁移。
  1. 运行开发服务器:
bash 复制代码
npm run dev
# 或
yarn dev
  1. 在浏览器中打开 http://localhost:3000 查看结果。

使用方法

  1. 导航到仪表板页面。
  2. 上传音频文件。
  3. 等待 AI 处理和分析会议。
  4. 在仪表板中查看提取的信息。

资源

  1. GitHub 仓库:github.com/misbahsy/me...
  2. 项目官网:meetingmind.app
  3. 文档:meetingmind.app/docs
  4. 论文:arxiv.org/pdf/2410.06...

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关推荐
一水鉴天19 分钟前
为AI聊天工具添加一个知识系统 之65 详细设计 之6 变形机器人及伺服跟随
人工智能
井底哇哇6 小时前
ChatGPT是强人工智能吗?
人工智能·chatgpt
Coovally AI模型快速验证6 小时前
MMYOLO:打破单一模式限制,多模态目标检测的革命性突破!
人工智能·算法·yolo·目标检测·机器学习·计算机视觉·目标跟踪
AI浩7 小时前
【面试总结】FFN(前馈神经网络)在Transformer模型中先升维再降维的原因
人工智能·深度学习·计算机视觉·transformer
可为测控7 小时前
图像处理基础(4):高斯滤波器详解
人工智能·算法·计算机视觉
一水鉴天7 小时前
为AI聊天工具添加一个知识系统 之63 详细设计 之4:AI操作系统 之2 智能合约
开发语言·人工智能·python
倔强的石头1068 小时前
解锁辅助驾驶新境界:基于昇腾 AI 异构计算架构 CANN 的应用探秘
人工智能·架构
硬汉嵌入式8 小时前
《安富莱嵌入式周报》第349期:VSCode正式支持Matlab调试,DIY录音室级麦克风,开源流体吊坠,物联网在军工领域的应用,Unicode字符压缩解压
vscode·matlab·开源
佛州小李哥8 小时前
Agent群舞,在亚马逊云科技搭建数字营销多代理(Multi-Agent)(下篇)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
说私域9 小时前
社群裂变+2+1链动新纪元:S2B2C小程序如何重塑企业客户管理版图?
大数据·人工智能·小程序·开源