x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别

介绍

Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。

INFO:

whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库,是基于 OpenAI 的 Whisper 模型的移植版本,旨在通过深度学习模型实现音频转文字功能。

由于 whisper.cpp 目前只支持 16 khz 的 wav 文件格式的音频文件,因此该模块默认会先使用 ffmpeg 将音频文件转成语音识别所需的格式,生成的 wav 文件以 <file name>.whisper.tmp.x-cmd.16khz.wav 的格式命名,以便用户使用通配符批量删除。

首次用户

  1. 在终端运行 eval "$(curl https://get.x-cmd.com)" 即可完成 x 命令安装, 详情参考 x-cmd 官网

  2. x-cmd 提供 mod 教程,其中包含了 whisper 模块常用功能的 demo 示例,可以帮你快速上手 whisper 模块。

  3. 使用案例:

sh 复制代码
x whisper [OPTIONS] [SUB_COMMAND]
bash 复制代码
# 交互式选择模型,并将音频文件识别成文字
x whisper <audio file>

# 使用 medium 模型进行音频识别
x whisper -m medium -f <audio file>

# 将结果保存到 test.srt 字幕文件
x whisper dictate --srt -o test <audio file>

# 将 srt 字幕嵌入到视频中
x whisper merge <srt file> <video file>

选项

名称, 名称简写 默认值 描述
-f, --file [file dir] 需要识别的音频文件路径
-m, --model [name] 显式指定模型进行识别

子命令

名称 描述
x whisper dictate 音频识别成文字
x whisper model 管理本地模型
x whisper merge 将字幕嵌入到视频中

模型管理

whisper.cpp 提供了 5 种模型:tiny,base,small,medium,large,它们的识别效果和大小依次增加,x-cmd 建议用户使用 base 以上的模型。

  1. 用户可以使用 x whisper model 命令进入交互式 UI 来查看所有可用模型,并可以通过回车键将选中的模型设置为默认模型。
  2. 支持模型导入、导出、删除等功能。

此外,该模块还提供了将字幕嵌入到视频中的功能: 用户可以使用 --srt 参数生成字幕文件,再通过 merge 命令将字幕文件嵌入到视频中。

进一步阅读

关于 whisper.cpp,请访问 https://github.com/ggerganov/whisper.cpp

TIP :

第一次使用的用户会自动下载 whisper.cpp, 若想卸载可以使用 x env gc whispercpp 命令

我们的 whisper 模块是开箱即用的,有赖于 env 模块,它能在您需要的时候自动帮您下载安装好 whisper.cpp 和 ffmpeg

相关推荐
flydean2 分钟前
SD中的VAE,你不能不懂
ai·stable diffusion·ai绘画·程序那些事
云起无垠15 分钟前
【论文速读】|MEDFUZZ:探索大语言模型在医学问题回答中的鲁棒性
人工智能·语言模型·自然语言处理
我爱学Python!19 分钟前
基于大语言模型LangChain框架:知识库问答系统实践
人工智能·语言模型·自然语言处理·langchain·大语言模型·ai大模型·多模态大模型
龙的爹233321 分钟前
论文翻译 | PRCA:通过可插拔奖励驱动的上下文适配器拟合用于检索问答的黑盒大语言模型
人工智能·语言模型·自然语言处理·nlp
码上飞扬23 分钟前
开源语音转文本Speech-to-Text大模型实战之Wav2Vec篇
人工智能·文本转语音·wav2vec·speech-to-text
IT海中的小浪花23 分钟前
《昇思25天学习打卡营第11天 | 昇思MindSpore基于 MindSpore 实现 BERT 对话情绪识别》
人工智能·学习·bert
太湖鹏哥25 分钟前
5.3.3、二维数组案例-考试成绩统计
数据结构·c++·算法
牵牛老人28 分钟前
C++中的数据结构
开发语言·数据结构·c++
幻兽帕鲁32 分钟前
需求预测算法面试
人工智能·算法·机器学习
LeoLei806032 分钟前
深入理解TCP协议格式(WireShark分析)
网络·c++·网络协议·tcp/ip·wireshark