昇腾CANN环境下Whisper.cpp安装指南

前置检查

确认昇腾AI处理器已经安装妥当

bash 复制代码
lspci | grep 'Processing accelerators'

❕务必确认操作系统架构及版本、Python版本满足要求

|--------|------------------------------------------|
| 软件 | 版本 |
| 操作系统 | openEuler20.03/22.03, Ubuntu 20.04/22.04 |
| Python | 3.8, 3.9, 3.10 |

bash 复制代码
uname -m && cat /etc/*release 
bash 复制代码
 python --version

确认驱动是否安装

bash 复制代码
npu-smi info

确认固件是否安装成功

bash 复制代码
#软件包默认安装路径:/usr/local/Ascend
#装详细日志路径:/var/log/ascend_seclog/ascend_install.log
cat /var/log/ascend_seclog/ascend_install.log
#安装后软件包的安装路径、安装命令以及运行用户信息记录路径:/etc/ascend_install.info
cat /etc/ascend_install.info

确认CANN是否安装成功

bash 复制代码
cat /usr/local/Ascend/ascend-toolkit/latest/arm64-linux/ascend_toolkit_install.info
cat /usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/ascend_toolkit_install.info

一、Whisper.cpp 安装

1.1编译安装

bash 复制代码
cd /usr/local
#下载 Whisper.cpp 项目到本地
git clone https://github.com/ggerganov/whisper.cpp.git
#在 Whisper.cpp 项目目录下,创建构建目录并进入该目录
cd whisper.cpp 
mkdir build
cd build
source /usr/local/Ascend/ascend-toolkit/set_env.sh
#编译安装 CANN 版本的 Whisper.cpp
cmake .. -D GGML_CANN=on
make -j

1.2安装校验

编译完毕后,无任何报错信息,并输出以下关键回显即说明安装成功:

[ 90%] Built target quantize

[ 95%] Linking CXX executable ../../bin/main

[ 95%] Built target main

[100%] Linking CXX executable ../../bin/server

[100%] Built target server

二、使用脚本下载Whisper 模型

使用 Whisper.cpp 项目中的 download-ggml-model.sh 脚本下载预先转换为 gguf 格式的 Whisper 模型:

bash 复制代码
cd /usr/local/whisper.cpp/models
#如果无法下载模型,打开download-ggml-model.sh 脚本,更换默认的网址https://huggingface.co
#vi download-ggml-model.sh
./download-ggml-model.sh base.en

三、语音文件预处理

使用 ffmpeg 转换所需处理的语音文件为 16 bit wav 语音文件,此处以 samples/jfk.mp3 为例:

bash 复制代码
cd ..
apt-get upgrade
apt-get install ffmpeg
ffmpeg -loglevel -0 -y -i samples/jfk.mp3 -ar 16000 -ac 1 -c:a pcm_s16le samples/jfk-test.wav

四、自动语音识别

bash 复制代码
./build/bin/main -f samples/jfk-test.wav -m models/ggml-base.en.bin -t 8
相关推荐
drebander7 天前
Whisper-Medium 模型:音频转文本的原理、实践与硬件推荐
whisper·音视频
drebander7 天前
Whisper-Tiny 模型:音频转文本的原理与实践
whisper·音视频
大模型之路7 天前
OpenAI Whisper:语音识别技术的革新者—深入架构与参数
人工智能·whisper·语音识别
南棱笑笑生12 天前
20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕
whisper
飘逸高铁侠15 天前
使用 whisper和ffmpeg 烧录视频的中英文双语字幕
ffmpeg·whisper·音视频
长风清留扬1 个月前
基于OpenAI Whisper AI模型自动生成视频字幕:全面解析与实战指南
人工智能·神经网络·opencv·计算机视觉·自然语言处理·数据挖掘·whisper
Aileen_0v01 个月前
【AI驱动的数据结构:包装类的艺术与科学】
linux·数据结构·人工智能·笔记·网络协议·tcp/ip·whisper
带电的小王1 个月前
WhisperKit: Android 端测试 Whisper -- Android手机(Qualcomm GPU)部署音频大模型
android·智能手机·whisper·qualcomm
带电的小王1 个月前
whisper.cpp: Android端测试 -- Android端手机部署音频大模型
android·智能手机·llm·whisper·音频大模型·whisper.cpp
带电的小王1 个月前
whisper.cpp: PC端测试 -- 电脑端部署音频大模型
llm·whisper·音视频·音频大模型