【whisper】使用whisper实现语音转文字

rhythmcc2024-09-05 16:02

whisper需要ffmpeg支持

官网下载ffmpeg

cpp 复制代码

https://www.gyan.dev/ffmpeg/builds/

下载完毕后解压放到合适的位置

添加环境变量

在cmd中输入以下

cpp 复制代码

ffmpeg -version

出现下面结果代表成功

安装whisper

cpp 复制代码

pip install openai-whisper

在vscode中运行

测试代码

cpp 复制代码

import whisper

if __name__ == '__main__':
    # 加载模型
    model = whisper.load_model("large")
    audio_path = 'Asset2021_10_23\\test_audio_2024_09_01.aac'
    result = model.transcribe(audio_path, fp16=True, language="Chinese")
    print(result["text"])

上一篇：C++:控制电脑状态控制

下一篇：云电脑超越传统PC——再谈公有云的新市场