whisper 实现语音转文字

MonkeyKing_sunyuhua2024-06-25 19:44

准备需要转码的音频

https://support.huaweicloud.com/sdkreference-sis/sis_05_0039.html

编码转吗的代码

bash 复制代码

import whisper

if __name__ == "__main__":
    file_path = "16k16bit.wav"
    model = whisper.load_model("small")
    result = model.transcribe(file_path)
    print(result["text"])

查看效果

bash 复制代码

已连接到 pydev 调试器(内部版本号 232.10300.41)/PycharmProjects/fastApiProject/venv/lib/python3.10/site-packages/whisper/transcribe.py:115: UserWarning: FP16 is not supported on CPU; using FP32 instead
  warnings.warn("FP16 is not supported on CPU; using FP32 instead")
华为致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。

上一篇：第六章节 Qt的关联与集合容器

下一篇：计算机怎么进入安全模式

热门推荐

01手机电脑之间快速传输图片视频文件，不压缩画质、不限制大小的方法！02Coze实战第13讲：飞书多维表格读取+豆包生图模型，轻松批量生成短剧封面 03Coze扣子平台完整体验和实践（附国内和国际版对比）04华为昇腾 910B 部署 DeepSeek-R1 蒸馏系列模型详细指南 05免费可用！最强AI数字人对口型神器：让照片开口说话唱歌，支持多人对口型+全身动作，1分钟学会！（附保姆级教程）06扣子（coze）实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解 07Coze（扣子）智能体工作流：自动批量生成书单号视频，1分钟100个，书单号博主都在用！08C#调用WechatOCR.exe实现本地OCR文字识别 09DeepSeek各版本说明与优缺点分析 10Coze 全方位入门剖析 - 免费打造自己的 AI 超级个体