whisper 实现语音识别 ASR - python 实现

语音识别(Speech Recognition),同时称为自动语音识别(英语:Automatic Speech Recognition, ASR),将语音音频转换为文字的技术。

whisper是一个通用的语音识别模型,由OpenAI公司开发。

whisper 模型相关参数如下:

安装对应的 python 库:

python 复制代码
pip install openai-whisper

对应示例音频下载地址:【免费】whisper实现语音识别ASR-python实现音频示例资源-CSDN文库

代码实现如下:

* 另外注意 whisper 语音识别的文本输出可能是繁体中文,可以通过opencc库转为简体中文,以下代码也有具体实现。

python 复制代码
import whisper
import opencc
# available models = ['tiny.en', 'tiny', 'base.en', 'base', 'small.en', 'small', 'medium.en', 'medium', 'large-v1', 'large-v2', 'large-v3', 'large']
cache_dir = "./whisper_ckpt/" # 模型缓存地址
model = whisper.load_model("medium",download_root = cache_dir)
result = model.transcribe("test.wav")
# print("result:",result)
print("language:",result["language"])# 识别语种
print("text:",result["text"])# 整句识别内容

m_cc = opencc.OpenCC('t2s') # 繁体转为简体中文
# 依据句子分割进行逐句打印
for ii in range(len(result["segments"])):
    m_ = result["segments"][ii]
    m_text = m_["text"]
    #----------------------
    m_text = m_cc.convert(m_text)
    print(" [{}] {}".format(ii,m_text))

对应的log:

python 复制代码
language: zh
text: 尖銳的槍聲打破了寧靜的鹽黃國西部邊垂原始森林天高雲淡 清風吹綠茂密的原始森林一處懸崖斷壁上悄悄探出了一老一少兩顆頭 顱來警惕地打量著四周老的慈眉善目有些先鋒道骨的味道少年有黑俊朗的臉龐上一對黑白分明的眼珠透著好奇和冷靜一切又恢復平靜彷彿剛才什麼都沒發生只有參田的大樹發出沙沙的聲響被驚奇的鳥又飛回樹叢
 [0] 尖锐的枪声打破了宁静的盐黄国西部边垂原始森林
 [1] 天高云淡 清风吹绿
 [2] 茂密的原始森林一处悬崖断壁上
 [3] 悄悄探出了一老一少两颗头颅来
 [4] 警惕地打量著四周
 [5] 老的慈眉善目
 [6] 有些先锋道骨的味道
 [7] 少年有黑
 [8] 俊朗的脸庞上
 [9] 一对黑白分明的眼珠透著好奇和冷静
 [10] 一切又恢复平静
 [11] 仿佛刚才什么都没发生
 [12] 只有参田的大树发出沙沙的声响
 [13] 被惊奇的鸟又飞回树丛

助力快速掌握数据集的信息和使用方式。

相关推荐
GalaxyPokemon29 分钟前
LeetCode - 704. 二分查找
数据结构·算法·leetcode
leo__5201 小时前
matlab实现非线性Granger因果检验
人工智能·算法·matlab
GG不是gg1 小时前
位运算详解之异或运算的奇妙操作
算法
FF-Studio3 小时前
万物皆数:构建数字信号处理的数学基石
算法·数学建模·fpga开发·自动化·音视频·信号处理·dsp开发
叶子爱分享4 小时前
从事算法工作对算法刷题量的需求
算法
勇闯IT4 小时前
有多少小于当前数字的数字
java·数据结构·算法
liuqun03195 小时前
开心灿烂go开发面试题
算法·leetcode·golang
liulilittle5 小时前
通过高级处理器硬件指令集AES-NI实现AES-256-CFB算法并通过OPENSSL加密验证算法正确性。
linux·服务器·c++·算法·安全·加密·openssl
小皮侠5 小时前
【算法篇】逐步理解动态规划模型6(回文串问题)
java·开发语言·算法·动态规划
IT猿手5 小时前
动态多目标进化算法:基于迁移学习的动态多目标粒子群优化算法(TrMOPSO)求解IEEE CEC 2015,提供完整MATLAB代码
算法·matlab·迁移学习·动态多目标进化优化·动态多目标算法