librosa 语音识别 学习笔记

目录

不错的功能介绍

librosa安装

语音识别


不错的功能介绍

librosa,一个很有趣的 Python 库! - 简书

音频转特征向量

GitHub - librosa/librosa: Python library for audio and music analysis

librosa安装

2024.04.27 测试ok Win11系统

pip install librosa

python 复制代码
import os

import numpy as np
from transformers import Wav2Vec2Processor, Wav2Vec2Model
import torch

import librosa


def load_example_input(audio_path, processor=None):
    if processor is None:
        processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")

    speech_array, sampling_rate = librosa.load(os.path.join(audio_path), sr=16000)

    audio_feature = np.squeeze(processor(speech_array, sampling_rate=sampling_rate).input_values)

    audio_feature = np.reshape(audio_feature, (-1, audio_feature.shape[0]))

    return torch.FloatTensor(audio_feature)


audio_path=r'demo/wav/man.wav'


load_example_input(audio_path)

语音识别

pip install SpeechRecognition

pip install pyaudio

python 复制代码
import librosa
import speech_recognition as sr

# 录制音频
r = sr.Recognizer()
with sr.Microphone() as source:
    print("请开始说话...")
    audio = r.listen(source)

# 将音频转换为文本
try:
    text = r.recognize_google(audio)
    print("识别结果:", text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求出错:{e}")
相关推荐
love530love5 分钟前
【笔记】华硕 ROG MAXIMUS Z890 HERO 主板 BIOS 更新完整操作实录
运维·人工智能·windows·笔记·单片机·嵌入式硬件·bios
深度学习实战训练营6 分钟前
Monodepth:基于左右一致性的无监督单目深度估计,单目估计的起步-k学长深度学习专栏
人工智能·深度学习
逐梦苍穹8 分钟前
为什么 AI 时代用 macOS 更好(以及如何少踩坑)
人工智能·macos
碎碎思11 分钟前
FINN:FPGA AI 推理新范式 —— 定制化、高性能、量化神经网络编译器框架
人工智能·深度学习·神经网络·机器学习·fpga开发
光锥智能16 分钟前
钉钉发布全球首个工作智能操作系统Agent OS,重构AI时代的工作方式
人工智能·重构·钉钉
论缘投稿网17 分钟前
论文生成降重会改变内容吗
人工智能·深度学习·aigc
得助智能-垂类大模型18 分钟前
电销选ai智能外呼系统还是人工拨打电话?得助智能外呼效率提升10倍成本直降5倍!
人工智能·ai·销售·得助智能·电销·智能外呼系统·呼叫系统
zhaodiandiandian19 分钟前
生成式AI落地潮:从技术狂欢到商业价值重构
人工智能·重构
小程故事多_8019 分钟前
用Agent与大模型实现Web项目全自动化生成:从需求到部署的完整落地方案
运维·前端·人工智能·自动化·aigc
paopao_wu23 分钟前
深度学习4:手写数字识别
人工智能·深度学习