librosa 语音识别 学习笔记

目录

不错的功能介绍

librosa安装

语音识别


不错的功能介绍

librosa,一个很有趣的 Python 库! - 简书

音频转特征向量

GitHub - librosa/librosa: Python library for audio and music analysis

librosa安装

2024.04.27 测试ok Win11系统

pip install librosa

python 复制代码
import os

import numpy as np
from transformers import Wav2Vec2Processor, Wav2Vec2Model
import torch

import librosa


def load_example_input(audio_path, processor=None):
    if processor is None:
        processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")

    speech_array, sampling_rate = librosa.load(os.path.join(audio_path), sr=16000)

    audio_feature = np.squeeze(processor(speech_array, sampling_rate=sampling_rate).input_values)

    audio_feature = np.reshape(audio_feature, (-1, audio_feature.shape[0]))

    return torch.FloatTensor(audio_feature)


audio_path=r'demo/wav/man.wav'


load_example_input(audio_path)

语音识别

pip install SpeechRecognition

pip install pyaudio

python 复制代码
import librosa
import speech_recognition as sr

# 录制音频
r = sr.Recognizer()
with sr.Microphone() as source:
    print("请开始说话...")
    audio = r.listen(source)

# 将音频转换为文本
try:
    text = r.recognize_google(audio)
    print("识别结果:", text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求出错:{e}")
相关推荐
weixin_4462608516 小时前
本地部署与实践指南:构建免费的AI开发助手系统(Claude Code + Ollama)
人工智能
南宫萧幕16 小时前
Simulink 从零搭建 HEV ECMS 环境:模块解析、排坑指南与智能算法接口预留
人工智能·算法·matlab·汽车·控制
YuanDaima204817 小时前
Docker 工程化安装与核心命令实战
运维·人工智能·docker·微服务·容器·bash
杰之行17 小时前
Fast-DDS 接收数据完整时序分析
c++·人工智能
闲人编程17 小时前
Agent的评估体系(AgentEval):如何判断一个Agent好坏?
大数据·人工智能·python·算法·agent·智能体·swe
hnult17 小时前
知识竞赛考试平台怎么选?2026 考试云全功能选型与实践指南
大数据·人工智能
tzc_fly17 小时前
Latent-Y:经实验室验证的从头药物设计自主智能体
人工智能
weixin_4462608517 小时前
hermes agent的版本更新与web控制台
人工智能
瑞华丽PLM17 小时前
瑞华丽 AI 智能体研发数字化实战指南
人工智能·cae·工业软件·仿真软件·国产软件·瑞华丽plm·瑞华丽
MediaTea17 小时前
AI 术语通俗词典:logits
人工智能