librosa 语音识别 学习笔记

目录

不错的功能介绍

librosa安装

语音识别


不错的功能介绍

librosa,一个很有趣的 Python 库! - 简书

音频转特征向量

GitHub - librosa/librosa: Python library for audio and music analysis

librosa安装

2024.04.27 测试ok Win11系统

pip install librosa

python 复制代码
import os

import numpy as np
from transformers import Wav2Vec2Processor, Wav2Vec2Model
import torch

import librosa


def load_example_input(audio_path, processor=None):
    if processor is None:
        processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")

    speech_array, sampling_rate = librosa.load(os.path.join(audio_path), sr=16000)

    audio_feature = np.squeeze(processor(speech_array, sampling_rate=sampling_rate).input_values)

    audio_feature = np.reshape(audio_feature, (-1, audio_feature.shape[0]))

    return torch.FloatTensor(audio_feature)


audio_path=r'demo/wav/man.wav'


load_example_input(audio_path)

语音识别

pip install SpeechRecognition

pip install pyaudio

python 复制代码
import librosa
import speech_recognition as sr

# 录制音频
r = sr.Recognizer()
with sr.Microphone() as source:
    print("请开始说话...")
    audio = r.listen(source)

# 将音频转换为文本
try:
    text = r.recognize_google(audio)
    print("识别结果:", text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求出错:{e}")
相关推荐
LaughingZhu1 分钟前
Product Hunt 每日热榜 | 2026-03-11
大数据·数据库·人工智能·经验分享·搜索引擎
Coding茶水间3 分钟前
基于深度学习的茶叶病害检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
开发语言·人工智能·深度学习·yolo·机器学习
高尤娜5 分钟前
【211/985高校主办-上海交通大学】第七届医学人工智能国际学术会议(ISAIMS2026)
人工智能·医学·ei检索·投稿·国际学术会议·上海·海报展示·口头报告
Project_Observer8 分钟前
任务条件布局规则如何帮助自动管理任务?
大数据·数据结构·人工智能·深度学习·机器学习·编辑器
用户3507571499928 分钟前
OpenClaw 2026.3.8 + DeepSeek 配置实战:从“Unknown Model”到完美运行的避坑指南
人工智能
笃行3509 分钟前
完整卸载 OpenClaw — 各平台卸载完全指南(Windows/macOS/Linux/npm/pnpm)
人工智能
HAREWORK_FFF9 分钟前
科研人员时间规划指南:CAIE认证2026年考试频次与具体安排一览
人工智能
桂花饼10 分钟前
OpenClaw、GPT-5.4:引入原生计算机使用能力(附国内API无缝接入指南)
人工智能·gpt·qwen3-next·sora2pro·openclaw·gemini-3.1pro·gpt-5.4
Codigger官方11 分钟前
Polyglot Singularity:下一代编程生态如何重构协作
大数据·人工智能·重构
华农DrLai12 分钟前
OpenClaw vs 普通 API 调用:从编排者到委托者的根本性范式转变
人工智能·自然语言处理·大模型·nlp·transformer