librosa 语音识别 学习笔记

目录

不错的功能介绍

librosa安装

语音识别


不错的功能介绍

librosa,一个很有趣的 Python 库! - 简书

音频转特征向量

GitHub - librosa/librosa: Python library for audio and music analysis

librosa安装

2024.04.27 测试ok Win11系统

pip install librosa

python 复制代码
import os

import numpy as np
from transformers import Wav2Vec2Processor, Wav2Vec2Model
import torch

import librosa


def load_example_input(audio_path, processor=None):
    if processor is None:
        processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")

    speech_array, sampling_rate = librosa.load(os.path.join(audio_path), sr=16000)

    audio_feature = np.squeeze(processor(speech_array, sampling_rate=sampling_rate).input_values)

    audio_feature = np.reshape(audio_feature, (-1, audio_feature.shape[0]))

    return torch.FloatTensor(audio_feature)


audio_path=r'demo/wav/man.wav'


load_example_input(audio_path)

语音识别

pip install SpeechRecognition

pip install pyaudio

python 复制代码
import librosa
import speech_recognition as sr

# 录制音频
r = sr.Recognizer()
with sr.Microphone() as source:
    print("请开始说话...")
    audio = r.listen(source)

# 将音频转换为文本
try:
    text = r.recognize_google(audio)
    print("识别结果:", text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求出错:{e}")
相关推荐
Agilex松灵机器人6 分钟前
什么是具身智能底盘?4 类主流 AI 机器人底盘选型|VLA/ROS2 项目硬件指南
人工智能·机器人·具身智能·vla·aloha·松灵科研案例
vvzh20268 分钟前
南京区域 GEO 优化落地周期与 AI 收录规律详解(豆包、DeepSeek 适配指南)
人工智能
Black蜡笔小新10 分钟前
自动化AI算法训练服务器DLTM零代码私有化一站式AI训练平台技术解析
人工智能·算法·自动化
Bruce_Liuxiaowei10 分钟前
高考护航AI押题虚假宣传_AI滥用风险民生场景深度分析
人工智能·安全·ai·高考·智能体
vvzh202617 分钟前
2026南京初创企业GEO知识库落地思路:一站式结构化知识库搭建落地参考
人工智能
澄旭25 分钟前
一篇讲清 Agent Skills:把经验变成可调用的能力
人工智能
合合技术团队40 分钟前
2026中国图像图形大会召开,合合信息推出多模态可信AI鉴伪系统
图像处理·人工智能·aigc鉴伪
俊哥V40 分钟前
AI一周事件 · 2026-05-27 至 2026-06-02
人工智能·ai
G***技40 分钟前
极寒也能跑AI?LM2-100-V0算力模组为电网巡检终端注入AI动能
人工智能
行业研究员41 分钟前
腾讯云AgentMemory产品介绍与核心痛点解决
人工智能·机器学习·腾讯云·agentmem