librosa 语音识别 学习笔记

目录

不错的功能介绍

librosa安装

语音识别


不错的功能介绍

librosa,一个很有趣的 Python 库! - 简书

音频转特征向量

GitHub - librosa/librosa: Python library for audio and music analysis

librosa安装

2024.04.27 测试ok Win11系统

pip install librosa

python 复制代码
import os

import numpy as np
from transformers import Wav2Vec2Processor, Wav2Vec2Model
import torch

import librosa


def load_example_input(audio_path, processor=None):
    if processor is None:
        processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")

    speech_array, sampling_rate = librosa.load(os.path.join(audio_path), sr=16000)

    audio_feature = np.squeeze(processor(speech_array, sampling_rate=sampling_rate).input_values)

    audio_feature = np.reshape(audio_feature, (-1, audio_feature.shape[0]))

    return torch.FloatTensor(audio_feature)


audio_path=r'demo/wav/man.wav'


load_example_input(audio_path)

语音识别

pip install SpeechRecognition

pip install pyaudio

python 复制代码
import librosa
import speech_recognition as sr

# 录制音频
r = sr.Recognizer()
with sr.Microphone() as source:
    print("请开始说话...")
    audio = r.listen(source)

# 将音频转换为文本
try:
    text = r.recognize_google(audio)
    print("识别结果:", text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求出错:{e}")
相关推荐
刘立军11 小时前
本地大模型编程实战(39)MCP实战演练
人工智能·后端·mcp
q_302381955611 小时前
RK3588 + YOLOv8 田块分割实战指南:从环境搭建到部署落地全流程
人工智能·单片机·深度学习·神经网络·物联网·yolo
marteker11 小时前
星巴克与「野兽先生」‌合作,助力亚马逊Prime Video竞技节目
人工智能
qq_3106585111 小时前
webrtc源码走读(四)核心引擎层——视频引擎
服务器·c++·音视频·webrtc
wenzhangli711 小时前
AI Coding落地困局破题:2025实战复盘与8步实施法的工程解法
人工智能
极客BIM工作室11 小时前
Manus 技术壁垒深度拆解
人工智能·机器学习
IT_陈寒11 小时前
Redis性能翻倍的5个关键策略:从慢查询到百万QPS的实战优化
前端·人工智能·后端
咚咚王者11 小时前
人工智能之核心基础 机器学习 第三章 线性回归与逻辑回归
人工智能·机器学习·线性回归
jkyy201411 小时前
线上线下一体化,AI慢病管理突破药品零售时空限制
大数据·人工智能·健康医疗
愚公搬代码11 小时前
【愚公系列】《扣子开发 AI Agent 智能体应用》027-实战案例:企业营销宣传海报自动生成器
人工智能