libasound+libsndfile读取麦克风音频保存为wav文件

依赖库

要完成该功能依赖libasound、libsndfile库,该命令在linux下可以通过命令行安装安装,安装命令如下:

bash 复制代码
sudo apt-get install libasound2-dev
sudo apt-get install libsndfile1-dev

代码实现

本文的目的是在linux下利用libasound和libsndfile库基于C++实现读取麦克风数据,并保存为wav文件。具体实现代码如下所示:

cpp 复制代码
#include <iostream>
#include <vector>
#include <complex>
#include <fftw3.h>
#include <alsa/asoundlib.h>
#include "math.h"
#include "stdio.h"
#include <vector>
#include <QDateTime>
#include <QDebug>
#include <fstream>
#include "sndfile.h"

using namespace std;
const int FRAME_SIZE = 1024;


// 定义采样率、通道数、采样格式等参数
#define SAMPLE_RATE 16000
#define CHANNELS 1
#define FORMAT SND_PCM_FORMAT_S16_LE // 16位,小端

int main() {
    // 初始化 ALSA 音频采集
    snd_pcm_t* capture_handle;
    int rc;

    rc = snd_pcm_open(&capture_handle, "default", SND_PCM_STREAM_CAPTURE, 0);
    if (rc < 0)
    {
        std::cerr << "无法打开默认音频设备: " << snd_strerror(rc) << std::endl;
            return 1;
    }

    // 设置音频采集参数
    // 配置PCM参数
    snd_pcm_hw_params_t *params;
    snd_pcm_hw_params_alloca(&params);
    snd_pcm_hw_params_any(capture_handle, params);
    snd_pcm_hw_params_set_access(capture_handle, params, SND_PCM_ACCESS_RW_INTERLEAVED);  //设置该参数的目的是决定多通道时是否采用一块内存来存储音频数据,设置SND_PCM_ACCESS_RW_INTERLEAVED参数就是将多通道情况下的数据存储到一块内存中
    snd_pcm_hw_params_set_format(capture_handle, params, FORMAT);
    snd_pcm_hw_params_set_channels(capture_handle, params, CHANNELS);
    unsigned int sampleRate = SAMPLE_RATE;
    snd_pcm_hw_params_set_rate_near(capture_handle, params, &sampleRate, 0);
    int err = snd_pcm_hw_params(capture_handle, params);
    if(err < 0)
    {
        fprintf(stderr, "无法打开 PCM 设备: %s\n", snd_strerror(err));
        return 1;
    }


    SNDFILE* sndfile;
    SF_INFO sfinfo;
    sfinfo.samplerate = 16000;
    sfinfo.channels = 1;
    sfinfo.format = SF_FORMAT_WAV | SF_FORMAT_PCM_16;
    sfinfo.frames = 0;
    sndfile = sf_open("output1.wav", SFM_WRITE, &sfinfo);
    if(!sndfile)
    {
        qDebug()<<"无法创建wav文件";
        snd_pcm_close(capture_handle);
        return 1;
    }
    int index = 0;
    short* audioFrame = (short*)malloc(FRAME_SIZE*sizeof(short));
    while (true)
    {

        rc = snd_pcm_readi(capture_handle, audioFrame, FRAME_SIZE);
        //vector<int16_t> vData(audioFrame, audioFrame+FRAME_SIZE);
        qDebug()<<"time :"<<QDateTime::currentMSecsSinceEpoch();
        if (rc == FRAME_SIZE)
        {

            sf_count_t ret = sf_write_short(sndfile, audioFrame, FRAME_SIZE);
            qDebug()<<"sf_write_short ret : "<<ret;
            index++;
            if(index == 50)
                break;

        }
        else if (rc < 0)
        {
            std::cerr << "读取音频数据时出错: " << snd_strerror(rc) << std::endl;
                break;
        }
    }
    sf_close(sndfile);
    snd_pcm_close(capture_handle);

    return 0;
}

该程序编译通过后,运行该程序,可以实现录音。

相关推荐
二等饼干~za8986684 小时前
豆包GEO优化源码开发全解析:技术架构、实现逻辑与实操指南
数据库·sql·重构·架构·mybatis·音视频
枳实-叶4 小时前
嵌入式音视频开发——视频码率与码率控制技术
音视频
小鹿软件办公5 小时前
Solong 音频转换器:免费批量提取视频中的音频文件
音视频·免费音频播放器
EasyCVR5 小时前
插件模块化集成设计:花屏蓝屏画面模糊检测...EasyCVR视频质量诊断功能的技术与落地逻辑
服务器·数据库·音视频·视频质量诊断
琪伦的工具库5 小时前
批量视频根据参数重命名工具使用指南
ffmpeg·音视频
琪伦的工具库6 小时前
批量视频分割软件使用指南
音视频
txp玩Linux6 小时前
嵌入式音视频:语音识别开源项目
人工智能·音视频·语音识别
沃普天科技6 小时前
IF8032芯片TYPE C全功能输出支持C口显示器,支持AR眼镜 显示,支持接扩展坞,支持PD100W 4K144
游戏·智能手机·计算机外设·电脑·ar·音视频·显示器
AI服务老曹6 小时前
企业级视频中台的协议兼容性架构:基于 GB28181 与 RTSP 的全品牌设备统一接入方案
架构·音视频