libasound+libsndfile读取麦克风音频保存为wav文件

依赖库

要完成该功能依赖libasound、libsndfile库,该命令在linux下可以通过命令行安装安装,安装命令如下:

bash 复制代码
sudo apt-get install libasound2-dev
sudo apt-get install libsndfile1-dev

代码实现

本文的目的是在linux下利用libasound和libsndfile库基于C++实现读取麦克风数据,并保存为wav文件。具体实现代码如下所示:

cpp 复制代码
#include <iostream>
#include <vector>
#include <complex>
#include <fftw3.h>
#include <alsa/asoundlib.h>
#include "math.h"
#include "stdio.h"
#include <vector>
#include <QDateTime>
#include <QDebug>
#include <fstream>
#include "sndfile.h"

using namespace std;
const int FRAME_SIZE = 1024;


// 定义采样率、通道数、采样格式等参数
#define SAMPLE_RATE 16000
#define CHANNELS 1
#define FORMAT SND_PCM_FORMAT_S16_LE // 16位,小端

int main() {
    // 初始化 ALSA 音频采集
    snd_pcm_t* capture_handle;
    int rc;

    rc = snd_pcm_open(&capture_handle, "default", SND_PCM_STREAM_CAPTURE, 0);
    if (rc < 0)
    {
        std::cerr << "无法打开默认音频设备: " << snd_strerror(rc) << std::endl;
            return 1;
    }

    // 设置音频采集参数
    // 配置PCM参数
    snd_pcm_hw_params_t *params;
    snd_pcm_hw_params_alloca(&params);
    snd_pcm_hw_params_any(capture_handle, params);
    snd_pcm_hw_params_set_access(capture_handle, params, SND_PCM_ACCESS_RW_INTERLEAVED);  //设置该参数的目的是决定多通道时是否采用一块内存来存储音频数据,设置SND_PCM_ACCESS_RW_INTERLEAVED参数就是将多通道情况下的数据存储到一块内存中
    snd_pcm_hw_params_set_format(capture_handle, params, FORMAT);
    snd_pcm_hw_params_set_channels(capture_handle, params, CHANNELS);
    unsigned int sampleRate = SAMPLE_RATE;
    snd_pcm_hw_params_set_rate_near(capture_handle, params, &sampleRate, 0);
    int err = snd_pcm_hw_params(capture_handle, params);
    if(err < 0)
    {
        fprintf(stderr, "无法打开 PCM 设备: %s\n", snd_strerror(err));
        return 1;
    }


    SNDFILE* sndfile;
    SF_INFO sfinfo;
    sfinfo.samplerate = 16000;
    sfinfo.channels = 1;
    sfinfo.format = SF_FORMAT_WAV | SF_FORMAT_PCM_16;
    sfinfo.frames = 0;
    sndfile = sf_open("output1.wav", SFM_WRITE, &sfinfo);
    if(!sndfile)
    {
        qDebug()<<"无法创建wav文件";
        snd_pcm_close(capture_handle);
        return 1;
    }
    int index = 0;
    short* audioFrame = (short*)malloc(FRAME_SIZE*sizeof(short));
    while (true)
    {

        rc = snd_pcm_readi(capture_handle, audioFrame, FRAME_SIZE);
        //vector<int16_t> vData(audioFrame, audioFrame+FRAME_SIZE);
        qDebug()<<"time :"<<QDateTime::currentMSecsSinceEpoch();
        if (rc == FRAME_SIZE)
        {

            sf_count_t ret = sf_write_short(sndfile, audioFrame, FRAME_SIZE);
            qDebug()<<"sf_write_short ret : "<<ret;
            index++;
            if(index == 50)
                break;

        }
        else if (rc < 0)
        {
            std::cerr << "读取音频数据时出错: " << snd_strerror(rc) << std::endl;
                break;
        }
    }
    sf_close(sndfile);
    snd_pcm_close(capture_handle);

    return 0;
}

该程序编译通过后,运行该程序,可以实现录音。

相关推荐
Likeadust6 小时前
视频直播点播平台EasyDSS助力阳光政务直播体系建设
音视频·政务
xcLeigh10 小时前
HTML5实现好看的视频播放器(三种风格,附源码)
前端·音视频·html5
骄傲的心别枯萎13 小时前
RV1126 NO.57:ROCKX+RV1126人脸识别推流项目之读取人脸图片并把特征值保存到sqlite3数据库
数据库·opencv·计算机视觉·sqlite·音视频·rv1126
好游科技14 小时前
IM即时通讯系统:安全可控、功能全面的社交解决方案全解析
安全·音视频·webrtc·im即时通讯·私有化部署im即时通讯·社交app
EasyDSS15 小时前
视频直播点播平台EasyDSS构建高并发、低延迟的远程教学直播新模式
音视频
GIOTTO情15 小时前
多模态舆情监测技术深度解析:Infoseek 如何实现 AI 造假与短视频舆情的精准捕捉?
人工智能·音视频
音视频牛哥15 小时前
C# 开发工业级 RTSP/RTMP 播放器实战:基于 SmartMediakit 的低延迟与高可靠性设计
音视频·rtsp播放器·rtmp播放器·windows rtsp播放器·windows rtmp播放器·c# rtsp播放器·c# rtmp播放器
JellyDDD15 小时前
【悬赏】Android WebRTC 数字人项目回声问题排查(AEC / AudioMode)
音视频·webrtc
于是我说16 小时前
如何判断一个视频到底是真实 MP4 直链,还是流媒体M3U8
网络·音视频
gf132111116 小时前
剪映草稿位置坐标换算
音视频