RV1126+FFMPEG推流项目(7)AI音频模块编码流程

一、AI 模块和外设麦克风的关系

AI 模块是 RV1126 芯片的一个重要组成部分。它的主要功能是将外部接入的麦克风采集到的模拟信号通过内置的驱动程序转换为数字信号。这意味着麦克风作为外设,提供音频输入信号,AI 模块通过其硬件和软件的结合,负责对这些信号的处理和转换。

音频编码流程主要分三步:AI的初始化**** 、AENC的初始化( 硬件编码****)**** 、绑定AI 和A ENC 节点开启A ENC ****线程进行视频编码的采集,****注意一下这里的编码是硬件编码,不是使用ffmpeg软件编码。和视频的流程差不多

在第三篇的时候,已经介绍过了这RV1126_AI_CONFIG、RV1126_AENC_CONFIG这两个数据结构。回顾一下。


RV1126_AI_CONFIG:

复制代码
typedef struct
{
    unsigned int id;   ///< 音频通道ID,用于标识不同的音频输入通道
    AI_CHN_ATTR_S attr; ///< 音频通道属性,包含通道的具体配置信息
} RV1126_AI_CONFIG;

里面有一个最重要的成员AI_CHN_ATTR_S,是AI模块的数据结构体。

编码:rkmedia_module_function.cpp

复制代码
    //AI模块
    RV1126_AI_CONFIG rv_ai;
    memset(&rv_ai, 0, sizeof( RV1126_AI_CONFIG)); //清空结构体
    rv_ai.id = 0; //AI模块采集通道
    rv_ai.attr.pcAudioNode = AUDIO_PATH; //默认是default,音频alsa路径
    rv_ai.attr.enSampleFormat = RK_SAMPLE_FMT_S16; //音频采样深度。
    rv_ai.attr.enAiLayout = AI_LAYOUT_NORMAL; //音频布局,默认是2
    rv_ai.attr.u32NbSamples = NB_SAMPLES; //AAC默认1024
    rv_ai.attr.u32SampleRate = 48000;//音频采样率
    rv_ai.attr.u32Channels = 2; //音频通道数
    ret =rkmedia_ai_init(&rv_ai); //
    if(ret != 0)
    {
        printf("ai模块初始化\n");
    }
    else
    {
        printf("ai模块创建成功\n");
        //把音频的通道号id保存到容器
        RV1126_AI_CONTAINER ai_container;
        ai_container.id = 0;
        ai_container.ai_id = rv_ai.id; //保存进去
        set_ai_container(0, &ai_container);//设置AI容器
    }

基本编码流程也是和视频差不多。

相关推荐
蝈蝈tju1 分钟前
Vibe Coding 正确姿势: 先会指挥, 再让AI干
人工智能·经验分享·ai
想你依然心痛7 分钟前
AI 换脸新纪元:Facefusion 人脸融合实战探索
人工智能·换脸·facefusion·人脸融合
马士兵教育10 分钟前
计算机专业学生入行IT行业,编程语言如何选择?
java·开发语言·c++·人工智能·python
CoderJia程序员甲11 分钟前
GitHub 热榜项目 - 日榜(2026-01-28)
人工智能·ai·大模型·github·ai教程
康谋自动驾驶21 分钟前
高校自动驾驶研究新基建:“实测 - 仿真” 一体化数据采集与验证平台
人工智能·机器学习·自动驾驶·科研·数据采集·时间同步·仿真平台
Ftsom21 分钟前
【6】kilo 上下文管理与压缩机制
人工智能·agent·ai编程·kilo
熊猫钓鱼>_>25 分钟前
从零到一:打造“抗造” Electron 录屏神器的故事
前端·javascript·ffmpeg·electron·node·录屏·record
shangjian00726 分钟前
AI-大语言模型LLM-Transformer架构1-整体介绍
人工智能·语言模型·transformer
机 _ 长31 分钟前
YOLO26 蒸馏改进全攻略:从理论到实战 (Response + Feature + Relation)
人工智能·深度学习·yolo·目标检测·计算机视觉
shangjian00734 分钟前
AI-大语言模型LLM-Transformer架构2-自注意力
人工智能·语言模型·transformer