RV1126 音频AI模块的详解

一.什么是音频AI模块

RV1126的AI模块指的是音频输入模块 ,它的作用是通过内置芯片读取麦克风等音频的模拟信号,然后把音频模拟信号转换成数字信号。在RV1126里面,音频AI模块是所有音频输入的入口。下面是AI模块和麦克风等音频输入模块的关系

  • AI 模块结构体的重要参数

下面是AI_CHN_ATTR_S 结构体的成员变量

pcAudioNode AUDIO音频节点,默认是default

enSampleFormat 采样格式,下面是RV1126的提供的采样格式,下面好多种采样格式,我们来分别讲解一下:

RK_SAMPLE_FMT_U8: 无符号整型8位采样格式,它是8BIT采样格式的一种,这里的U是unsigned的缩写

RK_SAMPLE_FMT_S16: 整型16位采样格式,它是16IT采样格式,S是signed的缩写

RK_SAMPLE_FMT_S32: 整型32位采样格式,它是32IT采样格式,S是signed的缩写

RK_SAMPLE_FMT_FLT: 利用float格式去采样,它是用浮点型格式进行采样。取值范围是[-1.0, 1.0]。

RK_SAMPLE_FMT_U8P: 无符号整型8位采样平面格式,这里的****P 表示的是平面格式,平面格式指的是非交错模式 ,如:LLLLLLRRRRRRLLLLLLRRRRRRLLLLLLRRRRRRL

RK_SAMPLE_FMT_S16P: 整型16位采样平面格式,这里的P表示的是平面格式,平面格式指的是非交错模式,如:LLLLLLRRRRRRLLLLLLRRRRRRLLLLLLRRRRRRL

RK_SAMPLE_FMT_S32P: 整型32位采样平面格式,这里的P表示的是平面格式,平面格式指的是非交错模式,如:LLLLLLRRRRRRLLLLLLRRRRRRLLLLLLRRRRRRL R

RK_SAMPLE_FMT_FLTP: 浮点型采样平面格式,这里的P表示的是平面格式,平面格式指的是非交错模式,如:LLLLLLRRRRRRLLLLLLRRRRRRLLLLLLRRRRRRL

RK_SAMPLE_FMT_G711A: G711A是标准的ITU-T推荐的标准之一**,**采用8位精度进行采样,它主要运用在电话领域。A表示的是将一个13bit的PCM样本压缩成8bit样本

RK_SAMPLE_FMT_G711U: G711U是标准的ITU-T推荐的标准之一**,**采用8位精度进行采样,它主要运用在电话领域。U表示的是将一个14bit的PCM样本压缩成8bit样本。

2.3. u32Channels 音频通道数,音频默认通道数是****2

2.4. u32SampleRate 音频采样率,在RV1126里面常用的采样率是16000 44100 48000 三种。目前在这个开发中,我们用的是****48000,因为48000 采样率的音频效果最好

2.5. u32NbSample 每一帧的采样个数,这个参数要和对应的音频编码格式来设置。AAC音频编码格式对应的采样个数是1024,MP3音频编码格式对应的采样个数是1152,其实还有很多。

2.6. enAiLayout 音频输入布局类型,它提供了三个成员变量选择:AI_LAYOUT_NORMALAI_LAYOUT_MIC_REF 、AI_LAYOUT_REF_MIC。 它默认是用的是AI_LAYOUT_NORMAL 类型,默认是AI_LAYOUT_NORMAL。

二.设置AI模块的API

3.1. RK_MPI_AI_SetChnAttr 的功能:

RK_MPI_AI_SetChnAttr功能主要是设置AI通道属性

第一个参数: AI模块的通道号ID,取值范围是[0, AI_MAX_CHN_NUM]

第二个参数: AI_CHN_ATTR_S结构体指针

3.2. RK_MPI_AI_EnableChn 的功能:

RK_MPI_AI_EnableChn功能主要是打开AI通道

第一个参数: AI模块的通道号ID,这里填的值和设置的通道号一致

3.3. RK_MPI_AI_StartStream 的功能:

RK_MPI_AI_StartStream功能主要是启动AI音频流

第一个参数: AI模块的通道号ID,这里填的值和设置的通道号一致

相关推荐
工藤学编程2 小时前
零基础学AI大模型之LangChain智能体之initialize_agent开发实战
人工智能·langchain
king王一帅3 小时前
Incremark Solid 版本上线:Vue/React/Svelte/Solid 四大框架,统一体验
前端·javascript·人工智能
泰迪智能科技5 小时前
分享|职业技术培训|数字技术应用工程师快问快答
人工智能
Dxy12393102167 小时前
如何给AI提问:让机器高效理解你的需求
人工智能
少林码僧7 小时前
2.31 机器学习神器项目实战:如何在真实项目中应用XGBoost等算法
人工智能·python·算法·机器学习·ai·数据挖掘
钱彬 (Qian Bin)7 小时前
项目实践15—全球证件智能识别系统(切换为Qwen3-VL-8B-Instruct图文多模态大模型)
人工智能·算法·机器学习·多模态·全球证件识别
没学上了7 小时前
CNNMNIST
人工智能·深度学习
宝贝儿好7 小时前
【强化学习】第六章:无模型控制:在轨MC控制、在轨时序差分学习(Sarsa)、离轨学习(Q-learning)
人工智能·python·深度学习·学习·机器学习·机器人
智驱力人工智能8 小时前
守护流动的规则 基于视觉分析的穿越导流线区检测技术工程实践 交通路口导流区穿越实时预警技术 智慧交通部署指南
人工智能·opencv·安全·目标检测·计算机视觉·cnn·边缘计算
AI产品备案8 小时前
生成式人工智能大模型备案制度与发展要求
人工智能·深度学习·大模型备案·算法备案·大模型登记