RK3588 Android12音频驱动分析全网最全

最近没有搞音频相关的了,在搞BMS, 把之前的经验总结一下。

一、先看一下Android 12音频总架构

从这张图可以看到音频数据流一共经过了3个用户空间层的进程,然后才流到kernel驱动层。Android版本越高,通用性越高,耦合性越低,但是带来的资源开销也越大,延时也越大。本文主要介绍驱动层相关的知识。详细流程可以参考:Android12 AudioFlinger 读写PCM数据-CSDN博客Android12 Native C++ 层AudioRecord录音AudioTrack播放_android c++ 录制音频-CSDN博客

Android 12 AudioFlinger 分析(RK3588)-CSDN博客

二、ASoC音频驱动框架

2.1 ASoC简介:

ASoC的由来

ASoC全程ALSA System on Chip ,是基于标准ALSA驱动层封装而来,可以更好地支持嵌入式处理器和移动设备中音频驱动功能。简单的理解就是ASoC把alsa根据硬件抽象成三个独立的驱动模块。通过snd_soc_dai_link 结构体来连接到一起组成一个声卡card暴露给用户空间。

ASoc音频系统可以被划分为:板载硬件(Machine)、Soc(Platform)、Codec三大部分,如下图所示:

经典常用DAI(digital audio interface)接口有I2S,PDM,TDM, SPDIF,UART,USB。 控制接口大部分是I2C,SPI。

Platform的作用:

Platform端包含I2S等数字接口驱动,和dma pcm驱动这个是直接调用linux dma功能api,具体dma驱动是另外一套驱动框架。主要作用是按软件设定的格式收发pcm数据。soc传输pcm数据软件层流程(更详细可参考tinyalsa播放录音调用流程-CSDN博客):

在platform驱动初始化时会申请dma通道配置相关参数如,源地址,目的地址,数据位宽,burst size,传输方向等。I2S IP一般会有32个sample的FIFO,I2S驱动会设置一个空闲阀值如15,当I2S IP空闲值大于等于15就会通过Req发信号给DMA IP,DMA收到信号后从指定memory地址(软件层的Ring_Buffer)搬运数据到I2S的FIFO,然后返回Ack信号给I2S IP。DMA搬运数据达到一定值就会产生一个中断给CPU,从而运行DMA中断处理函数更新读写指针等相关参数。录音流程则是返过来。

从上面两个图可以看出,对于满负荷运行场景出现断续卡顿问题除了CPU软件层发生XRUN外,芯片各个模块都高负荷运行内部AXI APB AHB总线带宽可能不够,导致DMA不能及时搬运数据,也就是I2S和DMA硬件也会发生XRUN。这种情况从CPU软件层很难有好的解决方法。

Codec的作用:

数模转换,对于playback是将接收到的数字信号转换为模拟信号,对于capture是将采集到的模拟信号转换为数字信号发送出去。对于一些高级的codec还提供了多路音源混音,EQ,DRC,AGC,NR降噪等功能。

Machine的作用:

一款PCBA产品可以有很多个codec的音频接口,cpu端的音频接口,Machine驱动的作用就是通过snd_soc_dai_link 结构体把具体的platform,codec链接在一起组成音频通路,注册成一个声卡card暴露给用户空间。

2.2 具体驱动例子:

下面基于RK3588, kernel-5.10平台举个例子:

Platform端(RK3588),这部分驱动是soc芯片原厂应该做好的:

rk3588-evb1-lp4.dtsi:
i2s0_8ch: i2s@fe470000 {
  compatible = "rockchip,rk3588-i2s-tdm";
  reg = <0x0 0xfe470000 0x0 0x1000>;
  interrupts = <GIC_SPI 180 IRQ_TYPE_LEVEL_HIGH>;
  ......................................
};
rockchip_i2s_tdm.c:
static const struct snd_soc_component_driver rockchip_i2s_tdm_component = {
  .name = DRV_NAME,
};
//这些函数和具体soc有关,操作soc相关寄存器配置i2s,tdm格式
static const struct snd_soc_dai_ops rockchip_i2s_tdm_dai_ops = {
  .hw_params = rockchip_i2s_tdm_hw_params,//设置bclk,lrclk,采样位宽通道数
  .set_sysclk = rockchip_i2s_tdm_set_sysclk,// 设置mclk
  .set_fmt = rockchip_i2s_tdm_set_fmt,//设置i2s格式,
  .set_tdm_slot = rockchip_dai_tdm_slot,// 设置tdm通道数
  .trigger = rockchip_i2s_tdm_trigger,// 启动/停止i2s收发数据
};
static int rockchip_i2s_tdm_dai_prepare(struct platform_device *pdev,
           struct snd_soc_dai_driver **soc_dai)
{
   struct snd_soc_dai_driver rockchip_i2s_tdm_dai = {
    .probe = rockchip_i2s_tdm_dai_probe,
    .playback = {
      .stream_name = "Playback",
      .channels_min = 2,
      .channels_max = 16,
      .rates = SNDRV_PCM_RATE_8000_192000,
      .formats = (SNDRV_PCM_FMTBIT_S8 |....),
    },
    .capture = {
    ...........................
    },
    .ops = &rockchip_i2s_tdm_dai_ops,
  };
  *soc_dai = devm_kmemdup(&pdev->dev, &rockchip_i2s_tdm_dai,
         sizeof(rockchip_i2s_tdm_dai), GFP_KERNEL);
   return 0;
}
// 解析rk3588-evb1-lp4.dtsi文件 i2s0_8ch节点填充各个参数然后注册一个snd_soc_dai_driver 
static int rockchip_i2s_tdm_probe(struct platform_device *pdev)
{
   struct device_node *node = pdev->dev.of_node;
   struct device_node *cru_node;
   const struct of_device_id *of_id;
   struct rk_i2s_tdm_dev *i2s_tdm;
   struct snd_soc_dai_driver *soc_dai;
   //playback m2d, 地址为i2s的tx fifo
   i2s_tdm->playback_dma_data.addr = res->start + I2S_TXDR;
   i2s_tdm->playback_dma_data.addr_width = DMA_SLAVE_BUSWIDTH_4_BYTES;
   i2s_tdm->playback_dma_data.maxburst = 8;
   //capture d2m, 地址为i2s的rx fifo
   i2s_tdm->capture_dma_data.addr = res->start + I2S_RXDR;
   i2s_tdm->capture_dma_data.addr_width = DMA_SLAVE_BUSWIDTH_4_BYTES;
   i2s_tdm->capture_dma_data.maxburst = 8;
   dev_set_drvdata(&pdev->dev, i2s_tdm);
   // 填充soc_dai各个字段
  ret = rockchip_i2s_tdm_dai_prepare(pdev, &soc_dai);
   // 注册dai接口
  ret = devm_snd_soc_register_component(&pdev->dev,
             &rockchip_i2s_tdm_component,
              soc_dai, 1);
   // 注册dma pcm,会调用到linux dma通用api。
  ret = devm_snd_dmaengine_pcm_register(&pdev->dev, NULL, 0);
}

Codec端驱动是芯片原厂提供,产品开发公司适配调试:

rk3588-evb1-lp4.dtsi:
&i2c7 {
  status = "okay";
  es8388: es8388@11 {
    status = "okay";
    compatible = "everest,es8388", "everest,es8323";
    ........................................
  };
};
es8328.c:
// 这些函数操作codec寄存器,设置格式等。i2c接口
static const struct snd_soc_dai_ops es8328_dai_ops = {
  .startup  = es8328_startup,
  .hw_params = es8328_hw_params,
  .mute_stream  = es8328_mute,
  .set_sysclk = es8328_set_sysclk,
  .set_fmt  = es8328_set_dai_fmt,
  .no_capture_mute = 1,
};
// dai接口参数
static struct snd_soc_dai_driver es8328_dai = {
  .name = "es8328-hifi-analog",
  .playback = {
    .stream_name = "Playback",
    .channels_min = 2,
    .channels_max = 2,
    .rates = ES8328_RATES,
    .formats = ES8328_FORMATS,
  },
  .capture = {
  ........................
  },
  .ops = &es8328_dai_ops,
  .symmetric_rates = 1,
};
// 设置各种控制接口
static const struct snd_soc_component_driver es8328_component_driver = {
};
// 解析rk3588-evb1-lp4.dtsi文件 es8388节点填充各个参数然后注册一个snd_soc_dai_driver 
int es8328_probe(struct device *dev, struct regmap *regmap)
{
   return devm_snd_soc_register_component(dev,
      &es8328_component_driver, &es8328_dai, 1);
}

Machine端驱动是产品开发公司实现/调试:

rk3588-evb1-lp4.dtsi:
es8388_sound: es8388-sound {
status = "okay";
compatible = "rockchip,multicodecs-card";
rockchip,card-name = "rockchip-es8388";
rockchip,format = "i2s";
rockchip,mclk-fs = <256>;
//指定platform端那个dai接口
rockchip,cpu = <&i2s0_8ch>;
//指定codec端那个dai接口
rockchip,codec = <&es8388>;
rockchip,audio-routing =
"Headphone", "LOUT1",
..............................
"RINPUT2", "Headset Mic";
};
rockchip_multicodecs.c:
static int rk_multicodecs_probe(struct platform_device *pdev)
{
   struct snd_soc_card *card;
   struct device_node *np = pdev->dev.of_node;
   struct snd_soc_dai_link *link;//该结构体用于绑定platform,codec。
  /*一个声卡包含下面三个comment。
   */
   struct snd_soc_dai_link_component *cpus;
   struct snd_soc_dai_link_component *platforms;
   struct snd_soc_dai_link_component *codecs;
   link = &mc_data->dai_link;
   link->name = "dailink-multicodecs";
   link->stream_name = link->name;
   link->init = rk_dailink_init;
   link->ops = &rk_ops; // snd_soc_ops
   link->cpus = cpus;
   link->platforms = platforms;
   link->num_cpus  = 1;
   link->num_platforms = 1;
   link->ignore_pmdown_time = 1;
   card->dai_link = link; //填充
   card->num_links = 1;
  codecs = devm_kcalloc(&pdev->dev, idx,
          sizeof(*codecs), GFP_KERNEL);
   link->codecs = codecs;
   link->num_codecs = idx;
  idx = 0;
   for (i = 0; i < count; i++) {
     // dts : rockchip,codec = <&es8388>;
    node = of_parse_phandle(np, "rockchip,codec", i);
     if (!node)
       return -ENODEV;
     if (!of_device_is_available(node))
       continue;
    ret = of_parse_phandle_with_fixed_args(np, "rockchip,codec",
                0, i, &args);
     if (ret)
       return ret;
     codecs[idx].of_node = node;
    ret = snd_soc_get_dai_name(&args, &codecs[idx].dai_name);
     if (ret)
       return ret;
    idx++;
  }
   // dts: rockchip,cpu = <&i2s0_8ch>;
   link->cpus->of_node = of_parse_phandle(np, "rockchip,cpu", 0);
   link->platforms->of_node = link->cpus->of_node;
  ret = snd_soc_of_parse_audio_routing(card, "rockchip,audio-routing");
   //注册声卡
  ret = devm_snd_soc_register_card(&pdev->dev, card);
}

到此一个声卡就注册成功了,在用户空间可以看到:

console:/storage/emulated/0 # cat /proc/asound/cards
 0 [rockchipes8388 ]: rockchip-es8388 - rockchip-es8388
                      rockchip-es8388
2.3 详细声卡驱动注册UML流程图:
2.4 RK 额外提供的Combo DAI :

RK 平台支持任意 DAI 的组合使用,重组 DAI 生成 Combo DAI,如下图所示:

示例:将 i2s_8ch_2 和 pdm_8ch 组合成 Combo DAI ,这样用户层看到的是一个声卡节点可以同时读写多个i2s,pdm的数据,避免驱动和进程调度导致的动态延时差。

&i2s_8ch_2 { 
     status = "okay"; 
     rockchip,no-dmaengine; 
 }; 
 &pdm_8ch { 
     status = "okay"; 
     rockchip,no-dmaengine; 
 }; 
     &multi-dais { 
     dais = <&i2s_8ch_2>, <&pdm_8ch>; 
 }; 

三、音频常用协议

3.1 PDM协议(切记虽然叫数字麦克风但是tx发送0x55,rx接收到的并不是0x55)

PDM(Pulse Density Modulation)是一种用数字信号表示模拟信号的调制方法,脉冲的相对密度对应于模拟信号的振幅。同为将模拟量转换为数字量的方法,PCM使用等间隔采样方法,将每次采样的模拟分量幅度表示为N位的数字分量(N = 量化深度),因此PCM方式每次采样的结果都是N bit字长的数据。PDM则使用远高于PCM采样率的时钟采样调制模拟分量,只有1位输出,要么为0,要么为1。因此通过PDM方式表示的数字音频也被称为Oversampled 1-bit Audio。相比PDM一连串的0和1,PCM的量化结果更为直观简单。

在以PDM方式作为模数转换方法的应用接收端,需要用到抽取滤波器(Decimation Filter)将密密麻麻的0和1代表的密度分量转换为幅值分量,而PCM方式得到的就已经是幅值相关的数字分量。如下图所示意为通过PDM方式数字化的正弦波。

红色是模拟信号的正玄波,蓝色柱条代表1,白色代表0。可以看到正玄波的peaks蓝色密度最大也就是1最多代表模拟信号幅度最大。正玄波的troughs蓝色最少表示幅度最小。

PCM方式的逻辑更加简单,但需要用到数据时钟,采样时钟和数据信号三根信号线;PDM方式的逻辑相对复杂,但它只需要两根信号线,即时钟和数据。通过PDM接口方式,传输双声道数据只要用到两根信号线。如下图示为Maxim的Class-D类型功放MAX98358对PDM接口时序的要求,可以看到它在PDM_CLK的上升沿采样左声道数据,在PDM_CLK下降沿采样右声道数据。

PDM MIC sph0690lm4h-1 时序:

3.2 TDM协议

时分复用技术(time-division multiplexing, TDM)是将不同的信号相互交织在不同的时间段内,沿着同一个信道传输;在接收端再用某种方法,将各个时间段内的信号提取出来还原成原始信号的通信技术。TDM是在时间上将信道划分在不同的时隙,在不同的时隙上间插不同的脉冲信号,依次来实现时域上多路信号的复用。假设每个输入的数据比特率是9. 6kbit / s ,线路的最大比特率为76. 8 kbit / s ,则可传输8 路信号。这种技术可以在同一个信道上传输多路信号。在音频领域常用于传输多通道pcm数据。

典型TDM格式时序图:

一般SOC端每个IP有4跟线,可以配置成I2S,PCM,TDM格式,具体时序查看datasheet为准。

时钟(BCLK)频率的计算:

FSYNC/LRCK的频率等于音频的采样率(例如44.1 kHz,48 kHz等)。Frame每次传输包括所有声道的数据。PCM采样音频数据量化深度一般在16-32bit(最常见为16/24bit)。那么对于8声道,每个声道32bit音频数据,采样率48kHz的系统,TDM的系统时钟速率为:8 × 32 × 48kHz = 12.288 MHz,在一些Datasheet中可以见到TDM128/TDM256/TDM384/TDM512等,数字的含义为单个TDM数据帧包含数据的比特数(即帧长)。如上例8声道(Channels)32bit的音频数据,亦称为TDM256(=8*32)。TDM系统时钟速率就可以简单地用采样率乘以TDM帧长计算得出。相同的例子,TDM系统时钟速率:48kHz × 256 = 12.288 MHz。

3.3 PCM协议

PCM (Pulse Code Modulation) 脉冲编码调制是将模拟信号数字化的方法。原理是用一个固定的频率对模拟信号进行采样,采样后的信号在波形上看就像一串连续的幅值不一的脉冲(脉搏似的短暂起伏的电冲击),把这些脉冲的幅值按一定精度进行量化,这些量化后的数值被连续的输出、传输、处理或记录到存储介质中,所有这些组成了数字音频的产生过程(抽样、量化、编码三个过程)。下图为4 bit 采样深度的PCM数据量化示意图。

典型PCM格式时序图:

PCM格式分为长短帧,MODE A, MODE B格式,具体情况看相应datasheet手册。

长帧同步,FSYNC脉冲宽度等于1个Slot的长度。

短帧同步,FSYNC脉冲宽度等于1个BCLK周期长度。

Mode A: 数据在FSYNC有效后,BCLK的第2个上升沿有效(one clock delay)。

Mode B: 数据在FSYNC有效后,BCLK的第1个上升沿有效(no delay)。

3.3 I2S协议

I2S格式是pcm的特例,平时用的最多,用于传输两声道场景。

典型I2S格式时序图:

3.3 总结:

PCM音频接口传输单声道数据常用于通话场景其接口名称为PCM,如蓝牙模块通话时一般都是pcm接口,A2DP音频编码数据则是走串口。

常规产品一般只需要双声道则使用I2S接口。

对于需要多声道的产品则使用TDM传输多声道的数据。

PDM常用于数字麦(DM),也有用于播放的。

很多芯片带的"i2s"数字音频接口可以支持配置成pcm,i2s,tdm三种格式中的一种用的是同样的物理引脚。

对于一些高级的codec/dsp 一般都会有配套上位机和调试板,上位机有ui图形化配置很方便,调试的时候在soc端注册声卡成功后,把codec的i2c接口连接到调试板上,然后在上位机进行调试,这样可以避免频繁修改驱动代码编译烧录带来的时间消耗,也不用太过关注datasheet。对于没有上位机的codec,可以在shell命令用i2c-tool工具直接读写修改codec寄存器进行调试。

四、常见问题及调试手段

4.1 播放、录音声音不正常

确定SOC和Codec驱动设置的音频参数如,位宽,采样率,声道数,左右对齐,长短帧,AB格式等是否设置的一致,查看Soc和Codec的datasheet时序图。

使用逻辑分析仪抓数据:

对于播放:应用程序可以固定写0x1234,0x4567等,用逻辑分析仪抓数据设置对应格式进行解析看看数据是否一致。

对于录音:逻辑分析仪抓数据后设置对应格式解析数据后导出数据到电脑转成bin文件在电脑播放,

同时应用程序录音文件拷贝到电脑进行播放,对比。排除是codec还是soc端问题。

4.2 播放、录音断续卡顿

查看cpu loading,应用程序是否及时收发数据(如APP有其它耗时阻塞操作),驱动是否发生XRUN,等异常。优化应用程序,调整进程/线程优先级,调整period_size,period_count值。

示波器抓波形是否有干扰毛刺。

查看I2S,和DMA相关寄存器,Req,Ack是否配对一样,确定芯片内部相关模块是否发生异常XRUN。

4.3 播放、录音有杂音

引起杂音的问题很多,如下列举常用定位方法:

使用逻辑分析仪和示波器,先确定是硬件问题(模拟电路)还是软件问题(数字电路)。

确认时钟信号是否准确,检查 jitter 是否过大,比如,对于 HDA 音频, jitter 小于 0.5 ns。

确认时钟上是否有毛刺,特别是在边沿有效值判定范围电压内,如果出现毛刺,会被芯片识别为时 钟,导致时序出现问题。

确认 CODEC 电源和地 情况,CODEC 对电源噪声敏感,任何耦合进电源或地的噪声都将导致 CODEC性能下降,底噪增大,出现杂音。

硬件采用差分电路 抑制共模噪声。 检查硬件 PCB 布局,排查噪声来源。

4.4 播放、录音无声

逻辑分析仪抓波形是否正常,确定是否有数据。

检查功放,mic是否损坏。示波器检查codec是否有模拟信号输出。用信号发生器代替mic,或更换mic测试。

通过在软件各层dump数据确定问题在哪一层,如Android12就有权限管理导致应用程序录音无声问题。

直接使用tinyplay,tinycap,tinymix等调试工具验证。排除hal,framework,app问题。

查看驱动是否有出错日志,DMA是否正常产生中断,查看DAI(I2S PDM)相关状态寄存器是否异常。

4.5 播放POP音

检查音频链路上电时序。

Mute unmute机制是否合理。

pcm数据是否有突变,软件是否做了fade in,fade out,codec/dsp是否有硬件相关功能参数可以设置。

4.6 Codec常见初始化问题

i2c初始化失败,检查原理图,地址是否设置对了,datasheet上电时序要求,尝试降低i2c速率。

某些功能设置后不生效,可以dump寄存器看看是否和代码写入的一致,配置每个寄存器后加入一定延时。

相关推荐
郁大锤6 天前
linux alsa-lib snd_pcm_open函数源码分析(一)
linux·驱动开发·嵌入式硬件·音频·pcm·视频编解码
sdkdlwk6 天前
查看多个通道32bit音频pcm数据
音视频·pcm
帅气好男人_Jack7 天前
利用Matlab工具生成滤波器
算法·pcm
易板11 天前
PCM5102A具有PLL和32位、384kHz PCM/I2S接口的2.1VRMS、112dB音频立体声DAC
音频·pcm·dac·i2s·1024程序员节
ywang_wnlo18 天前
【Kenel】基于 QEMU 的 Linux 内核编译和安装
linux·qemu·kernel
ywang_wnlo21 天前
【Kernel】基于 QEMU 的 Linux 内核编译和安装
linux·qemu·kernel
韩zj1 个月前
android 蓝牙语音转换成pcm文件,进行播放暂停停止操作
android·蓝牙·pcm
organic1 个月前
linux内核调试痛点之函数参数抓捕记
linux·debug·kernel
DevinLGT1 个月前
音频编码:PCM【无损音频】
嵌入式硬件·音视频·pcm
懮 俍1 个月前
前端请求音频返回pcm流进行播放
前端·vue.js·音视频·pcm