高通ais over hab高概率导致安卓系统起不来原因分析及解决方案

一)ais概述

  1. 高通8155的摄像头驱动在hostOS qnx上,guestOS 安卓要使用摄像头,就需要就需要通过hab机制与qnx通信。
  2. Ais框架如下

二)ais的控制通道与数据通道

a)控制通道即,front end需要将start/stop摄像头的控制命令发送给back end。数据通道即,back end将摄像头数据存放的地方,这个地方同样需要俩端可以访问。控制通道的共享内存是在固定的一块内存上面(hab的physical channel)。但是数据通道却不是。

b)ais的数据通道的建立。安卓端会从ion申请dma_buf(一个buf存放一帧数据),然后会将dma_buf的物理页帧号告知qnx,然后qnx端就可以将摄像头数据放到这块内存上,再通过控制道通通知安卓端。数据通道建立源码如下:

整个调用过程如下:

one)hab_mem_export------》habmem_hyp_grant_user-》habmem_add_export_compress-》habmem_compress_pfns

two)hab_mem_export------》habmem_export_vchan

调用到了驱动代码




上图exp是一个结构体struct export_desc。定义如下图:

habmem_compress_pfns函数会将dma_buf的物理pfn写到exp上.然后继续调用static int habmem_export_vchan(struct uhab_context *ctx,

struct virtual_channel *vchan,

int payload_size,

uint32_t flags,

uint32_t export_id)函数走控制通道把exp发送到到qnx端。

三)那么ais client进程异常crash为什么会导致安卓系统起不来。

原因在于ais的数据通道内存是安卓分配, client进程crash后,释放流程很大概率会先释放数据通道,再释放控制通道。如果数据通道释放后,这块内存又被分配给内核其他模块使用,但此时控制通道还没有释放,即qnx不知道数据通道释放了,他还往上面填充摄像头数据,导致安卓kernel panic。然后安卓重启后,qnx又不断再写数据通道,而数据通道的内存在安卓重启后又可能被分配给内核使用。导致安卓系统一直起不来。

  1. 解决方案
    1. 修改内核代码,先释放控制通道,再释放数据通道,比较复杂
    2. 搞一个稳定的ais client hal服务进程。再暴露接口给app使用。
  2. 安卓端硬解码hal服务,也是走hab机制使用qnx提供的硬编解码服务,为什么它不会导致安卓系统crash?

原因是它的数据通道内存是由qnx分配。如下图代码截图:

3.数据通道建立的俩个重要应用层接口注释如下:

相关推荐
张风捷特烈27 分钟前
Flutter 知识集锦 | 获取函数调用栈
android·flutter·dart
故事与他6456 小时前
Thinkphp(TP)框架漏洞攻略
android·服务器·网络·中间件·tomcat
每次的天空9 小时前
项目总结:GetX + Kotlin 协程实现跨端音乐播放实时同步
android·开发语言·kotlin
m0_7482331711 小时前
SQL之delete、truncate和drop区别
android·数据库·sql
CYRUS_STUDIO12 小时前
OLLVM 增加 C&C++ 字符串加密功能
android·c++·安全
帅次13 小时前
Flutter 输入组件 Radio 详解
android·flutter·ios·kotlin·android studio
&有梦想的咸鱼&14 小时前
Android Compose 框架的状态与 ViewModel 的协同(collectAsState)深入剖析(二十一)
android
开开心心就好15 小时前
高效PDF翻译解决方案:多引擎支持+格式零丢失
android·java·网络协议·tcp/ip·macos·智能手机·pdf
路上阡陌16 小时前
docker 安装部署 canal
android·adb·docker
&有梦想的咸鱼&16 小时前
入剖析 Android Compose 框架的关键帧动画(keyframes、Animatable)(二十三)
android