OpenHarmony teecd频繁崩溃问题分析

teecd 崩溃分析

根本原因

两个层面的问题:

  1. 初始崩溃(pid 239,运行 ~3.8 秒后退出)

main() 的执行流程:

  1. TcuAuthentication() --- 打开 /dev/tc_private,执行 ioctl(TC_NS_CLIENT_IOCTL_SET_NATIVE_IDENTITY),此 ioctl 会阻塞等待 TEE OS 就绪,耗时约 3.8 秒

  2. ProcessAgentInit() --- 尝试注册 FS/MISC/SECLOAD 三个 agent,失败,返回 -1

  3. main() 返回 -1,即 exit code 255

ProcessAgentInit 失败的原因在 tee_agent.c:60-73:

int fd = tee_open(TC_PRIVATE_DEV_NAME, O_RDWR, 0); // 打开 /dev/tc_private

ret = ioctl(fd, TC_NS_CLIENT_IOCTL_REGISTER_AGENT, &args); // 注册 agent

if (ret) {

return -1; // ioctl 失败 -> 返回 -1

}

  1. 后续崩溃循环(pid 504/529/530/655/2518...)

agent_manager.c:320-322:

if (find_agent(agent_id)) {

tloge("agent whose id = 0x%x has been registered\n", agent_id);

goto fail0; // -> return TEE_ERROR_GENERIC

}

TEE OS 中的 agent 注册是持久的,且系统 agent(FS/MISC/SECLOAD)不允许注销(agent_manager.c:355-357):

if (is_system_agent(agent_id)) {

tloge("system agents not allowed to unregister\n");

return TEE_ERROR_GENERIC;

}

一旦 teecd 崩溃,TEE OS 侧的 agent 注册记录不会清除,后续所有重启都会因"agent already registered"而立即失败。


崩溃链路

teecd(239) 启动

-> TcuAuthentication() 阻塞 ~3.8s (等待 TEE OS 就绪)

-> ProcessAgentInit() 失败 (ioctl REGISTER_AGENT 返回错误)

-> main() 返回 -1 (exit 255)

teecd(504) 重启

-> ProcessAgentInit() 立即失败 (agent already registered in TEE OS)

-> exit 255 (0.27s)

teecd(529/530/...) 继续崩溃循环


需要排查的方向

问题1:为什么 pid 239 的 REGISTER_AGENT ioctl 失败?

可能原因:

  • TEE OS 尚未完全初始化(mailbox 未就绪,in_mailbox_range() 检查失败)

  • /dev/tc_private 的 tzdriver 内核模块未加载或初始化失败

  • 需要查看 tzdriver 内核日志(dmesg 中的 TEE 相关错误)

问题2:TEE OS 侧 agent 重注册机制缺失

register_agent() 在 agent 已存在时直接失败,没有更新 buffer 地址的路径。修复方向是在 agent_manager.c:320 处,当 agent 已注册时,更新其 phys_buffer 和 size 而不是返回错误:

// 当前代码(agent_manager.c:319-323)

if (find_agent(agent_id)) {

tloge("agent whose id = 0x%x has been registered\n", agent_id);

goto fail0;

}

可以改为允许系统 agent 重新注册(更新 buffer 地址),以支持 teecd 崩溃重启场景。

建议下一步: 查看设备的 dmesg 内核日志,找到 teecd 首次启动时 tzdriver 侧的错误信息,确认 REGISTER_AGENT ioctl 失败的具体原因。

相关推荐
Harvy_没救了2 小时前
【Linux】Nginx - 反向代理
linux·运维·nginx
代码中介商2 小时前
Linux 静态库与共享库完全指南:从制作到使用
linux·运维·服务器
"小夜猫&小懒虫&小财迷"的男人2 小时前
【Linux v7.0 以太网驱动+协议栈】000 - 文章链接汇总
linux·网络
铭keny2 小时前
【Ubuntu部署】人脸特征提取SDK完整部署教程(含Nginx代理+问题排查)
linux·nginx·ubuntu
YIN_尹3 小时前
【Linux系统编程】进程控制(一)
linux·运维·服务器
buhuimaren_3 小时前
GFS分布式文件系统
linux
南村群童欺我老无力.3 小时前
鸿蒙 - TextInput高度设置的边界行为
华为·harmonyos
不做无法实现的梦~3 小时前
显示屏和显卡驱动问题完整解决教程---ubuntu22.04安装显卡驱动解决显示屏黑屏幕问题
linux·学习
.柒宇.3 小时前
共享文件服务NFS服务器:NFS实战详解
linux·运维·服务器