teecd 崩溃分析
根本原因
两个层面的问题:
- 初始崩溃(pid 239,运行 ~3.8 秒后退出)
main() 的执行流程:
-
TcuAuthentication() --- 打开 /dev/tc_private,执行 ioctl(TC_NS_CLIENT_IOCTL_SET_NATIVE_IDENTITY),此 ioctl 会阻塞等待 TEE OS 就绪,耗时约 3.8 秒
-
ProcessAgentInit() --- 尝试注册 FS/MISC/SECLOAD 三个 agent,失败,返回 -1
-
main() 返回 -1,即 exit code 255
ProcessAgentInit 失败的原因在 tee_agent.c:60-73:
int fd = tee_open(TC_PRIVATE_DEV_NAME, O_RDWR, 0); // 打开 /dev/tc_private
ret = ioctl(fd, TC_NS_CLIENT_IOCTL_REGISTER_AGENT, &args); // 注册 agent
if (ret) {
return -1; // ioctl 失败 -> 返回 -1
}
- 后续崩溃循环(pid 504/529/530/655/2518...)
agent_manager.c:320-322:
if (find_agent(agent_id)) {
tloge("agent whose id = 0x%x has been registered\n", agent_id);
goto fail0; // -> return TEE_ERROR_GENERIC
}
TEE OS 中的 agent 注册是持久的,且系统 agent(FS/MISC/SECLOAD)不允许注销(agent_manager.c:355-357):
if (is_system_agent(agent_id)) {
tloge("system agents not allowed to unregister\n");
return TEE_ERROR_GENERIC;
}
一旦 teecd 崩溃,TEE OS 侧的 agent 注册记录不会清除,后续所有重启都会因"agent already registered"而立即失败。
崩溃链路
teecd(239) 启动
-> TcuAuthentication() 阻塞 ~3.8s (等待 TEE OS 就绪)
-> ProcessAgentInit() 失败 (ioctl REGISTER_AGENT 返回错误)
-> main() 返回 -1 (exit 255)
teecd(504) 重启
-> ProcessAgentInit() 立即失败 (agent already registered in TEE OS)
-> exit 255 (0.27s)
teecd(529/530/...) 继续崩溃循环
需要排查的方向
问题1:为什么 pid 239 的 REGISTER_AGENT ioctl 失败?
可能原因:
-
TEE OS 尚未完全初始化(mailbox 未就绪,in_mailbox_range() 检查失败)
-
/dev/tc_private 的 tzdriver 内核模块未加载或初始化失败
-
需要查看 tzdriver 内核日志(dmesg 中的 TEE 相关错误)
问题2:TEE OS 侧 agent 重注册机制缺失
register_agent() 在 agent 已存在时直接失败,没有更新 buffer 地址的路径。修复方向是在 agent_manager.c:320 处,当 agent 已注册时,更新其 phys_buffer 和 size 而不是返回错误:
// 当前代码(agent_manager.c:319-323)
if (find_agent(agent_id)) {
tloge("agent whose id = 0x%x has been registered\n", agent_id);
goto fail0;
}
可以改为允许系统 agent 重新注册(更新 buffer 地址),以支持 teecd 崩溃重启场景。
建议下一步: 查看设备的 dmesg 内核日志,找到 teecd 首次启动时 tzdriver 侧的错误信息,确认 REGISTER_AGENT ioctl 失败的具体原因。