使用CodeQL检测C++迭代器失效问题

使用CodeQL检测迭代器失效问题

迭代器失效是C++中常见且隐蔽的一类错误,经常导致可利用漏洞。在Trail of Bits实习期间,我开发了Itergator------一组用于分析和发现迭代器失效的CodeQL类和查询。

迭代器基础

迭代器是C++中遍历容器内容的标准方式。迭代器对象至少支持两种操作:解引用(获取容器中的底层对象)和递增(获取下一个元素的迭代器)。

cpp 复制代码
std::vector<int> vec{1, 2, 3, 4, 5};
for (std::vector<int>::iterator it = vec.begin(); it != vec.end(); ++it) {
    std::cout << *it << " ";
}

迭代器失效问题

当容器发生修改(如添加或删除元素)后,迭代器会失效。使用失效迭代器会导致未定义行为。例如:

cpp 复制代码
void zone_manager::deserialize(JsonIn &jsin) {
    jsin.read(zones);
    for(auto it = zones.begin(); it != zones.end(); ++it) {
        if(!has_type(it->get_type())) {
            zones.erase(it);  // 迭代器在此失效
        }
    }
}

CodeQL解决方案

CodeQL是GitHub开发的静态分析框架,使用类SQL语法查询代码库。Itergator包含查询和库,允许审计人员在自己的查询中使用Itergator的类:

  • Iterator:存储迭代器的变量
  • Iterated:被迭代的集合
  • Invalidator:可能导致迭代器失效的函数调用
  • Invalidation:直接使迭代器失效的函数调用

检测挑战与解决方案

检测迭代器失效面临多个挑战:

  1. 失效可能嵌套在多层函数调用中
  2. 迭代器可能在循环外声明和失效
  3. 需要支持自定义可迭代类型

通过CodeQL的全局数据流库和递归支持,Itergator能够构建潜在失效函数调用图。对于非标准迭代类型,只需扩展PotentialInvalidation抽象类。

实际案例

Itergator发现了多个现实项目中的bug,包括:

  1. Cataclysm游戏中的简单失效案例
  2. Google正则表达式库中的复杂三层循环失效
  3. LLVM链接器中12层函数调用深的失效

结论

Itergator是检测复杂迭代器失效问题的强大工具。尽管存在一些误报,但通过自动过滤和"重要性"值设置,结果审查变得非常高效。CodeQL的声明式查询语言使得静态分析易于上手。

"Trail of Bits是我工作过的最好的地方!" ------ Kevin Higgs

相关推荐
大写-凌祁20 小时前
零基础入门深度学习:从理论到实战,GitHub+开源资源全指南(2025最新版)
人工智能·深度学习·开源·github
焦耳加热20 小时前
阿德莱德大学Nat. Commun.:盐模板策略实现废弃塑料到单原子催化剂的高值转化,推动环境与能源催化应用
人工智能·算法·机器学习·能源·材料工程
深空数字孪生20 小时前
储能调峰新实践:智慧能源平台如何保障风电消纳与电网稳定?
大数据·人工智能·物联网
wan5555cn20 小时前
多张图片生成视频模型技术深度解析
人工智能·笔记·深度学习·算法·音视频
格林威21 小时前
机器视觉检测的光源基础知识及光源选型
人工智能·深度学习·数码相机·yolo·计算机视觉·视觉检测
今天也要学习吖1 天前
谷歌nano banana官方Prompt模板发布,解锁六大图像生成风格
人工智能·学习·ai·prompt·nano banana·谷歌ai
Hello123网站1 天前
glean-企业级AI搜索和知识发现平台
人工智能·产品运营·ai工具
AKAMAI1 天前
Queue-it 为数十亿用户增强在线体验
人工智能·云原生·云计算
索迪迈科技1 天前
INDEMIND亮相2025科技创变者大会,以机器人空间智能技术解锁具身智能新边界
人工智能·机器人·扫地机器人·空间智能·陪伴机器人
栒U1 天前
一文从零部署vLLM+qwen0.5b(mac本地版,不可以实操GPU单元)
人工智能·macos·vllm