问题排查:C++ exception with description “getrandom“ thrown in the test body

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

本作品 (李兆龙 博文, 由 李兆龙 创作),由 李兆龙 确认,转载请注明版权。

文章目录

Motivation

最近在做一个复杂系统集成到 Bazel 的工作。

在编译链接通过后为了能后确保外部系统的每个编译单元都没有动态链接的问题,需要多写一些测试代码,把这些代码都执行到。

在执行其中一个测试时,在众多的错误中报出了一个没有明确指向原因的错误:

unknown file: Failure

C++ exception with description "getrandom" thrown in the test body.

问题是代码中并没有直接调用到getrandom系统调用,其次也不知道为什么会报错。

Process

首先执行如下代码,开始gdb单元测试:

  1. bazel build --compilation_mode=dbg --test_timeout=60 xxxx/xxxxx/xxxxxx:test_xxx
  2. gdb xxxx/xxxxx/xxxxxx/test_xxx

从不多的错误信息可以看出时抛异常了,在GDB中执行如下指令拿到异常栈帧:

  1. catch throw
  2. r
  3. bt

这里可以看到原来是在boost库抛异常了,对应的boost库代码如下:

cpp 复制代码
class random_provider_base
{
public:
    //! Obtain entropy and place it into a memory location
    //! \param[in]  buf  the location to write entropy
    //! \param[in]  siz  the number of bytes to acquire
    void get_random_bytes(void *buf, std::size_t siz)
    {
        std::size_t offset = 0;
        while (offset < siz)
        {
            ssize_t sz = get_random(static_cast< char* >(buf) + offset, siz - offset, 0u);

            if (BOOST_UNLIKELY(sz < 0))
            {
                int err = errno;
                if (err == EINTR)
                    continue;
                BOOST_THROW_EXCEPTION(entropy_error(err, "getrandom"));
            }

            offset += sz;
        }
    }

private:
    static ssize_t get_random(void *buf, std::size_t size, unsigned int flags)
    {
#if defined(BOOST_UUID_RANDOM_PROVIDER_GETRANDOM_IMPL_GETRANDOM)
        return BOOST_UUID_RANDOM_PROVIDER_GETRANDOM_IMPL_GETRANDOM(buf, size, flags);
#elif defined(BOOST_UUID_RANDOM_PROVIDER_GETRANDOM_HAS_LIBC_WRAPPER)
        return ::getrandom(buf, size, flags);
#else
        return ::syscall(SYS_getrandom, buf, size, flags);
#endif
    }
};

我这个时候其实并不敏感。

从现有信息看已经基本确定是getrandom的问题了。

从[1]可以看到 getrandom 是在glibc 2.25 支持的

执行ldd --version发现我的glibc版本是2.28,原则上是支持的。

写个demo:

cpp 复制代码
#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <sys/random.h>
#include <unistd.h>

int main() {
    size_t num_bytes = 16;
    unsigned char buffer[16];

    ssize_t result = getrandom(buffer, num_bytes, 0);
    
    if (result == -1) {
        perror("getrandom failed");
        std::cerr << errno << " :" <<  std::strerror(err) << std::endl;
        return EXIT_FAILURE;
    }

    printf("Random bytes: ");
    for (size_t i = 0; i < num_bytes; i++) {
        printf("%02x ", buffer[i]);
    }
    printf("\n");

    return EXIT_SUCCESS;
}

执行起来果然报错,输出为:

执行ldd a.out看看动态库依赖

此时怀疑glibc.so有问题,或者内核版本有问题

执行rpm -qf /lib64/libc.so.6 ,是RHEL的官方包,那基本有问题的概率不大。

执行nm libc.so.6 |c++filt|grep random

确实看到了glibcgetrandom符号,Text Section,且是有效的

执行strace -ff -o strace.log ./a.out,检查下可执行文件调用了哪些系统调用,确定是glibc的问题还是内核的问题。

原来原始的报错信息是Function not implemented,经过了几层异常后已经看不出来原始报错了,重新看了一遍文档getrandom系统调用3.17才支持,我的开发机只有3.10,是使用docker构造编译环境的。

docker只是经过Namespaces隔离,Cgroups隔离,Security隔离的特殊进程,和宿主机共享内核,自然系统调用就失败了。

所以确定就是内核版本问题。

参考:

  1. man getrandom
相关推荐
WSSWWWSSW4 小时前
Numpy科学计算与数据分析:Numpy文件操作入门之数组数据的读取和保存
开发语言·python·数据挖掘·数据分析·numpy
芥子须弥Office4 小时前
从C++0基础到C++入门 (第二十五节:指针【所占内存空间】)
c语言·开发语言·c++·笔记
啊阿狸不会拉杆4 小时前
《算法导论》第 14 章 - 数据结构的扩张
数据结构·c++·算法·排序算法
Q741_1475 小时前
如何判断一个数是 2 的幂 / 3 的幂 / 4 的幂 / n 的幂 位运算 总结和思考 每日一题 C++的题解与思路
开发语言·c++·算法·leetcode·位运算·总结思考
半瓶啤酒一醉方休6 小时前
C# 查询电脑已安装所有软件并打印txt保存到桌面
开发语言·c#
钢铁男儿6 小时前
深入解析C#并行编程:从并行循环到异步编程模式
开发语言·c#
小杜的生信筆記7 小时前
基于R语言,“上百种机器学习模型”学习教程 | Mime包
开发语言·学习·机器学习·r语言·sci
源代码•宸7 小时前
C++高频知识点(十八)
开发语言·c++·经验分享·多线程·互斥锁·三次握手·字节对齐
mit6.8247 小时前
修复C++14兼容性问题& 逻辑检查
开发语言·c++
沐知全栈开发8 小时前
MongoDB 高级索引
开发语言