【开发日常】insmod: error inserting ‘*.ko‘: -1 Unknown symbol in module原理分析

问题的起源是一次面试,面试官询问加载内核的时候,如果insmod失败,且提示Unknown symbol in module。请问我里面的原理是什么呢?为什么内核知道当前缺少的是这个symbol?

想了解下具体的原因。


首先是模拟一个环境。

写一个module模块,里面调用了其他模块的符号表。同时给予函数声明。在编译的阶段,不会报错,但是在加载KO的时候,报错了。提示"Unknown symbol in module"


原因和内核符号表有关。

linux2.6开始的"/prob/kallsyms"文件对应着内核符号表,记录了符号以及符号所在的内存地址。

内核符号表:记录了内核中所有的符号(函数、全局变量等)的地址以及名字,这个符号表被嵌入到内核镜像中,使得内核可以在运行过程中随时获得一个符号地址对应的符号名

在Linux内核中,驱动程序和内核的其他部分之间是通过叫做symbol(符号)的接口来通信的,一个symbol可以是一个函数、一个全局变量或其他对象等等。默认情况下,这些symbol只能在内核中使用,因此,它们不会被其他程序访问。如果想要将symbol导出给外部模块使用,可以使用EXPORT_SYMBOL和EXPORT_SYMBOL_GPL宏来实现。

模块可以使用如下宏导出符号到内核符号表:

EXPORT_SYMBOL(符号名);  
EXPORT_SYMBOL_GPL(符号名)  

导出的符号可以被其他模块使用,不过使用之前一定要声明一下。

EXPORT_SYMBOL和EXPORT_SYMBOL_GPL的区别在于,EXPORT_SYMBOL_GPL只导出给使用了GPL或可以互操作的许可证的模块使用。由于这些许可证限制了使用这些符号的模块的范围,因此EXPORT_SYMBOL_GPL被认为比EXPORT_SYMBOL更加安全。

代码演示:

//hello.c文件,定义2个函数,用于导出  
#include <<a href="http://lib.csdn.net/base/linux" class='replace_word' title="Linux知识库" target='_blank' style='color:#df3434; font-weight:bold;'>Linux</a>/init.h>  
#include <linux/module.h>  
MODULE_LICENSE("Dual BSD/GPL");  
int add_integar(int a,int b)  
{  
    return a + b;  
}  
int sub_integar(int a,int b)  
{  
    return a - b;  
}  
EXPORT_SYMBOL(add_integar);  
EXPORT_SYMBOL(sub_integar);  
//test.c 用于调用hello模块导出的函数  
#include <linux/init.h>  
#include <linux/module.h>  
MODULE_LICENSE("Dual BSD/GPL");  
extern int add_integar(int ,int); //声明要调用的函数  
extern int sub_integar(int ,int); //声明要调用的函数  
int result(void)  
{  
    int a,b;  
    a = add_integar(1,1);  
    b = sub_integar(1,1);  
      
    printk("%d/n",a);  
    printk("%d/n",b);  
      
    return 0;  
}  

make后,先加在hello模块,再加载test模块。

然后cat /proc/kallsyms | grep integer

显示:

[root@localhost test]# cat /proc/kallsyms |grep integar  
e053d000 u add_integar  [test]  
e053d004 u sub_integar  [test]  
e053d02c r __ksymtab_sub_integar        [hello]  
e053d03c r __kstrtab_sub_integar        [hello]  
e053d034 r __ksymtab_add_integar        [hello]  
e053d048 r __kstrtab_add_integar        [hello]  
e053d000 T add_integar  [hello]  
e053d004 T sub_integar  [hello]  

再深入了解,什么是内核符号表?

一、什么是符号(Symbols)?

什么是Symbol? 其实就是kernel中的变量(Variable Name)或函数名称(Function Name)

这样可以方便程序员在写程序时可以直接参照这一份Symbol的索引文件,找到所需要的kernel信息,这一份Symbol的索引文件又称为kernel symbol table。

二、内核符号表(Kernel Symbol Table)?

定义

内核符号表,就是在内核的内部函数或变量中,可供外部引用的函数和变量的符号表。

其实说白了就是一个索引文件,它存在的目的就是让外部软件可以知道kernel文件内部实际分配的位置。

所在文件

编译内核时,System.map文件用于存放内核符号表信息。

(System.map文件位于/或者/boot、/usr/src/linux/下)

文件的生成

符号表是所有内核符号及其对应地址的一个列表,随着每次内核的编译,就会产生一个新的对应System.map文件,当内核运行出错时,通过System.map中的符号表解析,就可以查到一个地址值对应的变量名。System.map文件记录了所有代码的运行地址(所有函数和变量)。

内核并不使用符号名。它是通过变量或函数的地址(指针)来使用变量或函数的。其实内核连System.map文件都不使用,只是生成用于调试用的。

system.map文件的格式

线性地址 类型 符号
ffffffff81002590 t create_dev
ffffffff81009c00 T show_regs

其中,类型 若是小写字母则表示局部引用, 若是大写字母则表示全局引用(外部)。

内核符号表的存在意义

1)把内核的符号地址,转化为程序猿可以看懂的符号名称

内核符号表就是为程序员通过符号来访问程序体的对应地址(指针),建立了一个动态的,可变更的映射表格。

例如:

内核不会使用符号名create_dev,而会使用ffffffff81002590来引用这个变量。但程序猿们更喜欢符号名create_dev这样直观的名字。

所以就需要这么一个对应关系表。这个类似于网络里的DNS,没有谁愿意去记那没规律的IP地址,而记个网址就好记多了。

2)转换之后,就可以更方便的调试内核代码

对于系统的oop消息、或者通过gdb的调试消息,都需要根据该对照表,将内核熟悉的函数地址转化为用户熟悉的函数名称,便于用户进行故障定位、运行监控。

而内核本身并不真正使用System.map,而只是用于做调试用。

2.6)内核符号表存储位置

System.map

磁盘中真实存在的文件,存储内核中静态编译的函数和变量地址,每个新编译内核对应一个System.map文件,当klogd输出内核消息时,会通过/boot/System.map来将函数、变量地址转换为名称,方便用户理解。该文件对应不同的编译内核有对应的实现文件。

/proc/kallsyms

内核启动时候创建,供oops时定位错误,文件大小总为0,包含当前内核导出的、可供使用的变量或者函数;它只是内核数据的简单表示形式。

System.map 和 /proc/kallsyms 区别

二者相似点:

都是内核函数、变量的符号表,结构一致;对于可导出的内核变量、函数,其运行时在物理内存中的位置是一样的。

二者区别

两者侧重点不同,

System.map文件面向内核,对于内核中的没有导出的变量或者函数名,比如kthread_create_list链表头指针,也有其相应的内核地址,该文件一般是只读的、固定大小的,没有动态添加模块中的变量、函数名;

而kallsyms在内核启动过程中创建,并实时更新,反映的是系统的当前最新情况,其内部也包含内核或者是已加载模块导出的函数、变量名称。

所以和System.map文件有差别,kallsyms文件动态变化,大小不固定。

总结就是:

System.map文件较单纯,是在用户一开始编译就产生的固定文件,不会因为任何原因更改,除非被换掉。

而/proc/kallsyms是一个在启动时由Linux kernel实时产生的文件,当系统有任何变更时,它就会马上做出修正。

因为这是动态的信息,当用户新增或删除一个module,都会自动做实时的修正(/proc下的都是这一类型的文件)

分类

Linux内核的符号表位于两个部分。

首先是内核的静态部分,也就是内核文件映像vmlinuz部分的符号表,对应于/proc/kallsyms和System.map这两个文件。

还有一部分则是Linux可配置模块部分的符号表。

形成过程

Linux内核符号表/proc/kallsyms的形成过程

./scripts/kallsyms.c负责生成System.map

./kernel/kallsyms.c负责生成/proc/kallsyms

./scripts/kallsyms.c解析vmlinux(.tmp_vmlinux)生成kallsyms.S(.tmp_kallsyms.S),然后内核编译过程中将kallsyms.S(内核符号表)编入内核镜像uImage 内核启动后./kernel/kallsyms.c解析uImage形成/proc/kallsyms

要在一个内核中启用 kallsyms 功能,必须用进行内核配置,make menuconfig设置 CONFIG_KALLSYMS 选项为y;如果你要在 kallsyms 中包含全部符号信息,必须设置 CONFIG_KALLSYMS_ALL 为y。

三、导出符号表

驱动程序中,如果该驱动程序中有被其他内核代码调用的部分,可以用EXPORT_SYMBOL导出到内核符号表中。

参考:

http://blog.csdn.net/lisan04/article/details/4076013

Linux内核:符号表详解 - 知乎 (zhihu.com)

相关推荐
海岛日记33 分钟前
centos一键卸载docker脚本
linux·docker·centos
AttackingLin1 小时前
2024强网杯--babyheap house of apple2解法
linux·开发语言·python
学Linux的语莫2 小时前
Ansible使用简介和基础使用
linux·运维·服务器·nginx·云计算·ansible
踏雪Vernon3 小时前
[OpenHarmony5.0][Docker][环境]OpenHarmony5.0 Docker编译环境镜像下载以及使用方式
linux·docker·容器·harmonyos
学Linux的语莫3 小时前
搭建服务器VPN,Linux客户端连接WireGuard,Windows客户端连接WireGuard
linux·运维·服务器
legend_jz3 小时前
【Linux】线程控制
linux·服务器·开发语言·c++·笔记·学习·学习方法
Komorebi.py3 小时前
【Linux】-学习笔记04
linux·笔记·学习
黑牛先生3 小时前
【Linux】进程-PCB
linux·运维·服务器
友友马3 小时前
『 Linux 』网络层 - IP协议(一)
linux·网络·tcp/ip