段的概念_重定位的引入

段的概念

代码段、只读数据段、可读可写数据段、BSS段。

c 复制代码
char g_Char = 'A'; //可读可写,不能放在ROM上,应该放在RAM里
const char g_Char2 = 'B'; //只读变量,可以放在ROM上
int g_A = 0; //初始值为0,没有必要浪费空间
int g_B; //没有初始化,没有必要浪费空间
  • 代码段(RO-CODE):就是程序本身,不会被修改
  • 可读可写的数据段(RW-DATA):有初始值的全局变量、静态变量,需要从ROM上复制到内存
  • 只读的数据段(RO-DATA):可以放在ROM上,不需要复制到内存
  • BSS段或ZI段:初始值为0的全局变量或静态变量/未初始化的全局变量或静态变量,没必要放在ROM上,使用之前清零就可以
  • 局部变量,保存在栈中,运行时生成
  • 堆:一块空闲空间,使用malloc函数来管理它,malloc函数可以自己写

重定位

保存在ROM上的全局变量,在使用前需要复制到内存,这就是数据重定位。
想把代码移动到其他位置,这就是代码重定位。

程序中含有什么

  • 代码段:如果它不在链接地址上,就需要重定位
  • 只读数据段:如果它不在链接地址上,就需要重定位
  • 可读可写的数据段:如果它不在链接地址上,就需要重定位
  • BSS段:不需要重定位,因为程序里根本不保存BSS段,使用前把BSS段对应的空间清零即可

谁来做重定位?

程序本身:它把自己复制到链接地址去

一开始,程序可能并不位于它的链接地址,为什么可以执行重定位的操作?
因为重定位的代码是用位置无关码写的

什么叫位置无关码:这段代码扔在任何位置都可以运行,跟它所在的位置无关。

怎么写出位置无关码:

跳转:使用相对跳转指令,不能使用绝对跳转指令。

只能使用branch指令(比如bl main),不能给PC直接赋值,比如ldr pc,=main

不要访问全局变量、静态变量

不使用字符串

怎么做重定位和清除BSS段

核心:复制

复制的三要素:源、目的、长度。

  • 怎么知道代码段/数据段保存在哪?(加载地址)
  • 怎么知道代码段/数据段被复制到哪?(链接地址)
  • 怎么知道代码段/数据段的长度?
  • 怎么知道BSS段的地址范围:起始地址、长度?

keil中使用散列文件(Scatter File)来描述

GCC中使用链接脚本(Link Script)来描述

加载地址和链接地址的区别

程序运行时,应该位于它的链接地址处,因为:

  • 使用函数地址时使用的是"函数的链接地址",所以代码段应该位于链接地址处。
  • 去访问全局变量、静态变量时,用的是"变量的链接地址",所以数据段应该位于链接地址处

但是: 程序一开始时可能并没有位于它的"链接地址":

  • 比如对于STM32F103,程序被烧录器烧写在Flash上,这个地址称为"加载地址"
  • 比如对于IMX6ULL/STM32MP157,片内ROM根据头部信息把程序读入内存,这个地址称为"加载地址"

当加载地址!=链接地址时,就需要重定位。

重定位的实质:移动数据

把代码段、只读数据段和数据段,移动到它的链接地址处。

也就是复制。

数据复制的三要素:源、目的、长度。

  • 数据保存在哪里?加载地址
  • 数据复制到哪里?链接地址
  • 长度

在keil中,使用散列文件来描述。

在STM32F103这类资源紧缺的单片机芯片中

  • 代码段保存在Flash上,直接在Flash上运行(当然也可以重定位到内存里)
  • 数据段保存在Flash上,使用前被复制到内存里
c 复制代码
; *************************************************************
; *** Scatter-Loading Description File generated by uVision ***
; *************************************************************

LR_IROM1 0x08000000 0x00040000  {    ; load region size_region
  ER_IROM1 0x08000000 0x00040000  {  ; load address = execution address
   *.o (RESET, +First)
   *(InRoot$$Sections)
   .ANY (+RO)
  }
  RW_IRAM1 0x20000000 0x0000C000  {  ; RW data
   .ANY (+RW +ZI)
  }
}

一个散列文件由一个或多个加载域组成。

一个加载域里有一个或多个可执行域。

一个可执行域里有一个或多个输入段。

可执行域1源:0x08000000,目的:0x08000000,长度:

可执行域1加载地址=链接地址,不需要重定位

  • *.o:所有的.o文件,抽取出RESET段,放在文件最开始的位置
  • :所有objects文件和库,在一个散列文件中只能使用一个
  • .ANY:等同于*,优先级比*低,在一个散列文件的一个可执行域里可以有多个.ANY

可执行域2源:紧随可执行域1后,目的:0x20000000,长度:

需要重定位

获得region信息

可执行域的信息

加载域的信息

汇编代码里怎么使用这些信息

c 复制代码
void memcpy(void *dest, void *src, unsigned int len)
{
    unsigned char *pcDest = (unsigned char *)dest;
    unsigned char *pcSrc = (unsigned char *)src;
    
    while(len--)
    {
        *pcDest = *pcSrc;
        pcDest++;
        pcSrc++;
    }
}
c 复制代码
IMPORT |Image$$RW_IRAM1$$Base|
IMPORT |Image$$RW_IRAM1$$Length|
IMPORT |Load$$RW_IRAM1$$Base|

LDR R0, =|Image$$RW_IRAM1$$Base| ;DEST
LDR R1, =|Load$$RW_IRAM1$$Base| ;SOURCE
LDR R2, =|Image$$RW_IRAM1$$Length| ;LENGTH
BL memcpy

C语言中的BSS段

c 复制代码
char g_Char = 'A';
const char g_Char2 = 'B';
int g_A = 0;  // 放在BSS段
int g_B;      // 放在BSS段

程序里的全局变量,如果它的初始值为0,或者没有设置初始值,这些变量被放在BSS段里,也叫ZI段。

BSS段并不会放入bin文件中,否则浪费空间。

在使用BSS段里的变量之前,把BSS段所占据的内存清零就可以了。

注意:对于keil来说,一个本该放到BSS段的变量,如果它所占据的空间小于等于8字节,keil仍然会放到data段里。只有当它所占据的空间大于8字节时,才会放到BSS段。

c 复制代码
int g_A[3] = {0, 0}; //12个字节,放在BSS段
char g_B[9];		 //9个字节,放在BSS段

int g_A[2] = {0, 0};//8个字节,放在data段
char g_B[8];		//8个字节,放在data段

如何知道BSS段目的地址,多大?

在散列文件中,BSS段(ZI段)在可执行域RW_IRAM1中描述:

c 复制代码
LR_IROM1 0x08000000 0x00080000  {    ; load region size_region
  ER_IROM1 0x08000000 0x00080000  {  ; load address = execution address
   *.o (RESET, +First)
   *(InRoot$$Sections)
   .ANY (+RO)
   .ANY (+XO)
  }
  RW_IRAM1 0x20000000 0x00010000  {  ; RW data
   .ANY (+RW +ZI)
  }
}

BSS段(ZI段)的链接地址(基地址)、长度,使用下面的符号获得:

代码段重定位-加载地址等于链接地址

在默认散列文件中,代码段的load address = execution address。
加载地址和执行地址(链接地址)一致,无需重定位

c 复制代码
LR_IROM1 0x08000000 0x00080000  {    ; load region size_region
  ER_IROM1 0x08000000 0x00080000  {  ; load address = execution address
   *.o (RESET, +First)
   *(InRoot$$Sections)
   .ANY (+RO)
   .ANY (+XO)
  }
  RW_IRAM1 0x20000000 0x00010000  {  ; RW data
   .ANY (+RW +ZI)
  }
}

加载地址不等于链接地址

有时候,我们需要把程序复制到内存里里运行,比如:

  • 想让程序执行得更快:需要把代码段复制到内存里。
  • 程序很大,保存在片外SPI Flash中,SPI Flash上的代码无法直接执行,需要复制到内存里。

这时候,需要修改散列文件,把代码段的可执行域放在内存里。

那么程序运行时,需要尽快把代码段重定位到内存。

c 复制代码
LR_IROM1 0x08000000 0x00080000  {    ; load region size_region
  ER_IROM1 0x20000000   {  ; load address != execution address
   *.o (RESET, +First)
   .ANY (+RO)
   .ANY (+XO)
  }
  RW_IRAM1 +0   {  ; RW data
   .ANY (+RW +ZI)
  }
}

上面的散列文件中:

  • 可执行域ER_IROM1:加载地址为0x08000000,可执行地址为0x20000000,两者不相等。
    板子上电后,从0x080000000处开始运行,需要尽快把代码段复制到0x20000000
  • 可执行域RW_IRAM1:加载地址:紧跟着ER_IOM1的加载地址,可执行地址:紧跟着ER_IROM1的可执行地址。
    需要尽快把数据复制到可执行地址处。

代码段不重定位的后果

c 复制代码
ldr pc, =main ;这样调用函数,用到main函数的链接地址,如果代码段没有重定位,则跳转失败
c 复制代码
void (*funcptr)(const char *s, unsigned int val);
funcptr = put_s_hex;
funcptr("hello",123);

为什么重定位之前的代码也可以正常运行?

因为重定位之前的代码是使用位置无关码写的:
只使用相对跳转指令:B、BL

不使用绝对跳转指令:

c 复制代码
LDR R0, =main
BLX R0

不访问全局变量、静态变量、字符串、数组

重定位完成后,使用绝对跳转指令跳转到xxx函数的链接地址去

c 复制代码
BL main;BL ;相对跳转,程序仍在Flash上运行

LDR R0,=main ;绝对跳转,跳转到链接地址上去,就是跳去内存里执行
BLX R0

重定位的纯C函数实现

难点在于,怎么得到各个域的加载地址、链接地址、长度。

方法1

声明为外部变量,使用时需要使用取址符

c 复制代码
extern int Image$$ER_IROM1$$Base;
extern int Load$$ER_IROM1$$Base;
extern int Image$$ER_IROM1$$Length;

memcpy(&Image$$ER_IROM1$$Base, &Image$$ER_IROM1$$Length, &Load$$ER_IROM1$$Base);

方法2

声明为外部数组,使用时不需要使用取址符

c 复制代码
extern char Image$$ER_IROM1$$Base[];
extern char Load$$ER_IROM1$$Base[];
extern int Image$$ER_IROM1$$Length;

memcpy(Image$$ER_IROM1$$Base, Image$$ER_IROM1$$Length, &Load$$ER_IROM1$$Base);