30天开发操作系统第 10 天 -- 叠加处理

前言

得益于昨天的努力，我们终于可以进行内存管理了。不过仔细一看会注意到，bootpack.c都已经有254行了。笔者感觉这段程序太长了，决定整理一下，分出一部分到memory.c中去。(整理中)...好了，整理完了。现在bootpack.c变成95行了。

为了以后使用起来更加方便，我们还是把这些内存管理函数再整理一下。memman_alloc和

memman_fee能够以1字节为单位进行内存管理，这种方式虽然不错，但是有一点不足--在反

复进行内存分配和内存释放之后，内存中就会出现很多不连续的小段未使用空间，这样就会把man->fees消耗殆尽。

因此，我们要编写一些总是以0x1000字节为单位进行内存分配和释放的函数，它们会把指定的内存大小按0x1000字节为单位向上舍入(roundup)，而之所以要以0x1000字节为单位，是因为觉得这个数比较规整。另外，0x1000字节的大小正好是4KB。

一、内存管理3.0

c 复制代码

unsigned int memman_alloc_4k(struct MEMMAN *man, unsigned int size)
{
	unsigned int a;
	size = (size + 0xfff) & 0xfffff000;
	a = memman_alloc(man, size);
	return a;
}

下面我们来看看这次增加的部分，这里的关键是向上舍人，可是如果上来就讲向上舍人的话可能不太好懂，所以我们还是先从向下舍人(round down)讲起吧。

讲数字问题时，以钱为例大家可能更容易理解，所以我们就用钱来举例说明。比如，把123元以10元为单位进行向下舍人，就是120元;把456元以100元为单位进行向下舍人，就是400元。

通过这些例子，你会发现"所谓向下舍人，就是把最后几位数字强制变为0"。所以如果将0x12345678以0x1000为单位进行向下舍人，得到的就应该是0x12345000吧?没错，这就是正确答案。这样一来，用纸笔就可以进行向下舍人运算了。不过，如果我们要写个程序让电脑来做同样的事，那该怎么办才好呢?

在二进制下，如果我们想把某位变为0，只要进行"与运算"就可以了，这在4.2节已经介绍过了。而十六进制其实就是把二进制数4位4位地排在一起，所以要想把十六进制的某一位设置为0，同样只进行"与运算"就可以。

0x12345678 &0xE0000x12345000

因此把变量i中的数字以0x1000为单位进行向下舍人的式子如下:

i = i & 0xfffff000:

顺便告诉大家一下，以0x10为单位向下舍人的式子是"i=i & 0xfffffff0;"。这样我们就掌握了向下舍人的方法。

下面我们来看看向上舍人。如果把123元以10元为单位进行向上舍人，就是130元;把456元以100元为单位进行向上舍人，就是500元。，原来如此，看来先向下舍入，再在它的结果上做个加法运算就可以了。

以0x1000为单位对0x12345678进行向上舍人的结果为0x12346000。所以有人可能会问:"要是用程序来表达这个过程的话就应该写成这样吧?

i = (i & 0xfffff000)+0x1000;

看起来貌似确实不错，但其实这并不是正确答案。因为如果"i=0x12345000;"时执行上述命令，结果就变成了"i=0x12346000;"。这当然不对啦。这就相当于，以10元为单位对120元进行向上舍人，结果为130元，但实际上120元向上舍人后应该还是120元。

所以我们要对程序进行改进。具体做法是:先判断最后几位，如果本来就是零则什么也不做，如果不是零就进行下面的运算。

if((i & 0xfff)!=0){(i & 0xfffff000)+ 0x1000;}

这样问题就解决了。大功告成。

现在我们可以灵活自由地进行向下舍入和向上舍人了，而实际上向上舍人还有改进的"窍门"

那就是:

i = (i + 0xfff)& 0xfffff000:

这是怎么回事呢?实际上这是"加上0x后进行向下舍人"的运算。不论最后几位是什么都可以用这个公式进行向上舍人运算。真的吗?

由于十六进制不易理解，所以我们还是以钱的十进制运算为例来说明吧。如使用这个方法以100元为单位对456元进行向上舍人，就相当于先加上99元再进行向下舍人。456元加上99元是555元，向下舍人后就是500元了。，这方法做出来的答案没错，456元向上舍人的结果确实就是500元。

那么如果对400元进行向上舍入呢?先加上99元，得到499元，再进行向下舍人，结果是400元。看，400元向上舍人的结果还是400元。

这种方法多方便呀，可比if语句什么的好用多了。不过其中的原理是什么呢?其实加上99元就是判断进位，如果最后两位不是00,就要向前进一位，只有当最后两位是00时,才不需要进位。接下来再向下舍人，这样就正好把因为加法运算而改变的后两位设置成00了。看，向上舍人就成功了哦。

那么试着"makern"一下吧。可是没有任何反应呀!那当然了，这次做的新函数，还没有被调用呢。

二、叠加处理

上一节我们为了转换心情，做了内存管理的探讨，现在还是回过头来，继续解决鼠标的问题吧。从各方面深入思考鼠标的叠加处理确实很有意思，不过考虑到今后我们还面临着窗口的叠加处理问题，所以笔者想做这么一段程序，让它不仅适用于鼠标的叠加处理，也能直接适用于窗口的叠加处理。

其实在画面上进行叠加显示，类似于将绘制了图案的透明图层叠加在一起。给大家看一下手机中的图层合成，这样大家更容易理解一些。

对应电脑的话最上面的小图层用来描绘鼠标指针，它下面的几张图层是用来存放窗口的，而最下面的一张图层用来存放桌面壁纸。同时，我们还要通过移动图层的方法实现鼠标指针的移动以及窗口的移动。

我们想法已经有了,下面就把它们变成程序吧。首先来考虑如何将一个图层的信息编成程序。

c 复制代码

struct SHEET{
	unsigned char *buf;
	int bxsize,bysize,vx0,vy0,col_inv,height,flags;
};

暂时先写成这样就可以了。程序里的sheet这个词，表示"透明图层"的意思。英文里没有和"透明图层"接近的词,就凭感觉选了它。buf是用来记录图层上所描画内容的地址( buffer的略语 )。图层的整体大小，用bxsize*bysize表示。vx0和vy0是表示图层在画面上位置的坐标，v

是VRAM的略语。col_inv表示透明色色号，它是color(颜色)和invisible(透明)的组合略语。

height表示图层高度。Flags用于存放有关图层的各种设定信息。

只有一个图层是不能实现叠加处理的，所以下面我们来创建一个管理多重图层信息的结构。

c 复制代码

#define MAX SHEETS 256
struct SHTCTL(
	unsigned char *vram;
	int xsize,ysize,top;
	struct SHEET *sheets[MAX SHEETS];
	struct SHEET sheets0[MAX SHEETS];
}

1.引入库

代码如下（示例）：

c 复制代码

#define MAX SHEETS 256
struct SHICTL(
	unsigned char *vram;
	int xsize,ysize,top;
	struct SHEET *sheets[MAX SHEETS];
	struct SHEET sheets0[MAX SHEETS];
}

我们创建了SHTCTL结构体，其名称来源于sheet control的略语，意思是"图层管理"。

MAX SHEETS是能够管理的最大图层数，这个值设为256应该够用了

变量vram、xsize、ysize代表VRAM的地址和画面的大小，但如果每次都从BOOTINFO查询的话就太麻烦了，所以在这里预先对它们进行赋值操作。top代表最上面图层的高度。sheets0这个结构体用于存放我们准备的256个图层的信息。而sheets是记忆地址变量的领域，所以相应地也要先准备256份。这是干什么用呢?由于sheets0中的图层顺序混乱，所以我们把它们按照高度进行升序排列，然后将其地址写入sheets中，这样就方便多了。

不知不觉我们已经写了很多了，不过也许个别地方大家还不太明白，与其在这纸上谈兵，不如直接看程序更易于理解。所以前面的说明部分，大家即使不懂也别太在意，先往下看吧。heihei我们提到的图层控制变量中，仅仅sheets0的部分大小就有32x256-8192，即8KB，如果再加上sheets的话，就超过了9KB。对于空间需要如此大的变量，我们想赶紧使用memman_alloc_4k来分配内存空间，所以就编写了对内存进行分配和初始化的函数。

c 复制代码

struct SHTCTL *shtctl_init(struct MEMMAN *memman, unsigned char *vram, int xsize, int ysize)
{
	struct SHTCTL *ctl;
	int i;
	ctl = (struct SHTCTL *) memman_alloc_4k(memman, sizeof (struct SHTCTL));
	if (ctl == 0) {
		goto err;
	}
	ctl->vram = vram;
	ctl->xsize = xsize;
	ctl->ysize = ysize;
	ctl->top = -1; /* 一个SHEET都没 */
	for (i = 0; i < MAX_SHEETS; i++) {
		ctl->sheets0[i].flags = 0; /* 未使用标记 */
	}
err:
	return ctl;
}

这段程序是什么的呢?首先使用memman_alloc_4k来分配用于记忆图层控制变量的内存空间，这时必须指定该变量所占空间的大小，不过我们可以使用sizeof(stuctSHTCTL)这种写法让C编译器自动计算。只要写sizeof(变量型)，C编译器就会计算出该变量型所需的字节数。

接着，我们给控制变量赋值，给其下的所有图层变量都加上"未使用"标签。做完这一步，这个函数就完成了。

下面我们再做一个函数，用于取得新生成的未使用图层。

c 复制代码

struct SHEET *sheet_alloc(struct SHTCTL *ctl)
{
	struct SHEET *sht;
	int i;
	for (i = 0; i < MAX_SHEETS; i++) {
		if (ctl->sheets0[i].flags == 0) {
			sht = &ctl->sheets0[i];
			sht->flags = SHEET_USE; /* 标记为正在使用 */
			sht->height = -1; /* 隐藏 */
			return sht;
		}
	}
	return 0;	/* 所有的SHEET都处于正在使用状态 */
}

在sheets0\[\]中寻找未使用的图层，如果找到了，就将其标记为"正在使用"，并返回其地址就可以了，这里没有什么难点。高度设为-1，表示图层的高度还没有设置，因而不是显示对象。

程序中出现的&ctl->sheets0 $i$ 是"ctl->sheets0 $i$ 的地址"的意思。也就是说，指的是&(ctl->sheets0 $i$ )，而不是(&ctl)->sheets0 $i$ 。

c 复制代码

void sheet_setbuf(struct SHEET *sht, unsigned char *buf, int xsize, int ysize, int col_inv)
{
	sht->buf = buf;
	sht->bxsize = xsize;
	sht->bysize = ysize;
	sht->col_inv = col_inv;
	return;
}

这是设定图层的缓冲区大小和透明色的函数，这也没什么难的吧。

接下来我们写设定底板高度的函数。这稍微有些复杂，所以我们在程序中加入了不少注释。这里的updown就是"上下"的意思。

c 复制代码

void sheet_updown(struct SHTCTL *ctl, struct SHEET *sht, int height)
{
	int h, old = sht->height; /* 存储设置前的高度信息 */

	/* 如果指定的高度过高或过低，则进行修正 */
	if (height > ctl->top + 1) {
		height = ctl->top + 1;
	}
	if (height < -1) {
		height = -1;
	}
	sht->height = height; /* 设定高度 */

	/* 下面主要是进行sheets[]的重新排列 */
	if (old > height) {	/* 比以前低 */
		if (height >= 0) {
			/* 把中间的往上提 */
			for (h = old; h > height; h--) {
				ctl->sheets[h] = ctl->sheets[h - 1];
				ctl->sheets[h]->height = h;
			}
			ctl->sheets[height] = sht;
		} else {	/* 隐藏 */
			if (ctl->top > old) {
				/* 把上面的降下来 */
				for (h = old; h < ctl->top; h++) {
					ctl->sheets[h] = ctl->sheets[h + 1];
					ctl->sheets[h]->height = h;
				}
			}
			ctl->top--; /* 由于显示中的图层减少了一个，所以最上面的图层高度下降 */
		}
		sheet_refresh(ctl); /* 按新图层的信息重新绘制画面 */
	} else if (old < height) {	/* 比以前高 */
		if (old >= 0) {
			/* 把中间的拉下去 */
			for (h = old; h < height; h++) {
				ctl->sheets[h] = ctl->sheets[h + 1];
				ctl->sheets[h]->height = h;
			}
			ctl->sheets[height] = sht;
		} else {	/* 由隐藏状态转为显示状态 */
			/* 将已在上面的提上来 */
			for (h = ctl->top; h >= height; h--) {
				ctl->sheets[h + 1] = ctl->sheets[h];
				ctl->sheets[h + 1]->height = h + 1;
			}
			ctl->sheets[height] = sht;
			ctl->top++; /* 由于已显示的图层增加了1个，所以最上面的图层高度增加 */
		}
		sheet_refresh(ctl); /* 按新图层信息重新绘制画面 */
	}
	return;
}

程序稍稍有些长，不过既然大家能看懂前面的程序，那么这个程序应该也是可以看明白的。

每一条语句并不比之前的语句难，只是整个程序变长了而已。最初可能很难看进去，但是如果一直坚持读下去的话，阅读程序的能力就会越来越强。

下面来说说在sheet updown中使用的sheet refresh函数。这个函数会从下到上描绘所有的图

层。refresh是"刷新"的意思。手机屏幕就是在1秒内完成多帧的描绘才做出动画效果的，这个

动作就被称为刷新。而这种对图层的刷新动作，与手机屏幕的动作有些相似，所以我们也给它起名字叫做刷新。

c 复制代码

void sheet_refresh(struct SHTCTL *ctl)
{
	int h, bx, by, vx, vy;
	unsigned char *buf, c, *vram = ctl->vram;
	struct SHEET *sht;
	for (h = 0; h <= ctl->top; h++) {
		sht = ctl->sheets[h];
		buf = sht->buf;
		for (by = 0; by < sht->bysize; by++) {
			vy = sht->vy0 + by;
			for (bx = 0; bx < sht->bxsize; bx++) {
				vx = sht->vx0 + bx;
				c = buf[by * sht->bxsize + bx];
				if (c != sht->col_inv) {
					vram[vy * ctl->xsize + vx] = c;
				}
			}
		}
	}
	return;
}

对于已设定了高度的所有图层而言,要从下往上,将透明以外的所有像素都复制到VRAM中。

由于是从下开始复制，所以最后最上面的内容就留在了画面上。

现在我们来看一下不改变图层高度而只上下左右移动图层的函数--sheet slide。slide原意

是"滑动"，这里指上下左右移动图层。

c 复制代码

void sheet_slide(struct SHTCTL *ctl, struct SHEET *sht, int vx0, int vy0)
{
	sht->vx0 = vx0;
	sht->vy0 = vy0;
	if (sht->height >= 0) { /* 如果正在显示 */
		sheet_refresh(ctl); /* 按新图层的信息刷新画面 */
	}
	return;
}

最后是释放已使用图层的内存的函数sheetfree。这个简单。

c 复制代码

void sheet_free(struct SHTCTL *ctl, struct SHEET *sht)
{
	if (sht->height >= 0) {
		sheet_updown(ctl, sht, -1); /* 如果处于显示状态，则先设定为隐藏 */
	}
	sht->flags = 0; /* 未使用 */
	return;
}

下面我们将以上与图层相关的程序汇总到sheet.c中，所以就要改造HariMain函数了

c 复制代码

void HariMain(void)
{
	init_keyboard();
	enable_mouse(&mdec);
	memtotal = memtest(0x00400000, 0xbfffffff);
	memman_init(memman);
	memman_free(memman, 0x00001000, 0x0009e000); /* 0x00001000 - 0x0009efff */
	memman_free(memman, 0x00400000, memtotal - 0x00400000);

	init_palette();
	shtctl = shtctl_init(memman, binfo->vram, binfo->scrnx, binfo->scrny);
	sht_back  = sheet_alloc(shtctl);
	sht_mouse = sheet_alloc(shtctl);
	buf_back  = (unsigned char *) memman_alloc_4k(memman, binfo->scrnx * binfo->scrny);
	sheet_setbuf(sht_back, buf_back, binfo->scrnx, binfo->scrny, -1); /* 没有透明色 */
	sheet_setbuf(sht_mouse, buf_mouse, 16, 16, 99);
	init_screen8(buf_back, binfo->scrnx, binfo->scrny);
	init_mouse_cursor8(buf_mouse, 99);/* 背景色号 99 */
	sheet_slide(shtctl, sht_back, 0, 0);
	mx = (binfo->scrnx - 16) / 2; /* 画面中央 */
	my = (binfo->scrny - 28 - 16) / 2;
	sheet_slide(shtctl, sht_mouse, mx, my);
	sheet_updown(shtctl, sht_back,  0);
	sheet_updown(shtctl, sht_mouse, 1);
	sprintf(s, "(%3d, %3d)", mx, my);
	putfonts8_asc(buf_back, binfo->scrnx, 0, 0, COL8_FFFFFF, s);
	sprintf(s, "memory %dMB   free : %dKB",
			memtotal / (1024 * 1024), memman_total(memman) / 1024);
	putfonts8_asc(buf_back, binfo->scrnx, 0, 32, COL8_FFFFFF, s);
	sheet_refresh(shtctl);

	for (;;) {
		io_cli();
		if (fifo8_status(&keyfifo) + fifo8_status(&mousefifo) == 0) {
			io_stihlt();
		} else {
			if (fifo8_status(&keyfifo) != 0) {
				i = fifo8_get(&keyfifo);
				io_sti();
				sprintf(s, "%02X", i);
				boxfill8(buf_back, binfo->scrnx, COL8_008484,  0, 16, 15, 31);
				putfonts8_asc(buf_back, binfo->scrnx, 0, 16, COL8_FFFFFF, s);
				sheet_refresh(shtctl);
			} else if (fifo8_status(&mousefifo) != 0) {
				i = fifo8_get(&mousefifo);
				io_sti();
				if (mouse_decode(&mdec, i) != 0) {
					/* 因为已得到3字节的数据所以显示 */
					sprintf(s, "[lcr %4d %4d]", mdec.x, mdec.y);
					if ((mdec.btn & 0x01) != 0) {
						s[1] = 'L';
					}
					if ((mdec.btn & 0x02) != 0) {
						s[3] = 'R';
					}
					if ((mdec.btn & 0x04) != 0) {
						s[2] = 'C';
					}
					boxfill8(buf_back, binfo->scrnx, COL8_008484, 32, 16, 32 + 15 * 8 - 1, 31);
					putfonts8_asc(buf_back, binfo->scrnx, 32, 16, COL8_FFFFFF, s);
					/* 移动鼠标 */
					mx += mdec.x;
					my += mdec.y;
					if (mx < 0) {
						mx = 0;
					}
					if (my < 0) {
						my = 0;
					}
					if (mx > binfo->scrnx - 16) {
						mx = binfo->scrnx - 16;
					}
					if (my > binfo->scrny - 16) {
						my = binfo->scrny - 16;
					}
					sprintf(s, "(%3d, %3d)", mx, my);
					boxfill8(buf_back, binfo->scrnx, COL8_008484, 0, 0, 79, 15); /* 消除坐标 */
					putfonts8_asc(buf_back, binfo->scrnx, 0, 0, COL8_FFFFFF, s); /* 写坐标 */
					sheet_slide(shtctl, sht_mouse, mx, my); /* 有sheet_refresh */
				}
			}
		}
	}
}

我们准备了2个图层,分别是sht_back和sht_mouse,还准备了2个缓冲区buf_back和buf_mouse,用于在其中描绘图形。以前我们指定为binfo->vram的部分，现在有很多都改成了buf_back。而且每次修改缓冲区之后都要刷新。这段代码不是很难，大家能理解了吧。

不过其实这里面还是有问题。从图片来看确实很完美，可实际操作一下，你恐怕就要喊"吐

血啦!"。没错，它太慢了，而且画面还一闪一闪的。动一下鼠标就要郁闷一次，哪个用户想用这样的操作系统呢?所以下面我们就来解决这个问题吧。

2.提高叠加处理速度1.0

那么怎样才能提高速度呢?既然其他操作系统都能处理得那么快,就肯定有好的方法。首先，

我们从鼠标指针的移动，也就是图层的移动来思考一下。

鼠标指针虽然最多只有16x16 = 256个像素，可根据harib07b的原理，只要它稍一移动，程序就会对整个画面进行刷新，也就是重新描绘320x200 = 64000个像素。而实际上，只重新描绘移动相关的部分，也就是移动前后的部分就可以了，即256x2 = 512个像素（鼠标移动前和后，两个鼠标的大小）。这只是64000像素的0.8%而已，所以有望提速很多。现在我们根据这个思路写一下程序。

c 复制代码

void sheet_refreshsub(struct SHTCTL *ctl, int vx0, int vy0, int vx1, int vy1)
{
	int h, bx, by, vx, vy;
	unsigned char *buf, c, *vram = ctl->vram;
	struct SHEET *sht;
	for (h = 0; h <= ctl->top; h++) {
		sht = ctl->sheets[h];
		buf = sht->buf;
		for (by = 0; by < sht->bysize; by++) {
			vy = sht->vy0 + by;
			for (bx = 0; bx < sht->bxsize; bx++) {
				vx = sht->vx0 + bx;
				if (vx0 <= vx && vx < vx1 && vy0 <= vy && vy < vy1) {
					c = buf[by * sht->bxsize + bx];
					if (c != sht->col_inv) {
						vram[vy * ctl->xsize + vx] = c;
					}
				}
			}
		}
	}
	return;
}

这个函数几乎和sheet refesh一样，唯一的不同点在于它能使用vx0~

vy1指定刷新的范围，而我们只追加了一个if语句就实现了这个新功能。另外,程序中的&&运算符是我们之前没有见过的，所以在这里详细解释一下。

&&运算符是把多个条件关系式连接起来的运算符。当用它连接的所有条件都满足时，就执行

{}中的程序;只要有一个条件不满足，就不执行(如果有else，就执行else后的语句)。另外，还有一个跟它很像的运算符"||"。"||"也是把多个条件关系式连接起来的运算符,不过由它连接的各个条件，只要其中一个满足了，就执行{}中的程序。简而言之，&&就是"而且"，而‖是"或者"。

条件"vx大于等于vx0且小于vx1"可以用数学式vx0<=vx<vx1来表达，但在C语言中不能这样写，我们只能写成vx0<=vx && vx<vx1。

现在我们使用这个refeshsub函数来提高sheetslide的运行速度。

c 复制代码

void sheet_slide(struct SHTCTL *ctl, struct SHEET *sht, int vx0, int vy0)
{
	int old_vx0 = sht->vx0, old_vy0 = sht->vy0;
	sht->vx0 = vx0;
	sht->vy0 = vy0;
	if (sht->height >= 0) { /* 如果正在显示，则按新图层的信息刷新画面 */
		sheet_refreshsub(ctl, old_vx0, old_vy0, old_vx0 + sht->bxsize, old_vy0 + sht->bysize);/* 移动之前 */
		sheet_refreshsub(ctl, vx0, vy0, vx0 + sht->bxsize, vy0 + sht->bysize);/* 移动之后 */
	}
	return;
}

这段程序所做的是:首先记住移动前的显示位置，再设定新的显示位置，最后只要重新描绘

移动前和移动后的地方就可以了。

估计大家会认为"这次鼠标的移动就快了吧"，但移动鼠标时，由于要在画面上显示坐标等

信息，结果又执行了sheet_refesh程序，所以还是很慢。为了不浪费我们付出的各种努力，下面我们就来解决一下图层内文字显示的问题。

我们所说的在图层上显示文字，实际上并不是改写图层的全部内容。假设我们已经写了20

个字，那么8x16x20-2560.也就是仅仅重写2560个像素的内容就应该足够了。但现在每次却要重写64 000个像素的内容，所以速度才那么慢。

这么说来，这里好像也可以使用refresh_sub，那么我们就来重新编写函数sheet_refresh吧。

c 复制代码

void sheet_refresh(struct SHTCTL *ctl, struct SHEET *sht, int bx0, int by0, int bx1, int by1)
{
	if (sht->height >= 0) { /* 如果正在显示，则按新图层的信息刷新画面 */
		sheet_refreshsub(ctl, sht->vx0 + bx0, sht->vy0 + by0, sht->vx0 + bx1, sht->vy0 + by1);
	}
	return;
}

这次指定的范围，并不是直接指定画面内的坐标，而是以缓冲区内的坐标来表示。这样一来，HariMain就可以不考虑图层在画面中的位置了。

我们改动了refresh，所以也要相应改造updown。做了改动的只有sheet_refresh(ctl)这部分

(有两处)，修改后的程序如下:

sheet_refreshsub(ctl,sht->vx0,sht->vy0, sht->vx0 + sht->bxsize, sht->vy0 + sht->bysize) ;

最后还要改写HariMain：

c 复制代码

void HariMain(void)
{
	sprintf(s, "memory %dMB   free : %dKB",
			memtotal / (1024 * 1024), memman_total(memman) / 1024);
	putfonts8_asc(buf_back, binfo->scrnx, 0, 32, COL8_FFFFFF, s);
	sheet_refresh(shtctl, sht_back, 0, 0, binfo->scrnx, 48);/* 这里 */

	for (;;) {
		io_cli();
		if (fifo8_status(&keyfifo) + fifo8_status(&mousefifo) == 0) {
			io_stihlt();
		} else {
			if (fifo8_status(&keyfifo) != 0) {
				i = fifo8_get(&keyfifo);
				io_sti();
				sprintf(s, "%02X", i);
				boxfill8(buf_back, binfo->scrnx, COL8_008484,  0, 16, 15, 31);
				putfonts8_asc(buf_back, binfo->scrnx, 0, 16, COL8_FFFFFF, s);
				sheet_refresh(shtctl, sht_back, 0, 16, 16, 32);/* 这里 */
			} else if (fifo8_status(&mousefifo) != 0) {
				i = fifo8_get(&mousefifo);
				io_sti();
				if (mouse_decode(&mdec, i) != 0) {
					/* �f�[�^��3�o�C�g�������̂ŕ\�� */
					sprintf(s, "[lcr %4d %4d]", mdec.x, mdec.y);
					if ((mdec.btn & 0x01) != 0) {
						s[1] = 'L';
					}
					if ((mdec.btn & 0x02) != 0) {
						s[3] = 'R';
					}
					if ((mdec.btn & 0x04) != 0) {
						s[2] = 'C';
					}
					boxfill8(buf_back, binfo->scrnx, COL8_008484, 32, 16, 32 + 15 * 8 - 1, 31);
					putfonts8_asc(buf_back, binfo->scrnx, 32, 16, COL8_FFFFFF, s);
					sheet_refresh(shtctl, sht_back, 32, 16, 32 + 15 * 8, 32);/* 这里 */
					mx += mdec.x;
					my += mdec.y;
					if (mx < 0) {
						mx = 0;
					}
					if (my < 0) {
						my = 0;
					}
					if (mx > binfo->scrnx - 16) {
						mx = binfo->scrnx - 16;
					}
					if (my > binfo->scrny - 16) {
						my = binfo->scrny - 16;
					}
					sprintf(s, "(%3d, %3d)", mx, my);
					boxfill8(buf_back, binfo->scrnx, COL8_008484, 0, 0, 79, 15); /* 消除坐标 */
					putfonts8_asc(buf_back, binfo->scrnx, 0, 0, COL8_FFFFFF, s); /* 重写坐标 */
					sheet_refresh(shtctl, sht_back, 0, 0, 80, 16);/* 这里 */
					sheet_slide(shtctl, sht_mouse, mx, my);
				}
			}
		}
	}
}

这里我们仅仅改写了sheetrefresh，变更点共有4个。只有每次要往buf_back中写人信息时

才进行sheet_refresh。

这样应该可以顺利运行了。我们赶紧试一试。"make run"。哦，确实比以前快多了。太好了!不过还是欠缺一些东西...

3提高叠加处理速度 2.0

虽然我们想了如此多的办法，但结果还是没有达到我们的期望，真让人郁闷。到底是怎么回

事呢?原来还是refeshsub有些问题。

c 复制代码

void sheet_refreshsub(struct SHTCTL *ctl, int vx0, int vy0, int vx1, int vy1)
{
	int h, bx, by, vx, vy;
	unsigned char *buf, c, *vram = ctl->vram;
	struct SHEET *sht;
	for (h = 0; h <= ctl->top; h++) {
		sht = ctl->sheets[h];
		buf = sht->buf;
		for (by = 0; by < sht->bysize; by++) {
			vy = sht->vy0 + by;
			for (bx = 0; bx < sht->bxsize; bx++) {
				vx = sht->vx0 + bx;
				if (vx0 <= vx && vx < vx1 && vy0 <= vy && vy < vy1) {
					c = buf[by * sht->bxsize + bx];
					if (c != sht->col_inv) {
						vram[vy * ctl->xsize + vx] = c;
					}
				}
			}
		}
	}
	return;
}

依照这个程序，即使不写人像素内容，也要多次执行if语句，这一点不太好，如果能改善

下，速度应该会提高不少。

按照上面这种写法，即便只刷新图层的一部分，也要对所有图层的全部像素执行if语句，判

断"是写人呢，还是不写呢"。而对于刷新范围以外的部分，就算执行if判断语句，最后也不会进行刷新，所以这纯粹就是一种浪费。既然如此，我们最初就应该把for语句的范围限定在刷新范围之内。

c 复制代码

void sheet_refreshsub(struct SHTCTL *ctl, int vx0, int vy0, int vx1, int vy1)
{
	int h, bx, by, vx, vy, bx0, by0, bx1, by1;
	unsigned char *buf, c, *vram = ctl->vram;
	struct SHEET *sht;
	for (h = 0; h <= ctl->top; h++) {
		sht = ctl->sheets[h];
		buf = sht->buf;
		/* vx0 ~ vy1，计算 by0 ~ by1 */
		bx0 = vx0 - sht->vx0;
		by0 = vy0 - sht->vy0;
		bx1 = vx1 - sht->vx0;
		by1 = vy1 - sht->vy0;
		if (bx0 < 0) { bx0 = 0; } /* 后面说明① */
		if (by0 < 0) { by0 = 0; }
		if (bx1 > sht->bxsize) { bx1 = sht->bxsize; } /* 后面说明② */
		if (by1 > sht->bysize) { by1 = sht->bysize; }
		for (by = by0; by < by1; by++) {
			vy = sht->vy0 + by;
			for (bx = bx0; bx < bx1; bx++) {
				vx = sht->vx0 + bx;
				c = buf[by * sht->bxsize + bx];
				if (c != sht->col_inv) {
					vram[vy * ctl->xsize + vx] = c;
				}
			}
		}
	}
	return;
}

改良的关键在于，bx在for语句中并不是在0到bxsize之间循环，而是在bx0到bx1之间循环(对

于by也一样 )。而bx0和bx1都是从刷新范围"倒推"求得的。倒推其实就是把公式变形转换了一下，具体如下:

vx = sht->vx0 + bx;

bx = v - sht->vx0；

计算vx0的坐标相当于bx中的哪个位置，然后把它作为bx0。其他的坐标处理方法也一样。

这样算完以后，就该执行以上程序中说明(1)的地方了。这行代码用于处理刷新范围在图层外

侧的情况。什么时候会出现这种情况呢?比如在sht_back中写人字符并进行刷新，而且刷新范围的一部分被鼠标覆盖的情况。

总结

仅仅改了这些地方，就可以提高速度吗?我们来试一下。"make run"(要等待一会儿)。

哦，这次感觉很好，操作系统正在迅速地运行，太开心了!虽然从表面上看不出有什么不同，不过这次我们要附上照片，展示一番。太棒了!

今天是元旦，祝大家平安喜乐~

30天开发操作系统 第 10 天 -- 叠加处理

前言

一、内存管理3.0

二、叠加处理

1.引入库

2.提高叠加处理速度1.0

3提高叠加处理速度 2.0

总结

30天开发操作系统第 10 天 -- 叠加处理