操作系统番外1（Linux的测试体系）（TODO）

从根源来说，Linux内核本质也是一个elf应用程序，那么感觉linux最大的挑战不是编程，而是如何保证那么多的平台以及设备都能高质量的运行。如何保证这么多平台的质量，感觉才是重中之重。

=============引用===============

Linux 的伟大不在于它写出了多么天才的算法，而在于它建立了一套极其严苛的、工业级的"质量保障与协作流程"。

要把同一套代码跑在树莓派、特斯拉汽车、安防摄像头和超级计算机上，Linux 靠的不是运气，而是以下这四根"工程支柱"：

Linux 不是谁都能往里写代码的。它有一套类似"金字塔"的审核机制：

为了保证"改了 A 不影响 B"，Linux 拥有庞大的自动化测试集群：

LKP (Linux Kernel Performance)： 这是一个由 Intel 等巨头支持的自动化套件。任何代码提交到邮件列表，后台会有成百上千台不同架构的服务器自动拉取、编译、运行测试用例。
kselftest & KUnit： 内核自带的单元测试框架。在代码合并前，必须通过这些逻辑测试。
零日漏洞机器人 (0-Day Bot)： 自动扫描代码中的静态错误、编译警告和性能退化。如果你的代码让 ARM 平台的功耗增加了 1%，机器人会立刻发邮件"点名批评"。

这是解决你提到的"多平台运行"的关键。

Linux 开发者发明（或深度使用）了许多变态级的工具来抓错：

Sparse： Linus 亲自编写的静态分析工具，专门用来检查内核代码里的类型错误（比如混用了虚拟地址和物理地址）。
KASAN (Kernel Address Sanitizer)： 动态检测内存越界和 Use-after-free。这在裸机开发中简直是神物，能帮你抓住那些偶尔出现的死机 Bug。
Lockdep： 死锁检测器。它能动态分析你的加锁顺序，如果你写出了潜在的死锁逻辑，即便现在没死机，它也会报警。

如果一个 Bug 还是漏网了，Linux 有一个终极工程手段：git bisect。

假设 6.1 版本是好的，6.2 版本坏了。通过这个命令，开发者可以快速切换到中间的某个提交，测试是否正常，从而在成千上万个提交中，像"二分查找"一样，在 10 步之内精准定位到是哪一行代码导致了崩溃。

Linux 的高质量不是"写"出来的，而是**"磨"**出来的。