文章目录
- 了解服务器
-
- 服务器的架构图
- 关键组件Raid卡
-
- [一、RAID 是什么?为什么服务器必须用?](#一、RAID 是什么?为什么服务器必须用?)
- [二、常见 RAID 级别详解(从原理到适用场景)](#二、常见 RAID 级别详解(从原理到适用场景))
-
- [1. RAID 0(条带化)](#1. RAID 0(条带化))
- [2. RAID 1(镜像)](#2. RAID 1(镜像))
- [3. RAID 5(分布式奇偶校验)](#3. RAID 5(分布式奇偶校验))
- [4. RAID 6(双分布式奇偶校验)](#4. RAID 6(双分布式奇偶校验))
- [5. RAID 10(1+0,先镜像后条带)](#5. RAID 10(1+0,先镜像后条带))
- [6. RAID 50 / 60(先条带后镜像)](#6. RAID 50 / 60(先条带后镜像))
- [三、RAID 卡是什么?](#三、RAID 卡是什么?)
- [四、RAID 卡的关键组件详解](#四、RAID 卡的关键组件详解)
-
- [1. 缓存(Cache)](#1. 缓存(Cache))
- [2. 断电保护(BBU / Flash Cache)](#2. 断电保护(BBU / Flash Cache))
- [3. 接口类型](#3. 接口类型)
- [4. RAID 卡的工作模式](#4. RAID 卡的工作模式)
- [五、软 RAID vs 硬 RAID](#五、软 RAID vs 硬 RAID)
-
- [软 RAID](#软 RAID)
- [硬 RAID](#硬 RAID)
- [六、如何选择 RAID 级别?(非常实用)](#六、如何选择 RAID 级别?(非常实用))
-
- [1. 操作系统盘](#1. 操作系统盘)
- [2. 数据库(MySQL / Oracle / SQL Server)](#2. 数据库(MySQL / Oracle / SQL Server))
- [3. 虚拟化(VMware / KVM)](#3. 虚拟化(VMware / KVM))
- [4. 文件服务器 / 共享存储](#4. 文件服务器 / 共享存储)
- [5. 视频监控 / 备份服务器](#5. 视频监控 / 备份服务器)
- [七、如何选择 RAID 卡?](#七、如何选择 RAID 卡?)
- 八、总结(非常重要)
-
- [RAID 技术总结](#RAID 技术总结)
- [RAID 卡总结](#RAID 卡总结)
- 选型建议
- 关键组件网卡
- 了解BMC,BIOS,IBMA之间的关系
-
- [一、 三者分别表示什么?](#一、 三者分别表示什么?)
-
- [1. BIOS (Basic Input/Output System) ------ 基本输入输出系统](#1. BIOS (Basic Input/Output System) —— 基本输入输出系统)
- [2. BMC (Baseboard Management Controller) ------ 基板管理控制器](#2. BMC (Baseboard Management Controller) —— 基板管理控制器)
- [3. iBMA (Intelligent Baseboard Management Adapter) ------ 智能基板管理适配器](#3. iBMA (Intelligent Baseboard Management Adapter) —— 智能基板管理适配器)
- [二、 三者之间的关联关系](#二、 三者之间的关联关系)
- [三、 和 OS(操作系统)的连接是如何的?](#三、 和 OS(操作系统)的连接是如何的?)
-
- [1. BIOS 与 OS 的连接](#1. BIOS 与 OS 的连接)
- [2. BMC 与 OS 的连接(两种通道)](#2. BMC 与 OS 的连接(两种通道))
- 总结图解
- 服务器领域主流CPU
- 参考资料
了解服务器
服务器由计算、存储、传输、管理等关键功能部件组成。
服务器组成:主要由CPU、内存、硬盘三大组成部分,配合电源、主板、机箱等。
服务器的架构图
-
层次图

-
物理架构图


关键组件Raid卡

一、RAID 是什么?为什么服务器必须用?
RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)是一种把多块物理硬盘组合成一个逻辑存储设备的技术。
它的核心目的只有两个:
- 提高性能(多盘并行读写)
- 提高可靠性(通过冗余防止数据丢失)
服务器为什么必须用 RAID?
- 单盘故障率高,一旦坏盘就可能导致业务中断。
- 多盘并行能显著提升 IOPS 和吞吐量。
- 企业级应用(数据库、虚拟化、文件存储)都要求高可用。
二、常见 RAID 级别详解(从原理到适用场景)
下面是服务器最常用的 RAID 级别,我会按"原理 → 优点 → 缺点 → 适用场景"来讲。
1. RAID 0(条带化)
原理:
- 数据被分成块,轮流写入多块硬盘。
- 读写并行,性能最高。
优点:
- 读/写性能最好
- 无容量损失
缺点:
- 无冗余,一块盘坏 → 全部数据丢失
适用场景:
- 对性能要求极高、但对可靠性要求低的场景(如缓存、临时数据)
2. RAID 1(镜像)
原理:
- 两块盘完全一样,写数据时同时写两份。
优点:
- 可靠性高(一块盘坏,另一块还能用)
- 读性能提升(可并行读)
缺点:
- 容量利用率只有 50%
- 写性能略有下降(要写两份)
适用场景:
- 操作系统盘
- 数据库日志盘
- 任何不能丢数据的场景
3. RAID 5(分布式奇偶校验)
原理:
- 数据分成块,分布式存储 + 一块盘的容量用于存奇偶校验信息。
- 允许同时坏 1 块盘。
优点:
- 容量利用率高:(N-1)/N
- 读性能不错
缺点:
- 写性能较差(要计算并写入校验信息)
- 坏盘后重建速度慢,且重建期间性能严重下降
适用场景:
- 容量和性能都要兼顾的场景
- 文件服务器、共享存储
4. RAID 6(双分布式奇偶校验)
原理:
- 与 RAID5 类似,但有两份奇偶校验信息。
- 允许同时坏 2 块盘。
优点:
- 可靠性比 RAID5 高很多
- 容量利用率:(N-2)/N
缺点:
- 写性能更差(要算两份校验)
- 控制器负载更高
适用场景:
- 大容量存储
- 对可靠性要求极高的场景(视频监控、备份服务器)
5. RAID 10(1+0,先镜像后条带)
原理:
- 先做 RAID1 镜像,再把多个镜像组做 RAID0 条带。
- 允许每个镜像组坏一块盘。
优点:
- 读/写性能都非常高
- 可靠性高
缺点:
- 容量利用率只有 50%
适用场景:
- 数据库(OLTP)
- 虚拟化(VMware、KVM)
- 高 IOPS 业务
6. RAID 50 / 60(先条带后镜像)
原理:
- RAID50:多个 RAID5 组再做 RAID0
- RAID60:多个 RAID6 组再做 RAID0
优点:
- 高容量 + 高可靠性 + 较高性能
缺点:
- 实现复杂
- 成本高
适用场景:
- 超大规模存储(企业级存储阵列)
三、RAID 卡是什么?
RAID 卡(RAID Controller)是服务器上负责管理硬盘并实现 RAID 功能的硬件设备。
它有自己的:
- 处理器(ASIC 或 ARM)
- 缓存(Cache)
- 电池或电容(BBU / Flash Cache)
- 接口(SAS / SATA / NVMe)
RAID 卡的作用:
- 接管硬盘,让操作系统看不到物理盘,只看到"逻辑盘"
- 负责数据的条带化、镜像、校验计算
- 提升读写性能(通过 Cache)
- 提供数据保护(断电保护、坏盘重建)
四、RAID 卡的关键组件详解
1. 缓存(Cache)
作用:
- 临时存储读写数据,提升性能
- 写缓存可合并多次小写为一次大写出盘
常见大小:
- 1GB / 2GB / 4GB / 8GB / 16GB
注意:
- 写缓存如果没有断电保护,可能导致数据丢失。
2. 断电保护(BBU / Flash Cache)
BBU(Battery Backup Unit):
- 电池供电,断电后能把 Cache 里的数据写入硬盘
- 电池寿命有限(1--3 年)
Flash Cache(超级电容 + 闪存):
- 电容供电,把 Cache 数据写入板载闪存
- 寿命更长,可靠性更高(现代服务器标配)
3. 接口类型
- SATA:用于普通硬盘(HDD)和消费级 SSD
- SAS:用于企业级 HDD 和 SSD(兼容 SATA)
- NVMe:用于高性能 NVMe SSD(需要 RAID 卡支持 NVMe RAID)
4. RAID 卡的工作模式
-
RAID 模式(RAID Mode)
- 所有硬盘由 RAID 卡管理
- 系统看到的是逻辑盘
-
HBA 模式(Pass-through)
- RAID 卡不做 RAID,只是转发硬盘
- 系统看到的是物理盘
- 常用于软件定义存储(Ceph、ZFS)
-
混合模式
- 部分盘做 RAID,部分盘直通
五、软 RAID vs 硬 RAID
软 RAID
由操作系统实现(mdadm、Windows 动态磁盘)。
优点:
- 免费
- 灵活
缺点:
- 占用 CPU
- 性能差
- 可靠性低(OS 挂了就完了)
适用场景:
- 个人服务器
- 预算有限的场景
硬 RAID
由 RAID 卡硬件实现。
优点:
- 性能高
- 可靠性高
- 有断电保护
- 不占用 CPU
缺点:
- 成本高
适用场景:
- 企业级服务器
- 数据库、虚拟化、存储系统
六、如何选择 RAID 级别?(非常实用)
1. 操作系统盘
推荐:RAID 1
理由:系统盘不能丢,容量小,镜像足够。
2. 数据库(MySQL / Oracle / SQL Server)
推荐:RAID 10
理由:高 IOPS、高可靠性,写性能好。
3. 虚拟化(VMware / KVM)
推荐:RAID 10
理由:虚拟机密集读写,IOPS 要求高。
4. 文件服务器 / 共享存储
推荐:RAID 5 或 RAID 6
理由:容量利用率高,读多写少。
5. 视频监控 / 备份服务器
推荐:RAID 6
理由:大容量 + 允许坏两块盘。
七、如何选择 RAID 卡?
关键看这几个指标:
- 接口:SAS / SATA / NVMe
- 支持的 RAID 级别:至少 RAID 0/1/5/6/10
- 缓存大小:越大越好(至少 1GB)
- 是否有断电保护:必须有(BBU 或 Flash Cache)
- 是否支持 NVMe RAID(如果用 NVMe SSD)
- 是否支持 HBA 模式(如果未来要做 Ceph/ZFS)
常见品牌:
- LSI / Broadcom(最主流)
- Adaptec
- HP Smart Array
- Dell PERC
八、总结(非常重要)
RAID 技术总结
- RAID 0:性能最高,无冗余
- RAID 1:镜像,高可靠
- RAID 5:分布式校验,容量利用率高
- RAID 6:双校验,允许坏两块盘
- RAID 10:性能 + 可靠性最佳组合
RAID 卡总结
- 是服务器存储的核心硬件
- 提供 RAID 管理、缓存、断电保护
- 分 SAS/SATA/NVMe 接口
- 可工作在 RAID 模式或 HBA 模式
选型建议
- 系统盘:RAID 1
- 数据库/虚拟化:RAID 10
- 文件服务器:RAID 5/6
- 大容量存储:RAID 6 或 RAID 60
关键组件网卡
定义: 网卡(Network Interface Card,简称NIC),也称网络适配器,是服务器与局域网相互连接的设备,只要连接到局域网,就都需要安装一块网卡。

了解BMC,BIOS,IBMA之间的关系
简单来说,BIOS 是"开机引导员",BMC 是"带外管家",而 iBMA 是"管家与操作系统的翻译官"。
以下是详细的解释、关联关系以及与 OS(操作系统)的连接方式:
一、 三者分别表示什么?
1. BIOS (Basic Input/Output System) ------ 基本输入输出系统
- 角色:固件(Firmware),电脑的"底层引导程序"。
- 作用 :
- 硬件自检 (POST):开机时检查CPU、内存、硬盘等硬件是否正常。
- 引导操作系统:在硬件准备好后,找到硬盘上的操作系统(如 Windows/Linux)并启动它。
- 硬件配置:提供一个界面(Setup Utility)让管理员配置CPU频率、内存映射、启动顺序等。
- 特点 :运行在主板的 ROM/Flash 芯片中,必须依赖主机 CPU 和内存才能运行。一旦操作系统启动,BIOS 的大部分任务就完成了(转为 Runtime 服务)。
2. BMC (Baseboard Management Controller) ------ 基板管理控制器
- 角色:独立的微控制器(单片机),服务器的"黑匣子"或"带外管理卡"。
- 作用 :
- 独立监控 :它有自己独立的 CPU、内存、闪存和网络接口。即使服务器断电(只要插了电源线)或死机,BMC 依然在运行。
- 远程控制:通过网络(IPMI协议)远程开机、关机、重启、重装系统(KVM over IP)。
- 健康监控:实时监控温度、电压、风扇转速,当温度过高时自动调节风扇或报警。
- 常见实例 :HP iLO, Dell iDRAC, 华为 iBMC (注意:华为的 BMC 产品通常直接称为 iBMC)。
3. iBMA (Intelligent Baseboard Management Adapter) ------ 智能基板管理适配器
- 角色 :软件代理(Agent),通常指华为服务器配套的管理软件(iBMA2 或 iBMA3)。
- 作用 :
- 桥梁作用 :它是运行在 OS(操作系统)内部 的一个服务程序。
- 信息交互:它读取 OS 内部的信息(如操作系统的运行状态、进程负载),并把这些信息通过驱动或接口传给 BMC。
- 反向控制:让管理员可以通过 BMC 的网页界面或命令行,间接查看和管理 OS 内部的部分状态(如查看 OS 日志、收集故障信息)。
- 注意:iBMA 是华为特有的一套管理工具集,其他厂商也有类似的 Agent(如 Dell OMSA),但 iBMA 是针对华为服务器优化的。
二、 三者之间的关联关系
这三者构成了服务器从硬件到软件的完整管理链条:
-
BIOS 与 BMC 的关系(兄弟/协作关系):
- 物理共存:它们都在主板上,但各自独立。
- 信息交互 :
- BMC 控制 BIOS:BMC 可以发送信号让 BIOS 重启(Reset),或者强制主机断电。
- BIOS 通知 BMC:BIOS 在开机自检(POST)时,如果发现硬件错误(如内存坏了),会把错误代码写入 BMC 的 SEL(System Event Log)日志中,让管理员即使没看到屏幕也能知道哪里坏了。
- 配置联动:在华为服务器中,BIOS 的某些配置(如电源策略)可以通过 iBMC 的界面进行远程配置,iBMC 会将这些配置下发给 BIOS。
-
BMC 与 iBMA 的关系(主从/客户端-服务器关系):
- iBMA 依赖 BMC:iBMA 是跑在 OS 里的,它需要知道 BMC 的地址和凭据才能连接。
- 数据上传:iBMA 就像一个"间谍"或"信使",它把 OS 里的软件层面的健康状况(比如某个进程挂了)打包,通过内部通道(通常是系统总线或虚拟网卡)发给 BMC。
- BMC 展示:BMC 收到后,将这些信息整合到自己的 Web 界面或通过 IPMI 命令暴露给远程管理平台(如华为的 eSight)。
-
BIOS 与 iBMA 的关系(间接关系):
- 它们之间没有直接通信。iBMA 主要关注 OS 运行时的状态,而 BIOS 关注启动过程。
三、 和 OS(操作系统)的连接是如何的?
这是运维中最关心的部分,我们可以把连接分为 "带外通道" (不经过 OS)和 "带内通道"(经过 OS)。
1. BIOS 与 OS 的连接
- 连接时机:启动阶段。
- 连接方式 :
- 启动引导:BIOS 通过 MBR 或 UEFI 协议找到硬盘上的 Bootloader(如 Grub),然后将控制权交给 OS 内核。
- 硬件抽象:启动后,OS 会加载设备驱动程序来接管硬件,此时 BIOS 退居二线,仅提供一些底层的 Runtime 服务(如 ACPI 电源管理)。
2. BMC 与 OS 的连接(两种通道)
BMC 与 OS 的交互非常关键,分为两条路:
-
路径 A:带外通道 (Out-of-Band) ------ 最常用,不依赖 OS
- 连接方式:通过物理网络(网线)。
- 原理:BMC 有自己独立的网口(或共享网卡的一个 VLAN)。管理员的电脑通过交换机直接访问 BMC 的 IP 地址。
- 特点 :OS 死机了也能用。你可以通过浏览器打开 BMC 的网页,看到服务器虽然死机了,但风扇还在转,温度是多少。
- 协议:IPMI, Redfish, HTTPS。
-
路径 B:带内通道 (In-Band) ------ 依赖 OS 和 iBMA
- 连接方式:通过主板内部总线(如 I2C, SMBus, PCIe 或虚拟 KCS 接口)。
- 原理:这是 OS 内核与 BMC 芯片直接对话的通道。
- iBMA 的作用 :
- 你在 OS 里安装了 iBMA 软件。
- iBMA 作为一个后台服务,通过带内驱动(如 OpenIPMI 驱动)连接到 BMC。
- iBMA 将 OS 的性能数据(CPU 使用率、内存使用率)推送给 BMC。
- 管理员通过 BMC 的网页(带外)查看这些数据,实现了"管硬件的同时也能管软件"。
总结图解
text
[ 远程管理端 (笔记本/管理平台) ]
|
| 1. 网络 (IPMI/HTTP) - 带外管理 (OS挂了也能用)
v
[ BMC (iBMC) 芯片 ]
|
+-- 2. 内部总线 (KCS/SMBus) ---> [ OS 内核 (驱动层) ]
| |
| | 3. 本地通信
v v
[ BIOS 固件 ] [ iBMA 软件 (Agent) ]
| |
+-- 4. 启动交接 --------------------> [ 应用程序 ]
一句话总结:
BIOS 负责把 OS 拉起来;BMC 负责在 OS 外面盯着硬件和远程控制;iBMA 负责安装在 OS 里面,把 OS 的状态告诉 BMC,让 BMC 能统管软硬件。
服务器领域主流CPU
服务器领域主流CPU厂商按市场份额与技术影响力,可分为x86、ARM、自主架构及其他阵营,以下是2026年初的核心厂商与关键信息:
| 厂商 | 架构 | 核心产品线 | 市场定位 | 核心优势 |
|---|---|---|---|---|
| 英特尔(Intel) | x86 | Xeon Scalable(5代Emerald Rapids) | 全球服务器CPU主导,份额约72% | 生态成熟、稳定性强,DL Boost加速AI,支持CXL 3.0 |
| 超威半导体(AMD) | x86 | EPYC(9004 Genoa/8004 Siena) | x86市场第二,份额约28% | 高核心密度、大缓存,PCIe 5.0通道多,性价比突出 |
| 华为 | ARMv9 | 鲲鹏(Kunpeng)930系列 | 国产服务器主力 | 自主ARM架构,多核并发优,适配openEuler等国产OS |
| 安晟培(Ampere) | ARM Neoverse | Altra/Max系列 | 云原生与边缘计算 | 高核心密度、低功耗,无超线程设计,适合容器化 |
| 龙芯 | LoongArch | 3C6000系列 | 自主可控服务器 | 自主指令集,龙链互联,适配党政、金融等国产化场景 |
| IBM | Power | Power10/Power11 | 关键业务与大型机 | 高可靠性、垂直整合,适合金融核心系统与高性能计算 |
| 海光 | x86 | 海光三号/四号 | 国产x86服务器 | 兼容x86生态,性能对标主流,适合企业级应用国产化 |
| 兆芯 | x86 | 开胜系列 | 国产x86服务器 | 自主x86指令集,兼容传统软件,覆盖通用服务器场景 |
| 亚马逊云科技(AWS) | ARM Neoverse | Graviton 4 | 云定制服务器 | 为AWS云优化,能效比高,适合云原生与微服务 |
阵营补充说明
- x86阵营:Intel与AMD长期主导,生态成熟,是企业级服务器的主流选择。
- ARM阵营:华为、Ampere、AWS等快速崛起,凭借低功耗与高能效,在云与边缘场景增长迅速。
- 自主架构:龙芯(LoongArch)、IBM(Power)等,分别面向自主可控与关键业务的高可靠需求。
- 国产x86:海光、兆芯等填补国内x86服务器CPU空白,适配国产化替代场景。