服务器介绍

文章目录

  • 了解服务器
    • 服务器的架构图
    • 关键组件Raid卡
      • [一、RAID 是什么?为什么服务器必须用?](#一、RAID 是什么?为什么服务器必须用?)
      • [二、常见 RAID 级别详解(从原理到适用场景)](#二、常见 RAID 级别详解(从原理到适用场景))
        • [1. RAID 0(条带化)](#1. RAID 0(条带化))
        • [2. RAID 1(镜像)](#2. RAID 1(镜像))
        • [3. RAID 5(分布式奇偶校验)](#3. RAID 5(分布式奇偶校验))
        • [4. RAID 6(双分布式奇偶校验)](#4. RAID 6(双分布式奇偶校验))
        • [5. RAID 10(1+0,先镜像后条带)](#5. RAID 10(1+0,先镜像后条带))
        • [6. RAID 50 / 60(先条带后镜像)](#6. RAID 50 / 60(先条带后镜像))
      • [三、RAID 卡是什么?](#三、RAID 卡是什么?)
      • [四、RAID 卡的关键组件详解](#四、RAID 卡的关键组件详解)
        • [1. 缓存(Cache)](#1. 缓存(Cache))
        • [2. 断电保护(BBU / Flash Cache)](#2. 断电保护(BBU / Flash Cache))
        • [3. 接口类型](#3. 接口类型)
        • [4. RAID 卡的工作模式](#4. RAID 卡的工作模式)
      • [五、软 RAID vs 硬 RAID](#五、软 RAID vs 硬 RAID)
        • [软 RAID](#软 RAID)
        • [硬 RAID](#硬 RAID)
      • [六、如何选择 RAID 级别?(非常实用)](#六、如何选择 RAID 级别?(非常实用))
        • [1. 操作系统盘](#1. 操作系统盘)
        • [2. 数据库(MySQL / Oracle / SQL Server)](#2. 数据库(MySQL / Oracle / SQL Server))
        • [3. 虚拟化(VMware / KVM)](#3. 虚拟化(VMware / KVM))
        • [4. 文件服务器 / 共享存储](#4. 文件服务器 / 共享存储)
        • [5. 视频监控 / 备份服务器](#5. 视频监控 / 备份服务器)
      • [七、如何选择 RAID 卡?](#七、如何选择 RAID 卡?)
      • 八、总结(非常重要)
        • [RAID 技术总结](#RAID 技术总结)
        • [RAID 卡总结](#RAID 卡总结)
        • 选型建议
    • 关键组件网卡
    • 了解BMC,BIOS,IBMA之间的关系
      • [一、 三者分别表示什么?](#一、 三者分别表示什么?)
        • [1. BIOS (Basic Input/Output System) ------ 基本输入输出系统](#1. BIOS (Basic Input/Output System) —— 基本输入输出系统)
        • [2. BMC (Baseboard Management Controller) ------ 基板管理控制器](#2. BMC (Baseboard Management Controller) —— 基板管理控制器)
        • [3. iBMA (Intelligent Baseboard Management Adapter) ------ 智能基板管理适配器](#3. iBMA (Intelligent Baseboard Management Adapter) —— 智能基板管理适配器)
      • [二、 三者之间的关联关系](#二、 三者之间的关联关系)
      • [三、 和 OS(操作系统)的连接是如何的?](#三、 和 OS(操作系统)的连接是如何的?)
        • [1. BIOS 与 OS 的连接](#1. BIOS 与 OS 的连接)
        • [2. BMC 与 OS 的连接(两种通道)](#2. BMC 与 OS 的连接(两种通道))
      • 总结图解
  • 服务器领域主流CPU
  • 参考资料

了解服务器

服务器由计算、存储、传输、管理等关键功能部件组成。
服务器组成:主要由CPU、内存、硬盘三大组成部分,配合电源、主板、机箱等。

服务器的架构图

  • 层次图

  • 物理架构图

关键组件Raid卡


一、RAID 是什么?为什么服务器必须用?

RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)是一种把多块物理硬盘组合成一个逻辑存储设备的技术。

它的核心目的只有两个:

  1. 提高性能(多盘并行读写)
  2. 提高可靠性(通过冗余防止数据丢失)

服务器为什么必须用 RAID?

  • 单盘故障率高,一旦坏盘就可能导致业务中断。
  • 多盘并行能显著提升 IOPS 和吞吐量。
  • 企业级应用(数据库、虚拟化、文件存储)都要求高可用。

二、常见 RAID 级别详解(从原理到适用场景)

下面是服务器最常用的 RAID 级别,我会按"原理 → 优点 → 缺点 → 适用场景"来讲。


1. RAID 0(条带化)

原理:

  • 数据被分成块,轮流写入多块硬盘。
  • 读写并行,性能最高。

优点:

  • 读/写性能最好
  • 无容量损失

缺点:

  • 无冗余,一块盘坏 → 全部数据丢失

适用场景:

  • 对性能要求极高、但对可靠性要求低的场景(如缓存、临时数据)

2. RAID 1(镜像)

原理:

  • 两块盘完全一样,写数据时同时写两份。

优点:

  • 可靠性高(一块盘坏,另一块还能用)
  • 读性能提升(可并行读)

缺点:

  • 容量利用率只有 50%
  • 写性能略有下降(要写两份)

适用场景:

  • 操作系统盘
  • 数据库日志盘
  • 任何不能丢数据的场景

3. RAID 5(分布式奇偶校验)

原理:

  • 数据分成块,分布式存储 + 一块盘的容量用于存奇偶校验信息。
  • 允许同时坏 1 块盘。

优点:

  • 容量利用率高:(N-1)/N
  • 读性能不错

缺点:

  • 写性能较差(要计算并写入校验信息)
  • 坏盘后重建速度慢,且重建期间性能严重下降

适用场景:

  • 容量和性能都要兼顾的场景
  • 文件服务器、共享存储

4. RAID 6(双分布式奇偶校验)

原理:

  • 与 RAID5 类似,但有两份奇偶校验信息。
  • 允许同时坏 2 块盘。

优点:

  • 可靠性比 RAID5 高很多
  • 容量利用率:(N-2)/N

缺点:

  • 写性能更差(要算两份校验)
  • 控制器负载更高

适用场景:

  • 大容量存储
  • 对可靠性要求极高的场景(视频监控、备份服务器)

5. RAID 10(1+0,先镜像后条带)

原理:

  • 先做 RAID1 镜像,再把多个镜像组做 RAID0 条带。
  • 允许每个镜像组坏一块盘。

优点:

  • 读/写性能都非常高
  • 可靠性高

缺点:

  • 容量利用率只有 50%

适用场景:

  • 数据库(OLTP)
  • 虚拟化(VMware、KVM)
  • 高 IOPS 业务

6. RAID 50 / 60(先条带后镜像)

原理:

  • RAID50:多个 RAID5 组再做 RAID0
  • RAID60:多个 RAID6 组再做 RAID0

优点:

  • 高容量 + 高可靠性 + 较高性能

缺点:

  • 实现复杂
  • 成本高

适用场景:

  • 超大规模存储(企业级存储阵列)

三、RAID 卡是什么?

RAID 卡(RAID Controller)是服务器上负责管理硬盘并实现 RAID 功能的硬件设备

它有自己的:

  • 处理器(ASIC 或 ARM)
  • 缓存(Cache)
  • 电池或电容(BBU / Flash Cache)
  • 接口(SAS / SATA / NVMe)

RAID 卡的作用:

  • 接管硬盘,让操作系统看不到物理盘,只看到"逻辑盘"
  • 负责数据的条带化、镜像、校验计算
  • 提升读写性能(通过 Cache)
  • 提供数据保护(断电保护、坏盘重建)

四、RAID 卡的关键组件详解

1. 缓存(Cache)

作用:

  • 临时存储读写数据,提升性能
  • 写缓存可合并多次小写为一次大写出盘

常见大小:

  • 1GB / 2GB / 4GB / 8GB / 16GB

注意:

  • 写缓存如果没有断电保护,可能导致数据丢失。

2. 断电保护(BBU / Flash Cache)

BBU(Battery Backup Unit):

  • 电池供电,断电后能把 Cache 里的数据写入硬盘
  • 电池寿命有限(1--3 年)

Flash Cache(超级电容 + 闪存):

  • 电容供电,把 Cache 数据写入板载闪存
  • 寿命更长,可靠性更高(现代服务器标配)

3. 接口类型
  • SATA:用于普通硬盘(HDD)和消费级 SSD
  • SAS:用于企业级 HDD 和 SSD(兼容 SATA)
  • NVMe:用于高性能 NVMe SSD(需要 RAID 卡支持 NVMe RAID)

4. RAID 卡的工作模式
  1. RAID 模式(RAID Mode)

    • 所有硬盘由 RAID 卡管理
    • 系统看到的是逻辑盘
  2. HBA 模式(Pass-through)

    • RAID 卡不做 RAID,只是转发硬盘
    • 系统看到的是物理盘
    • 常用于软件定义存储(Ceph、ZFS)
  3. 混合模式

    • 部分盘做 RAID,部分盘直通

五、软 RAID vs 硬 RAID

软 RAID

由操作系统实现(mdadm、Windows 动态磁盘)。

优点:

  • 免费
  • 灵活

缺点:

  • 占用 CPU
  • 性能差
  • 可靠性低(OS 挂了就完了)

适用场景:

  • 个人服务器
  • 预算有限的场景

硬 RAID

由 RAID 卡硬件实现。

优点:

  • 性能高
  • 可靠性高
  • 有断电保护
  • 不占用 CPU

缺点:

  • 成本高

适用场景:

  • 企业级服务器
  • 数据库、虚拟化、存储系统

六、如何选择 RAID 级别?(非常实用)

1. 操作系统盘

推荐:RAID 1

理由:系统盘不能丢,容量小,镜像足够。


2. 数据库(MySQL / Oracle / SQL Server)

推荐:RAID 10

理由:高 IOPS、高可靠性,写性能好。


3. 虚拟化(VMware / KVM)

推荐:RAID 10

理由:虚拟机密集读写,IOPS 要求高。


4. 文件服务器 / 共享存储

推荐:RAID 5 或 RAID 6

理由:容量利用率高,读多写少。


5. 视频监控 / 备份服务器

推荐:RAID 6

理由:大容量 + 允许坏两块盘。


七、如何选择 RAID 卡?

关键看这几个指标:

  1. 接口:SAS / SATA / NVMe
  2. 支持的 RAID 级别:至少 RAID 0/1/5/6/10
  3. 缓存大小:越大越好(至少 1GB)
  4. 是否有断电保护:必须有(BBU 或 Flash Cache)
  5. 是否支持 NVMe RAID(如果用 NVMe SSD)
  6. 是否支持 HBA 模式(如果未来要做 Ceph/ZFS)

常见品牌:

  • LSI / Broadcom(最主流)
  • Adaptec
  • HP Smart Array
  • Dell PERC

八、总结(非常重要)

RAID 技术总结
  • RAID 0:性能最高,无冗余
  • RAID 1:镜像,高可靠
  • RAID 5:分布式校验,容量利用率高
  • RAID 6:双校验,允许坏两块盘
  • RAID 10:性能 + 可靠性最佳组合
RAID 卡总结
  • 是服务器存储的核心硬件
  • 提供 RAID 管理、缓存、断电保护
  • 分 SAS/SATA/NVMe 接口
  • 可工作在 RAID 模式或 HBA 模式
选型建议
  • 系统盘:RAID 1
  • 数据库/虚拟化:RAID 10
  • 文件服务器:RAID 5/6
  • 大容量存储:RAID 6 或 RAID 60

关键组件网卡

定义: 网卡(Network Interface Card,简称NIC),也称网络适配器,是服务器与局域网相互连接的设备,只要连接到局域网,就都需要安装一块网卡。

了解BMC,BIOS,IBMA之间的关系

简单来说,BIOS 是"开机引导员",BMC 是"带外管家",而 iBMA 是"管家与操作系统的翻译官"。

以下是详细的解释、关联关系以及与 OS(操作系统)的连接方式:


一、 三者分别表示什么?

1. BIOS (Basic Input/Output System) ------ 基本输入输出系统
  • 角色:固件(Firmware),电脑的"底层引导程序"。
  • 作用
    • 硬件自检 (POST):开机时检查CPU、内存、硬盘等硬件是否正常。
    • 引导操作系统:在硬件准备好后,找到硬盘上的操作系统(如 Windows/Linux)并启动它。
    • 硬件配置:提供一个界面(Setup Utility)让管理员配置CPU频率、内存映射、启动顺序等。
  • 特点 :运行在主板的 ROM/Flash 芯片中,必须依赖主机 CPU 和内存才能运行。一旦操作系统启动,BIOS 的大部分任务就完成了(转为 Runtime 服务)。
2. BMC (Baseboard Management Controller) ------ 基板管理控制器
  • 角色:独立的微控制器(单片机),服务器的"黑匣子"或"带外管理卡"。
  • 作用
    • 独立监控 :它有自己独立的 CPU、内存、闪存和网络接口。即使服务器断电(只要插了电源线)或死机,BMC 依然在运行。
    • 远程控制:通过网络(IPMI协议)远程开机、关机、重启、重装系统(KVM over IP)。
    • 健康监控:实时监控温度、电压、风扇转速,当温度过高时自动调节风扇或报警。
  • 常见实例 :HP iLO, Dell iDRAC, 华为 iBMC (注意:华为的 BMC 产品通常直接称为 iBMC)。
3. iBMA (Intelligent Baseboard Management Adapter) ------ 智能基板管理适配器
  • 角色软件代理(Agent),通常指华为服务器配套的管理软件(iBMA2 或 iBMA3)。
  • 作用
    • 桥梁作用 :它是运行在 OS(操作系统)内部 的一个服务程序。
    • 信息交互:它读取 OS 内部的信息(如操作系统的运行状态、进程负载),并把这些信息通过驱动或接口传给 BMC。
    • 反向控制:让管理员可以通过 BMC 的网页界面或命令行,间接查看和管理 OS 内部的部分状态(如查看 OS 日志、收集故障信息)。
  • 注意:iBMA 是华为特有的一套管理工具集,其他厂商也有类似的 Agent(如 Dell OMSA),但 iBMA 是针对华为服务器优化的。

二、 三者之间的关联关系

这三者构成了服务器从硬件到软件的完整管理链条:

  1. BIOS 与 BMC 的关系(兄弟/协作关系):

    • 物理共存:它们都在主板上,但各自独立。
    • 信息交互
      • BMC 控制 BIOS:BMC 可以发送信号让 BIOS 重启(Reset),或者强制主机断电。
      • BIOS 通知 BMC:BIOS 在开机自检(POST)时,如果发现硬件错误(如内存坏了),会把错误代码写入 BMC 的 SEL(System Event Log)日志中,让管理员即使没看到屏幕也能知道哪里坏了。
      • 配置联动:在华为服务器中,BIOS 的某些配置(如电源策略)可以通过 iBMC 的界面进行远程配置,iBMC 会将这些配置下发给 BIOS。
  2. BMC 与 iBMA 的关系(主从/客户端-服务器关系):

    • iBMA 依赖 BMC:iBMA 是跑在 OS 里的,它需要知道 BMC 的地址和凭据才能连接。
    • 数据上传:iBMA 就像一个"间谍"或"信使",它把 OS 里的软件层面的健康状况(比如某个进程挂了)打包,通过内部通道(通常是系统总线或虚拟网卡)发给 BMC。
    • BMC 展示:BMC 收到后,将这些信息整合到自己的 Web 界面或通过 IPMI 命令暴露给远程管理平台(如华为的 eSight)。
  3. BIOS 与 iBMA 的关系(间接关系):

    • 它们之间没有直接通信。iBMA 主要关注 OS 运行时的状态,而 BIOS 关注启动过程。

三、 和 OS(操作系统)的连接是如何的?

这是运维中最关心的部分,我们可以把连接分为 "带外通道" (不经过 OS)和 "带内通道"(经过 OS)。

1. BIOS 与 OS 的连接
  • 连接时机:启动阶段。
  • 连接方式
    • 启动引导:BIOS 通过 MBR 或 UEFI 协议找到硬盘上的 Bootloader(如 Grub),然后将控制权交给 OS 内核。
    • 硬件抽象:启动后,OS 会加载设备驱动程序来接管硬件,此时 BIOS 退居二线,仅提供一些底层的 Runtime 服务(如 ACPI 电源管理)。
2. BMC 与 OS 的连接(两种通道)

BMC 与 OS 的交互非常关键,分为两条路:

  • 路径 A:带外通道 (Out-of-Band) ------ 最常用,不依赖 OS

    • 连接方式:通过物理网络(网线)。
    • 原理:BMC 有自己独立的网口(或共享网卡的一个 VLAN)。管理员的电脑通过交换机直接访问 BMC 的 IP 地址。
    • 特点OS 死机了也能用。你可以通过浏览器打开 BMC 的网页,看到服务器虽然死机了,但风扇还在转,温度是多少。
    • 协议:IPMI, Redfish, HTTPS。
  • 路径 B:带内通道 (In-Band) ------ 依赖 OS 和 iBMA

    • 连接方式:通过主板内部总线(如 I2C, SMBus, PCIe 或虚拟 KCS 接口)。
    • 原理:这是 OS 内核与 BMC 芯片直接对话的通道。
    • iBMA 的作用
      1. 你在 OS 里安装了 iBMA 软件
      2. iBMA 作为一个后台服务,通过带内驱动(如 OpenIPMI 驱动)连接到 BMC。
      3. iBMA 将 OS 的性能数据(CPU 使用率、内存使用率)推送给 BMC。
      4. 管理员通过 BMC 的网页(带外)查看这些数据,实现了"管硬件的同时也能管软件"。

总结图解

text 复制代码
 [ 远程管理端 (笔记本/管理平台) ]
          |
          | 1. 网络 (IPMI/HTTP) - 带外管理 (OS挂了也能用)
          v
    [ BMC (iBMC) 芯片 ]
          |
          +-- 2. 内部总线 (KCS/SMBus) ---> [ OS 内核 (驱动层) ]
          |                                      |
          |                                      | 3. 本地通信
          v                                      v
    [ BIOS 固件 ]                          [ iBMA 软件 (Agent) ]
          |                                      |
          +-- 4. 启动交接 --------------------> [ 应用程序 ]

一句话总结:
BIOS 负责把 OS 拉起来;BMC 负责在 OS 外面盯着硬件和远程控制;iBMA 负责安装在 OS 里面,把 OS 的状态告诉 BMC,让 BMC 能统管软硬件。

服务器领域主流CPU

服务器领域主流CPU厂商按市场份额与技术影响力,可分为x86、ARM、自主架构及其他阵营,以下是2026年初的核心厂商与关键信息:

厂商 架构 核心产品线 市场定位 核心优势
英特尔(Intel) x86 Xeon Scalable(5代Emerald Rapids) 全球服务器CPU主导,份额约72% 生态成熟、稳定性强,DL Boost加速AI,支持CXL 3.0
超威半导体(AMD) x86 EPYC(9004 Genoa/8004 Siena) x86市场第二,份额约28% 高核心密度、大缓存,PCIe 5.0通道多,性价比突出
华为 ARMv9 鲲鹏(Kunpeng)930系列 国产服务器主力 自主ARM架构,多核并发优,适配openEuler等国产OS
安晟培(Ampere) ARM Neoverse Altra/Max系列 云原生与边缘计算 高核心密度、低功耗,无超线程设计,适合容器化
龙芯 LoongArch 3C6000系列 自主可控服务器 自主指令集,龙链互联,适配党政、金融等国产化场景
IBM Power Power10/Power11 关键业务与大型机 高可靠性、垂直整合,适合金融核心系统与高性能计算
海光 x86 海光三号/四号 国产x86服务器 兼容x86生态,性能对标主流,适合企业级应用国产化
兆芯 x86 开胜系列 国产x86服务器 自主x86指令集,兼容传统软件,覆盖通用服务器场景
亚马逊云科技(AWS) ARM Neoverse Graviton 4 云定制服务器 为AWS云优化,能效比高,适合云原生与微服务

阵营补充说明

  1. x86阵营:Intel与AMD长期主导,生态成熟,是企业级服务器的主流选择。
  2. ARM阵营:华为、Ampere、AWS等快速崛起,凭借低功耗与高能效,在云与边缘场景增长迅速。
  3. 自主架构:龙芯(LoongArch)、IBM(Power)等,分别面向自主可控与关键业务的高可靠需求。
  4. 国产x86:海光、兆芯等填补国内x86服务器CPU空白,适配国产化替代场景。

参考资料

相关推荐
小鸡脚来咯2 小时前
Linux 服务器问题排查指南(面试标准回答)
linux·服务器·面试
末日汐2 小时前
磁盘与文件系统
linux·运维·数据库
夏沫mds2 小时前
基于hyperledger fabric的葡萄酒溯源系统
运维·fabric
小李独爱秋2 小时前
计算机网络经典问题透视:电子邮件的安全协议PGP主要都包含哪些措施?
运维·服务器·网络·网络协议·计算机网络·安全
小李独爱秋2 小时前
计算机网络经典问题透视:互联网的网络层安全协议族IPsec都包含哪些主要协议?
运维·服务器·开发语言·网络协议·计算机网络·安全
牛奔2 小时前
Docker Compose 解决服务间 DNS 解析失败问题
运维·docker·容器
OpsEye3 小时前
监控 100 问(三):监控告警触发后如何快速定位与解决问题
运维·网络·it运维·it·监控·监控系统
线束线缆组件品替网3 小时前
Conxall 防水线缆在户外工控中的布线实践
运维·人工智能·汽车·电脑·材料工程·智能电视
济6173 小时前
linux(第十四期)--官方 SDK 移植实验-- Ubuntu20.04
linux·运维·服务器