一、介绍
1.1 CPU(Central Processing Unit,中央处理器)

1.1.1 定义
指任何计算机系统中的核心处理单元,是计算机系统的核心部件,负责执行指令、算术逻辑运算等。
1.2 MCU(Microcontroller Unit,微控制器)

1.2.1 定义
以「CPU 核心」为基础,高度集成了「Flash(程序存储)、RAM(数据存储)、外设(UART/SPI/I2C 等)」的「单芯片解决方案」,目标是 "单芯片完成小型控制任务"。(或者:一种将计算机的基本组成部分集成到一块芯片上的微型计算机系统,在片上就集成了中央处理器、输入输出I/O、ROM、RAM等外设)
1.3 MPU(Microprocessor Unit,微处理器)
1.3.1 定义
以「高性能 CPU 核心」为基础,无内置 Flash/RAM/ 关键外设,需外接「DDR 内存、外部存储(eMMC/NOR Flash)、外设芯片」才能工作的「嵌入式处理器」------ 本质是 "面向复杂应用的高性能 CPU"。
(或则说:与CPU很相似,但又有所区别,是CPU的一种实现形式,只包含CPU的核心功能)
1.3.2 核心特征
**(1)低集成度:**仅含 CPU 核心(如 ARM Cortex-A 系列),无内置存储和关键外设,依赖外部硬件扩展;
**(2)高性能:**支持复杂操作系统(Linux、Android),能运行大型应用(如 Qt 界面、视频解码);
**(3)行业习惯:**现代 MPU 已普遍集成大量外设(如网口、USB),本质已是 SoC,但行业仍习惯称其为 "MPU"(如 NXP 官方称 IMX6ULL 为 "MPU")。
1.3.3 应用场景
侧重于数据处理和执行指令,适用于对计算性能要求很高的场景,具体应用与CPU重合,可以这么理解,MPU是CPU的子集。
1.4 SoC(System on Chip,片上系统)

1.4.1 定义
以「CPU/MPU/MCU 核心」为基础,高度集成了「内存控制器、存储接口、外设(网口 / USB/CAN)、专用模块(DSP/GPU)」的「单芯片系统」------ 本质是 "把整个电路板的核心功能集成到一颗芯片上",仅需少量外接元件(如 DDR、电源)即可工作。
1.4.2 核心特征
**(1)超高集成度:**集成核心运算单元 + 外设 + 控制器 + 专用模块(如 IMX6ULL 集成 Cortex-A7+DDR 控制器 + 网口 + USB+CAN);
**(2)灵活性:**核心可是 MCU(如 STM32H7,Cortex-M7 核心,集成 2MB Flash)、MPU(如 IMX6ULL,Cortex-A7 核心),甚至集成多个核心(如异构多核 SoC:CPU+DSP+GPU);
**(3)现代主流:**当前嵌入式芯片 90% 以上是 SoC(包括高端 MCU 和 MPU),核心优势是 "缩小体积、降低成本、提升稳定性"。
1.4.3 典型芯片 & 实战场景
**(1)芯片例子:**IMX6ULL(Cortex-A7,无内置 Flash/RAM,需外接 DDR3L 和 eMMC)、S3C2440(Cortex-A4)、TI AM335x;
**(2)应用场景:**遥控器、传感器节点、小型家电(如风扇控制板)、工业继电器控制、智能门锁 ------ 核心是 "低成本、小体积、简单控制"。
1.5 DSP(Digital Signal Processor,数字信号处理器)

1.5.1 定义
专门针对「数字信号处理任务」优化的「专用处理器」,核心优势是 "高速并行运算、实时性强",适合处理连续的信号数据(如音频、视频、传感器信号)。
1.5.2 核心特征
**(1)专用指令集:**支持单周期乘法 - 累加(MAC)、循环缓冲、DMA 传输,专为信号处理设计;
**(2)实时性:**低延迟,适合对时间敏感的任务(如音频降噪、电机控制算法);
**(3)存在形式:**可作为独立芯片,或集成在 SoC 中(如手机芯片、车载 SoC 的内置 DSP)。
1.5.3 典型芯片 & 实战场景
**(1)芯片例子:**TI TMS320C2000(电机控制)、ADI ADSP-21489(音频处理)、手机 SoC 内置 DSP(如骁龙的 Hexagon DSP);
**(2)应用场景:**工业:电机矢量控制、变频器、雷达信号处理;消费电子:音频降噪(耳机)、视频编码解码(摄像头);汽车:车载音响、ADAS(高级驾驶辅助系统)的信号处理。
1.6 FPGA(Field-Programmable Gate Array,现场可编程门阵列)

1.6.1 定义
由「大量可编程逻辑单元(LUT)、触发器、IO 接口」组成的「硬件可重构芯片」------ 核心优势是 "硬件逻辑可定制",用户可通过 HDL 语言(Verilog/VHDL)定义芯片内部的电路连接,实现任意数字逻辑功能。
1.6.2 核心特征
**(1)硬件可编程:**不是执行软件指令,而是通过配置 "硬件电路" 来实现功能,配置后相当于 "定制化芯片";
**(2)并行性:**所有逻辑单元同时工作,适合超高吞吐量的任务(如 10Gbps 网络转发、实时视频处理);
**(3)灵活性:**可反复擦写配置(断电丢失,需重新加载配置文件),适合快速原型验证和定制化场景。
1.6.3 典型芯片 & 实战场景
**(1)芯片例子:**Xilinx Artix-7、Altera Cyclone V、Zynq-7000(FPGA+ARM Cortex-A9 SoC);
**(2)应用场景:**工业:高速数据采集(如 1MHz 传感器采样)、PLC(可编程逻辑控制器)、工业总线协议解析;通信:5G 基站信号处理、网络交换机芯片;研发:芯片原型验证(新芯片设计前,先用 FPGA 验证逻辑)。
1.7 GPU(Graphics Processing Unit,图形处理器)

1.7.1 定义
专门针对「图形渲染」优化的「专用处理器」,核心优势是 "大规模并行运算"------ 最初用于 3D 图形绘制,现在广泛用于并行计算任务(如 AI 推理、视频编码)。
1.7.2 核心特征
**(1)并行架构:**包含上千个小型运算核心(CUDA 核心、流处理器),适合同时处理大量相同任务(如像素渲染、矩阵运算);
**(2)专用优化:**支持纹理映射、光照计算、视频编解码(如 H.265),效率远超 CPU;
**(3)存在形式:**独立显卡(如 NVIDIA RTX 4090)、集成在 SoC 中(如手机芯片内置 GPU、IMX8M Plus 内置 GPU)。
1.7.3 典型芯片 & 实战场景
**(1)芯片例子:**NVIDIA Jetson Nano(嵌入式 GPU,用于 AI 推理)、ARM Mali-G52(集成在 SoC 中,用于车载显示);
**(2)应用场景:**嵌入式:车载中控屏图形渲染、AI 边缘计算(如人脸识别)、无人机视觉处理;消费电子:电脑游戏、视频剪辑、手机图形显示。
二、区别
| 对比维度 | CPU(中央处理器) | MCU(微控制器) | MPU(微处理器) | SoC(片上系统) | DSP(数字信号处理器) | FPGA(现场可编程门阵列) | GPU(图形处理器) |
|---|---|---|---|---|---|---|---|
| 核心定义 | 通用运算核心,负责执行指令、处理数据,是所有计算设备的 "运算大脑"(基础组件) | 以 CPU 为核心,高度集成 Flash、RAM、外设的 "单芯片控制解决方案" | 面向嵌入式的高性能 CPU 核心,无内置 Flash/RAM,需外接存储和外设才能工作 | 单芯片集成 "核心运算单元 + 外设 + 控制器 + 专用模块",仅需少量外接元件即可构成系统 | 专为数字信号处理优化的专用处理器,侧重高速实时信号运算 | 由可编程逻辑单元组成的硬件可重构芯片,通过配置电路实现定制化功能 | 专为图形渲染优化的并行处理器,侧重大规模并行计算 |
| 集成度 | 极低(仅含运算器、控制器、寄存器,无存储 / 外设) | 极高(CPU + 内置 Flash(KB~MB 级) + 内置 RAM(KB~ 几十 KB 级) + 外设(UART/SPI 等)) | 低(仅含 CPU 核心,无内置存储 / 关键外设,依赖外部扩展) | 中高(集成核心(CPU/MCU/MPU) + 存储接口 + 外设 + 专用模块(DSP/GPU 等)) | 中(独立芯片:CPU 核心 + 信号处理模块;或集成于 SoC) | 中(可编程逻辑单元 + IO 接口 + 时钟 / 复位模块,无固定核心) | 中高(独立芯片:并行运算核心 + 显存控制器;或集成于 SoC) |
| 核心特征 | 通用型强,支持各类运算 / 逻辑判断,适配多场景软件 | 低功耗、低成本、小体积,面向 "简单控制任务",无需复杂操作系统 | 高性能、支持复杂操作系统(Linux/Android),面向 "复杂应用处理" | 集成度高、灵活性强,覆盖从简单控制到复杂计算的全场景 | 单周期乘法 - 累加(MAC)、循环缓冲、低延迟,实时性强 | 硬件并行性极强、可重构、低延迟,支持定制化逻辑 | 大规模并行运算核心(上千个),擅长重复并行任务,图形 / 矩阵运算效率高 |
| 工作方式 | 执行软件指令(串行运算为主,支持部分并行优化) | 执行软件指令(串行为主),集成外设直接响应控制需求 | 执行软件指令(串行 + 并行结合),依赖外部存储 / 外设完成功能 | 若核心为 MCU/MPU:执行软件指令;若集成 DSP/GPU:按专用模块方式工作 | 执行优化后的信号处理指令(串行 + 专用并行指令) | 硬件电路直接工作(无软件指令,通过配置文件定义电路连接) | 执行图形 / 并行计算指令(大规模并行运算,每个核心处理简单任务) |
| 典型架构 / 芯片 | x86(Intel i7)、ARM Cortex-A(手机 CPU)、RISC-V(开源 CPU) | ARM Cortex-M(STM32F103/ESP32)、PIC(PIC16F877A)、AVR(ATmega328P) | ARM Cortex-A(IMX6ULL、TI AM335x)、PowerPC(早期工业 MPU) | 异构多核(骁龙 8 Gen3、Xilinx Zynq)、MCU 型 SoC(STM32H7)、MPU 型 SoC(IMX8M) | TI TMS320C2000(电机控制)、ADI ADSP-21489(音频处理)、手机 SoC 内置 DSP | Xilinx Artix-7、Altera Cyclone V、Zynq-7000(FPGA+ARM) | NVIDIA RTX 4090(独立 GPU)、ARM Mali-G52(SoC 集成)、AMD Radeon |
| 适用场景 | PC、服务器、手机 / 平板(作为 SoC 核心)、嵌入式设备(作为 MCU/MPU 核心) | 遥控器、传感器节点、小型家电、工业继电器控制、智能门锁(简单控制任务) | 工业控制网关、物联网终端、车载信息娱乐系统、Qt 界面设备(复杂应用 + 操作系统) | 手机、汽车电子、物联网网关、高端工业控制(全场景覆盖,简化硬件设计) | 电机矢量控制、变频器、音频降噪、雷达信号处理、ADAS 信号处理 | 高速数据采集(1MHz 传感器采样)、5G 基站信号处理、芯片原型验证、工业总线协议解析 | 电脑游戏、视频剪辑、车载中控屏渲染、AI 边缘计算(人脸识别 / 图像分割) |
| 开发方式 | C/C++/ 汇编(操作系统开发、应用程序开发) | C / 汇编(裸机寄存器操作、轻量级 RTOS(FreeRTOS)开发) | C/C++(Linux 内核移植、驱动开发、应用编程) | 按核心类型而定(MCU 核心→裸机 / RTOS;MPU 核心→Linux 开发;DSP 核心→信号处理算法) | C / 汇编(信号处理算法开发,需适配专用指令集) | Verilog/VHDL(硬件描述语言,设计数字逻辑电路) | CUDA/OpenCL(并行编程框架)、图形 API(OpenGL/Vulkan)、嵌入式 GPU→驱动适配 |