一、信息物理系统(CPS)
1.1、CPS 的定义与本质
1.1.1、定义
CPS通过集成先进的感知、计算、通信、控制 等信息技术和自动控制技术,构建了物理空间与信息空间中人、机、物、环境、信息 等要素相互映射、适时交互、高效协同的复杂系统,实现系统内资源配置和运行的按需响应、快速迭代、动态优化。
1.1.2、CPS的本质
就是构建一套信息空间与物理空间之间基于数据自动流动 的状态感知、实时分析、科学决策、精准执行的闭环赋能体系,解决生产制造、应用服务过程中的复杂性和不确定性问题,提高资源配置效率,实现资源优化。
1.1.3、最终目的
实现资源优化配置。
1.1.4、实现目标的关键
数据的自动流动。
1.1.5、概念图谱
核心目标
关键: 数据自动流动
最终目的: 资源优化配置
CPS 本质逻辑
状态感知
实时分析
科学决策
精准执行
物理空间
数据自动流动
信息空间
控制指令
1.2、核心概念
1.2.1、3C融合
**CPS的核心是 Computation(计算)、Communication(通信)、Control(控制) 的深度融合(3C)。
1.2.2、与IoT的区别
物联网(IoT)侧重于"连接"和"感知",而CPS侧重于"反馈"和"控制"。CPS强调物理世界与信息世界的双向映射(Digital Twin数字孪生是CPS的典型实现技术之一)。
1.2.3、闭环体系
运行逻辑,关键词是"状态感知 -> 实时分析 -> 科学决策 -> 精准执行"这一闭环。
1.2.4、海量数据处理
CPS架构设计中必须考虑边缘计算(Edge Computing),因为云端无法满足毫秒级的工业控制实时性要求。
1.3、CPS 四大核心技术要素
1.3.1、一硬
硬件支撑,即感知和自动控制。
1.3.2、一软
软件定义一切:注意"一软"是核心。在架构设计中,工业软件(如MES、ERP、PLM、CAD/CAE)不仅仅是工具,更是工业知识和工艺流程的代码化。
1.3.3、一网
网络融合:这里的"一网"特指工业现场总线与工业以太网的互联,以及IT(信息技术)网络与OT(运营技术)网络的融合。
1.3.4、一平台
工业云和智能服务平台对外提供资源管控和能力服务。
平台层级:"一平台"通常对应工业互联网平台层(PaaS),提供微服务、模型库和开发环境。
1.3.5、结构图谱
地位
地位
地位
地位
CPS核心要素
一硬: 感知和自动控制
一软: 工业软件
一网: 工业网络
一平台: 工业云和智能服务平台
硬件支撑
CPS的核心
网络载体
对外提供资源管控和能力服务
1.4、CPS 的技术体系
1.4.1、CPS总体技术
主要包括系统架构、异构系统集成、安全技术、试验验证技术等。
1.4.2、CPS支撑技术
主要包括智能感知、嵌入式软件、数据库、人机交互、中间件、SDN(软件定义网络)、物联网、大数据等。
1.4.3、CPS核心技术
主要包括虚实融合控制、智能装备、MBD(基于模型的系统工程)、数字孪生技术、现场总线、工业以太网、CAX\MES\ERP\PLM\CRM\SCM等。
1.4.4、技术层级理解
总体技术是顶层设计方法论。
支撑技术是通用的IT/CT技术(基础底座)。
核心技术是专门用于解决工业痛点的OT与IT融合技术。
1.4.5、MBD (Model-Based Design)
基于模型的设计,是复杂系统设计的核心方法。
1.4.6、Digital Twin (数字孪生)
CPS的高级表现形式,实现物理实体在虚拟空间的实时映射。
1.4.7、技术体系图
CPS总体技术: 系统架构/异构集成/安全/验证 CPS支撑技术: 感知/嵌入式/数据库/SDN/IoT CPS核心技术: 虚实融合/MBD/数字孪生/CAX 顶层设计技术 (三角形) 基于CPS应用的支撑技术 (圆柱体) 基础技术 (矩形)
1.5、CPS 的体系架构(三级架构)
1.5.1、概述
| 级别 | 基本组成 | 说明 | 其他 |
|---|---|---|---|
| 单元级 | 具备可感知、可计算、可交互、可延展、自决策功能的CPS最小单元。 | 一个智能部件 、一个工业机器人 或一个智能机床都可能是一个CPS最小单元。 | SoS级CPS主要功能包括 : 数据存储、数据融合、分布式计算、大数据分析、数据服务。 在数据服务的基础上形成了资产性能管理 和运营优化服务。 |
| 系统级 | 基于多个单元级CPS 的状态感知、信息交互、实时分析,实现了局部制造资源的自组织、自配置、自决策、自优化。 | 多个最小单元(单元级)通过工业网络(如工业现场总线、工业以太网等),实现更大范围、更宽领域的数据自动流动,实现了多个单元级CPS的互联、互通和互操作。 | SoS级CPS 可以通过大数据平台,实现跨系统、跨平台的互联、互通和互操作,促成了多源异构数据的集成、交换和共享的闭环自动流动。 |
| SoS级 | 多个系统级CPS 的有机组合构成SoS级CPS。 | SoS级CPS主要实现数据的汇聚 ,从而对内进行资产的优化 和对外形成运营优化服务。 | 在全局范围内实现信息全面感知、深度分析、科学决策和精准执行。 |
1.5.2、CPS的建设路径
CPS体系设计 -> 单元级CPS建设 -> 系统级CPS建设 -> SoS级CPS建设
1.5.3、SoS (System of Systems)
系统之系统。这是架构设计的高级形态,强调系统的独立性与协同性并存。
1.5.4、递进关系
单元级 = 智能单品(不可分割)。
系统级 = 智能产线/车间(互联互通)。
SoS级 = 智能工厂/产业链(跨域协同,业务与数据的深度融合)。
1.5.5、体系结构图
架构层级特征
单元级: 最小单元/自决策
系统级: 局部资源/互联互通
SoS级: 全局范围/跨平台/运营优化
CPS 建设路径
CPS体系设计
单元级CPS建设
系统级CPS建设
SoS级CPS建设
1.6、CPS 的应用场景
1.6.1、智能设计
产品及工艺设计、生产线/工厂设计。
对应 CAD/CAE 仿真与 Digital Twin(设计阶段的虚拟验证)。
1.6.2、智能生产
设备管理应用场景、生产管理应用场景、柔性制造应用场景。
对应 MES (制造执行系统)与 APS(高级排程)。
1.6.3、智能服务
健康管理、智能维护、远程征兆性诊断、协同优化、共享服务。
对应 PHM(故障预测与健康管理),这是目前AI大模型结合最紧密的领域。
1.6.4、智能应用
无人装备、产业链互动、价值链共赢。
对应 C2M(用户直连制造)和供应链协同。
1.6.5、应用场景思维导图
CPS的应用场景
智能设计
产品及工艺设计
生产线/工厂设计
智能生产
设备管理应用场景
生产管理应用场景
柔性制造应用场景
智能服务
健康管理
智能维护
远程征兆性诊断
协同优化
共享服务
智能应用
无人装备
产业链互动
价值链共赢
二、人工智能(AI)
2.1、人工智能的基本概念与分类
2.1.1、定义
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展 人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
2.1.2、目标
了解智能的实质,并生产出一种新的能以人类智能相似的方式 做出反应的智能机器。【图灵测试】
2.1.3、分类
弱人工智能(Weak AI):专注于完成特定任务(如语音识别、图像分类)。
强人工智能 (Strong AI):【是否能真正实现推理、思考和解决问题】,具备自主意识。
2.1.4、关键技术
自然语言处理、计算机视觉、知识图谱、人机交互、虚拟现实/增强现实、机器学习。
2.1.5、图灵测试(Turing Test)
由艾伦·图灵提出,如果一台机器能够与人类展开对话(通过电传设备)而不被辨别出其机器身份,那么称这台机器具有智能。
2.1.6、生成式AI (Generative AI)
区别于传统的判别式AI(分类、预测),生成式AI能够创造新的内容(文本、图像、代码)。
核心架构:Transformer架构(Self-Attention机制)。
2.1.7、AI系统的三要素
数据 (燃料)、算力 (引擎)、算法(大脑)。
2.1.8、概念图谱
两大分类
弱人工智能: 特定任务
强人工智能: 推理/思考/通用
终极目标
智能实质
类人反应
图灵测试
核心定义
模拟/延伸/扩展人的智能
感知环境 -> 获取知识 -> 最佳结果
人工智能 AI
2.2、关键技术------感知与认知
| 关键技术 | 描述 | 说明/应用 |
|---|---|---|
| 自然语言处理 (NLP) | 人与计算机之间用自然语言进行有效通信的各种理论和方法。 | 机器翻译、语义理解和问答系统。 |
| 计算机视觉 (CV) | 模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力,将图像分析任务分解为便于管理的小块任务。 | 自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。 |
| 知识图谱 (Knowledge Graph) | 本质上是结构化的语义知识库 ,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系。 | 提供了从"关系"的角度去分析问题的能力。 应用:反欺诈、不一致性验证、组团欺诈、搜索引擎、精准营销。 方法:异常分析、静态分析、动态分析等数据挖掘方法。 |
2.2.1、NLP 架构演进
RNN/LSTM -> Transformer (BERT/GPT)。当前架构师需了解 LLM (大语言模型) 的微调 (Fine-tuning) 和 提示工程 (Prompt Engineering)。
2.2.2、CV 核心算法
CNN (卷积神经网络) 是基础,现在 ViT (Vision Transformer) 也是主流。
2.2.3、知识图谱与RAG
在企业级知识库架构中,RAG (检索增强生成) 技术常结合知识图谱,解决大模型的"幻觉"问题,提高答案的准确性。
2.2.4、知识图谱结构图
典型应用
反欺诈/风控
智能搜索
精准营销
核心价值
结构化语义知识库
从'关系'角度分析问题
知识图谱本质
语义连接
节点/实体
边/关系
2.3、关键技术------交互与虚拟化
| 关键技术 | 描述 | 说明 |
|---|---|---|
| 人机交互 (HCI) | 主要研究人和计算机之间的信息交换。是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科的交叉。 | 传统交互 :键盘、鼠标、显示器等。 新型交互 :语音交互、情感交互、体感交互及脑机交互等技术。 |
| 虚拟现实/增强现实 (VR/AR) | 以计算机为核心的新型视听技术 。在一定范围内生成与真实环境在视觉、听觉等方面高度近似的数字化环境。 | 用户借助装备与数字化环境中的对象进行交互、相互影响。涉及显示设备、跟踪定位设备、触力觉交互设备等。 |
2.3.1、元宇宙 (Metaverse)
VR/AR 是通往元宇宙的入口。架构师需关注其背后的实时渲染 、低延迟网络 (5G/6G) 和 边缘计算 支撑。
2.3.2、混合现实 (MR)
合并了 VR 和 AR,物理世界和数字对象共存并实时交互。
2.3.3、脑机接口 (BCI)
HCI 的终极形态,直接连接大脑与外部设备,是"未来信息技术"考点中的前沿方向。
2.4、核心引擎------机器学习 (ML)
2.4.1、定义
涉及统计学、系统辨识、神经网络等多领域的交叉学科。以数据为基础 ,通过研究样本数据寻找规律 ,并根据所得规律对未来数据进行预测。
2.4.2、按照学习模式分类
监督学习 :需要提供标注的样本集(如:分类、回归)。
无监督学习 :不需要提供标注的样本集(如:聚类)。
半监督学习 :提供少量标注的样本。
强化学习 :需要反馈机制(如:AlphaGo)。
2.4.3、按照学习方法分类
传统机器学习 :领域特征需要手动完成,需要大量领域专业知识。
深度学习 :不需要人工特征提取 (自动特征学习),但需要大量的训练数据集以及强大的GPU服务器 来提供算力。基于多层神经网络。考点常涉及激活函数 、反向传播 、过拟合/欠拟合的处理。
2.4.4、其他算法
迁移学习、主动学习、演化学习。
迁移学习 (Transfer Learning) :大模型时代的核心。预训练 (Pre-training) + 微调 (Fine-tuning) 模式就是迁移学习的典型应用。它解决了小样本数据下的训练难题。
联邦学习 (Federated Learning) :出于数据隐私和安全考虑,在不交换原始数据的情况下协作训练模型,是金融和医疗领域的架构首选。
2.5、机器学习分类导图
高阶算法
迁移学习
主动学习
演化学习
按学习方法分类
传统机器学习
特征工程: 手动提取
深度学习
特征工程: 自动提取
依赖: 大数据 + GPU算力
按学习模式分类
监督学习: 有标签
无监督学习: 无标签
半监督学习: 少量标签
强化学习: 奖惩反馈
机器学习 ML
三、人工智能芯片
3.1、AI 芯片的定义
广义:从广义上讲只要能够运行人工智能算法的芯片都叫作 AI 芯片。
狭义(通常意义) :指的是针对人工智能算法做了特殊加速设计 的芯片。现阶段,这些人工智能算法一般以深度学习算法为主,也可以包括其它机器学习算法。
3.2、AI 芯片的分类
3.2.1、CPU
适合逻辑控制复杂的串行任务,AI计算效率低(架构师常称之为"通用计算")。
3.2.2、GPU (Graphics Processing Unit)
并行计算 能力强,通用性好。目前是AI训练(Training)的首选(如NVIDIA H100/A100)。
3.2.3、FPGA (Field Programmable Gate Array)
半定制化 。硬件可编程,灵活性高,延迟低。常用于AI推理(Inference)或算法迭代频繁的场景。
3.2.4、ASIC (Application Specific Integrated Circuit)
全定制化。如Google TPU、华为昇腾(Ascend)。性能功耗比最高,但灵活性最差(算法固化在硬件中,改算法可能需要换芯片)。
3.2.5、类脑芯片
模拟人脑神经元脉冲(Spiking Neural Networks),目前多处于实验室阶段。
3.2.6、分类概览图
特点与应用
按技术架构分类
AI芯片分类
GPU
FPGA: 现场可编程门阵列
ASIC: 专用集成电路
类脑芯片
通用性强 / 并行计算 / 适合训练
灵活性高 / 低延迟 / 硬件可重构
性能功耗比最高 / 专用性强 / 适合大规模部署
模拟人脑 / 神经形态计算
3.3、架构设计原则
通常采用 CPU + xPU 的异构架构。CPU负责调度和逻辑,xPU负责矩阵运算加速。
3.4、AI 芯片的关键特征
3.4.1、新型的计算范式
AI 计算既不脱离传统计算,也具有新的计算特质。
3.4.2、训练和推断
AI 系统通常涉及训练 和推断过程。
训练 :需要极高的算力 和精度 (通常为FP32或FP16/BF16),处理海量数据,反复迭代,通常在云端/数据中心进行。
推断 :利用训练好的模型进行预测,对实时性(低延迟)和功耗敏感,常采用低精度(INT8),可在**云端或边缘侧(Edge)**进行。
3.4.3、大数据处理能力
满足高效能机器学习的数据处理要求。
3.4.4、数据精度
降低精度的设计。
这是AI芯片区别于科学计算芯片的重要特征。神经网络具有鲁棒性,使用 INT8(8位整数) 甚至 INT4 进行运算,能大幅减少内存占用和能耗,且精度损失在可接受范围内。
3.4.5、可重构的能力
针对特定领域而不针对特定应用的设计,可以通过重新配置,适应新的AI 算法、架构和任务。
3.4.6、开发工具
AI 芯片需要软件工具链的支持。
软件工具链 :硬件只是基础,生态才是关键(如NVIDIA的CUDA生态)。架构师在选型时,必须评估芯片配套的编译器、驱动和框架支持(TensorFlow/PyTorch支持度)。
3.4.7、关键特征导图
AI芯片关键特征
计算范式
新型计算特质
不脱离传统计算
工作流程
训练 Training
推断 Inference
数据能力
大数据处理
高效能
数据精度
降低精度的设计
INT8/FP16等
可重构性
针对特定领域
适应新算法/新架构
生态支持
软件工具链
编译器/框架