09. CPU, GPU, 内存, 显存, 硬盘传递数据

1.硬盘, 内存, CPU, GPU, 显存简介

2.硬盘 → 内存 → CPU

3.CPU → 内存 → GPU

4.GPU → 内存 → CPU


1.硬盘, 内存, CPU, GPU, 显存简介

csharp 复制代码
a.硬盘: 永久保存游戏字体(模型, 纹理, Shader, 场景), 相当于公司仓库

b.内存: 缓存硬盘加载的资源, 供CPU/GPU快速访问, 相当于办公桌(放当前工作文件)

c.CPU: 调度任务, 准备数据, 逻辑计算, 相当于办公人员

d.GPU: 渲染画面, 并行计算, 相当于专业工作室(配专属工作台)

e.显存: 存储GPU正在使用的定点数据, 纹理, Shader代码, 相当于工作室专属工作台

2.硬盘 → 内存 → CPU

csharp 复制代码
这是"从仓库拿文件到办公桌"的过程, 核心是"DMA 异步加载,不阻塞 CPU"

底层流程(分步骤)

a.CPU发起请求

比如:Unity中调用Resources.Load或AssetBundle.LoadAssetAsync, CPU会向操作系统(OS)发送"加载资源"指令,比如加载

一个模型文件.fbx

b.OS调度硬盘读取: OS接收指令后, 通过SATA总线(HDD/普通SSD)或NVMe总线(高速M.2 SSD)通知硬盘, 让硬盘读取目标文件

c.DMA技术卸载CPU: 关键是DMA(直接内存访问) ------ 相当于仓库管理员直接把文件送到办公桌,不用办公人员(CPU)亲自跑,硬

盘通过DMA控制器, 直接将文件数据写入内存的指定地址, CPU此时可以继续处理其他任务(比如游戏UI更新、AI逻辑),不会被

等待加载阻塞

d.CPU访问内存数据: 加载完成后, OS向CPU发送"完成信号", CPU直接从内存中读取该模型的顶点数据、材质信息, 进行后续

处理(比如坐标转换、骨骼动画计算)
csharp 复制代码
游戏开发关键点

a.Unity中的异步加载(AsyncOperation)本质就是利用DMA实现的 ------ 让加载在后台线程执行, 主线程不卡顿

b.内存不足时, OS会触发"页面置换"(把内存中暂时不用的数据写回硬盘), 导致加载卡顿

3.CPU → 内存 → GPU

csharp 复制代码
这是"办公人员准备好资料, 交给专业工作室"的过程, 核心是"PCIe总线拷贝, 显存常驻资源"

底层流程(分步骤)

a.CPU准备渲染数据: CPU处理完模型的逻辑(比如位置更新、动画帧计算)后, 会将"待渲染数据"整理成GPU能识别的格式

- 顶点数据(坐标、法线、UV)、索引缓冲区

- 材质参数(颜色、纹理采样器)、Shader代码

- 渲染指令(比如用这个Shader绘制这个模型)

b.CPU发起显存拷贝: CPU通过PCIe总线将内存中的渲染数据拷贝到GPU的显存(VRAM)中, 这里要注意:

- 纹理、Shader等"复用性高"的资源, 会被一次性拷贝到显存后常驻(比如Unity中的Texture2D.uploadedToGPU 标记)避免

重复拷贝

- 顶点数据、动态参数(比如每帧变化的颜色)会每帧更新, 从内存拷贝到显存的"动态区域"

c.GPU读取显存并渲染: GPU的渲染核心直接从显存中读取数据, 执行Shader运算(顶点着色、像素着色),最终将渲染结果写入

显存的帧缓冲区
csharp 复制代码
底层细节(游戏优化关键)

a.PCIe总线带宽影响帧率: 如果每帧需要拷贝大量动态数据(比如粒子系统的顶点数据), PCIe带宽不足会导致CPU-GPU数据

瓶颈(比如: Unity Profiler中看到Gfx.WaitForPresent 耗时过长)

b.显存容量限制资源加载: 如果显存不足, GPU 会把暂时不用的纹理/模型换出到内存, 下次需要时再拷贝回来, 导致卡顿
csharp 复制代码
Unity中的优化技巧

a.开启Texture Compression(比如ETC2、ASTC), 减少纹理在内存/显存中的占用, 降低拷贝压力

b.避免每帧创建新的Mesh或Material(会触发频繁的内存 - 显存拷贝)

4.GPU → 内存 → CPU

csharp 复制代码
这是"专业工作室完成工作, 把结果反馈给办公人员"的过程, 核心是"帧缓冲读取 + 同步等待"

底层流程(分步骤)

a.GPU写入结果到显存: GPU完成渲染后, 帧缓冲区(存储最终画面像素)会保存在显存中

b.CPU发起读取请求: CPU需要获取这些结果时(比如: 把帧缓冲区的画面显示到屏幕, Unity中用RenderTexture.GetPixels

获取纹理像素), 会通过 PCIe 总线从显存拷贝数据到内存

c.同步等待: GPU是并行工作的, 当CPU要读取显存数据时, 可能GPU还没完成写入 ------ 此时CPU会进入等待状态, 导致主线程

阻塞
相关推荐
晚风一隅2 天前
阿里云核心技术深度解析:从神龙架构到云原生AI的全面技术演进
服务器·计算机·阿里云·技术向
量子炒饭大师7 天前
【一天一个计算机知识】Cyberpunk数据科学流 ——【如何去评定一款操作系统的价值】
计算机·操作系统
程序员鱼皮8 天前
再见百度,我用 1 小时,开发了个 AI 搜索引擎!Codex + GPT 5.5 + DeepSeek V4 真香~
计算机·ai·程序员·编程·ai编程
程序员鱼皮9 天前
别再说 AI 开发就是调接口了!5 种主流模式一次讲清
计算机·ai·程序员·编程·ai编程
程序员鱼皮10 天前
有人靠 API 中转站赚了上亿?我花 2 块钱做了一个。。
计算机·ai·程序员·编程·ai编程
CS创新实验室11 天前
考研408全面指南:计算机学科专业基础综合考试深度解析
考研·计算机·408
程序员鱼皮13 天前
AI 时代,程序员还有必要刷算法吗?
计算机·ai·程序员·编程·ai编程
杨充13 天前
02.计算器存储器的原理
计算机
计算机毕业编程指导师14 天前
【计算机毕设推荐】Python+Hadoop+Spark共享单车数据可视化分析系统 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·数据挖掘·spark·课程设计
计算机毕业编程指导师14 天前
【计算机毕设】基于Hadoop的共享单车订单数据分析系统+Python+Django全栈开发 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·数据挖掘·spark·django