09. CPU, GPU, 内存, 显存, 硬盘传递数据

1.硬盘, 内存, CPU, GPU, 显存简介

2.硬盘 → 内存 → CPU

3.CPU → 内存 → GPU

4.GPU → 内存 → CPU


1.硬盘, 内存, CPU, GPU, 显存简介

csharp 复制代码
a.硬盘: 永久保存游戏字体(模型, 纹理, Shader, 场景), 相当于公司仓库

b.内存: 缓存硬盘加载的资源, 供CPU/GPU快速访问, 相当于办公桌(放当前工作文件)

c.CPU: 调度任务, 准备数据, 逻辑计算, 相当于办公人员

d.GPU: 渲染画面, 并行计算, 相当于专业工作室(配专属工作台)

e.显存: 存储GPU正在使用的定点数据, 纹理, Shader代码, 相当于工作室专属工作台

2.硬盘 → 内存 → CPU

csharp 复制代码
这是"从仓库拿文件到办公桌"的过程, 核心是"DMA 异步加载,不阻塞 CPU"

底层流程(分步骤)

a.CPU发起请求

比如:Unity中调用Resources.Load或AssetBundle.LoadAssetAsync, CPU会向操作系统(OS)发送"加载资源"指令,比如加载

一个模型文件.fbx

b.OS调度硬盘读取: OS接收指令后, 通过SATA总线(HDD/普通SSD)或NVMe总线(高速M.2 SSD)通知硬盘, 让硬盘读取目标文件

c.DMA技术卸载CPU: 关键是DMA(直接内存访问) ------ 相当于仓库管理员直接把文件送到办公桌,不用办公人员(CPU)亲自跑,硬

盘通过DMA控制器, 直接将文件数据写入内存的指定地址, CPU此时可以继续处理其他任务(比如游戏UI更新、AI逻辑),不会被

等待加载阻塞

d.CPU访问内存数据: 加载完成后, OS向CPU发送"完成信号", CPU直接从内存中读取该模型的顶点数据、材质信息, 进行后续

处理(比如坐标转换、骨骼动画计算)
csharp 复制代码
游戏开发关键点

a.Unity中的异步加载(AsyncOperation)本质就是利用DMA实现的 ------ 让加载在后台线程执行, 主线程不卡顿

b.内存不足时, OS会触发"页面置换"(把内存中暂时不用的数据写回硬盘), 导致加载卡顿

3.CPU → 内存 → GPU

csharp 复制代码
这是"办公人员准备好资料, 交给专业工作室"的过程, 核心是"PCIe总线拷贝, 显存常驻资源"

底层流程(分步骤)

a.CPU准备渲染数据: CPU处理完模型的逻辑(比如位置更新、动画帧计算)后, 会将"待渲染数据"整理成GPU能识别的格式

- 顶点数据(坐标、法线、UV)、索引缓冲区

- 材质参数(颜色、纹理采样器)、Shader代码

- 渲染指令(比如用这个Shader绘制这个模型)

b.CPU发起显存拷贝: CPU通过PCIe总线将内存中的渲染数据拷贝到GPU的显存(VRAM)中, 这里要注意:

- 纹理、Shader等"复用性高"的资源, 会被一次性拷贝到显存后常驻(比如Unity中的Texture2D.uploadedToGPU 标记)避免

重复拷贝

- 顶点数据、动态参数(比如每帧变化的颜色)会每帧更新, 从内存拷贝到显存的"动态区域"

c.GPU读取显存并渲染: GPU的渲染核心直接从显存中读取数据, 执行Shader运算(顶点着色、像素着色),最终将渲染结果写入

显存的帧缓冲区
csharp 复制代码
底层细节(游戏优化关键)

a.PCIe总线带宽影响帧率: 如果每帧需要拷贝大量动态数据(比如粒子系统的顶点数据), PCIe带宽不足会导致CPU-GPU数据

瓶颈(比如: Unity Profiler中看到Gfx.WaitForPresent 耗时过长)

b.显存容量限制资源加载: 如果显存不足, GPU 会把暂时不用的纹理/模型换出到内存, 下次需要时再拷贝回来, 导致卡顿
csharp 复制代码
Unity中的优化技巧

a.开启Texture Compression(比如ETC2、ASTC), 减少纹理在内存/显存中的占用, 降低拷贝压力

b.避免每帧创建新的Mesh或Material(会触发频繁的内存 - 显存拷贝)

4.GPU → 内存 → CPU

csharp 复制代码
这是"专业工作室完成工作, 把结果反馈给办公人员"的过程, 核心是"帧缓冲读取 + 同步等待"

底层流程(分步骤)

a.GPU写入结果到显存: GPU完成渲染后, 帧缓冲区(存储最终画面像素)会保存在显存中

b.CPU发起读取请求: CPU需要获取这些结果时(比如: 把帧缓冲区的画面显示到屏幕, Unity中用RenderTexture.GetPixels

获取纹理像素), 会通过 PCIe 总线从显存拷贝数据到内存

c.同步等待: GPU是并行工作的, 当CPU要读取显存数据时, 可能GPU还没完成写入 ------ 此时CPU会进入等待状态, 导致主线程

阻塞
相关推荐
酬勤-人间道2 天前
自研软件模型处理全流程|个人开发经验分享
c++·经验分享·计算机·计算机图形学·桩号·开挖·回填
禁默4 天前
MySpeed+cpolar 解锁网速检测新方式
计算机·cpolar
面试鸭5 天前
携程搞出了 40 天长假?!这是上班也能过寒暑假的节奏啊。。
计算机·互联网·职场生活
面试鸭10 天前
招 7000 人!
计算机·互联网·职场生活
程序员鱼皮23 天前
我做了个 AI 绘图工具,不用写提示词,一键复刻爆款图片!
java·计算机·ai·程序员·互联网·网站
无名之逆1 个月前
你可能不需要WebSocket-服务器发送事件的简单力量
java·开发语言·前端·后端·计算机·rust·编程
~黄夫人~1 个月前
Linux 权限管理:用户组 + 特殊权限 + ACL 解析
linux·运维·计算机·学习笔记·权限管理
你怎么知道我是队长1 个月前
计算机系统基础5---值的表示4---浮点数的运算
计算机