09. CPU, GPU, 内存, 显存, 硬盘传递数据

1.硬盘, 内存, CPU, GPU, 显存简介

2.硬盘 → 内存 → CPU

3.CPU → 内存 → GPU

4.GPU → 内存 → CPU


1.硬盘, 内存, CPU, GPU, 显存简介

csharp 复制代码
a.硬盘: 永久保存游戏字体(模型, 纹理, Shader, 场景), 相当于公司仓库

b.内存: 缓存硬盘加载的资源, 供CPU/GPU快速访问, 相当于办公桌(放当前工作文件)

c.CPU: 调度任务, 准备数据, 逻辑计算, 相当于办公人员

d.GPU: 渲染画面, 并行计算, 相当于专业工作室(配专属工作台)

e.显存: 存储GPU正在使用的定点数据, 纹理, Shader代码, 相当于工作室专属工作台

2.硬盘 → 内存 → CPU

csharp 复制代码
这是"从仓库拿文件到办公桌"的过程, 核心是"DMA 异步加载,不阻塞 CPU"

底层流程(分步骤)

a.CPU发起请求

比如:Unity中调用Resources.Load或AssetBundle.LoadAssetAsync, CPU会向操作系统(OS)发送"加载资源"指令,比如加载

一个模型文件.fbx

b.OS调度硬盘读取: OS接收指令后, 通过SATA总线(HDD/普通SSD)或NVMe总线(高速M.2 SSD)通知硬盘, 让硬盘读取目标文件

c.DMA技术卸载CPU: 关键是DMA(直接内存访问) ------ 相当于仓库管理员直接把文件送到办公桌,不用办公人员(CPU)亲自跑,硬

盘通过DMA控制器, 直接将文件数据写入内存的指定地址, CPU此时可以继续处理其他任务(比如游戏UI更新、AI逻辑),不会被

等待加载阻塞

d.CPU访问内存数据: 加载完成后, OS向CPU发送"完成信号", CPU直接从内存中读取该模型的顶点数据、材质信息, 进行后续

处理(比如坐标转换、骨骼动画计算)
csharp 复制代码
游戏开发关键点

a.Unity中的异步加载(AsyncOperation)本质就是利用DMA实现的 ------ 让加载在后台线程执行, 主线程不卡顿

b.内存不足时, OS会触发"页面置换"(把内存中暂时不用的数据写回硬盘), 导致加载卡顿

3.CPU → 内存 → GPU

csharp 复制代码
这是"办公人员准备好资料, 交给专业工作室"的过程, 核心是"PCIe总线拷贝, 显存常驻资源"

底层流程(分步骤)

a.CPU准备渲染数据: CPU处理完模型的逻辑(比如位置更新、动画帧计算)后, 会将"待渲染数据"整理成GPU能识别的格式

- 顶点数据(坐标、法线、UV)、索引缓冲区

- 材质参数(颜色、纹理采样器)、Shader代码

- 渲染指令(比如用这个Shader绘制这个模型)

b.CPU发起显存拷贝: CPU通过PCIe总线将内存中的渲染数据拷贝到GPU的显存(VRAM)中, 这里要注意:

- 纹理、Shader等"复用性高"的资源, 会被一次性拷贝到显存后常驻(比如Unity中的Texture2D.uploadedToGPU 标记)避免

重复拷贝

- 顶点数据、动态参数(比如每帧变化的颜色)会每帧更新, 从内存拷贝到显存的"动态区域"

c.GPU读取显存并渲染: GPU的渲染核心直接从显存中读取数据, 执行Shader运算(顶点着色、像素着色),最终将渲染结果写入

显存的帧缓冲区
csharp 复制代码
底层细节(游戏优化关键)

a.PCIe总线带宽影响帧率: 如果每帧需要拷贝大量动态数据(比如粒子系统的顶点数据), PCIe带宽不足会导致CPU-GPU数据

瓶颈(比如: Unity Profiler中看到Gfx.WaitForPresent 耗时过长)

b.显存容量限制资源加载: 如果显存不足, GPU 会把暂时不用的纹理/模型换出到内存, 下次需要时再拷贝回来, 导致卡顿
csharp 复制代码
Unity中的优化技巧

a.开启Texture Compression(比如ETC2、ASTC), 减少纹理在内存/显存中的占用, 降低拷贝压力

b.避免每帧创建新的Mesh或Material(会触发频繁的内存 - 显存拷贝)

4.GPU → 内存 → CPU

csharp 复制代码
这是"专业工作室完成工作, 把结果反馈给办公人员"的过程, 核心是"帧缓冲读取 + 同步等待"

底层流程(分步骤)

a.GPU写入结果到显存: GPU完成渲染后, 帧缓冲区(存储最终画面像素)会保存在显存中

b.CPU发起读取请求: CPU需要获取这些结果时(比如: 把帧缓冲区的画面显示到屏幕, Unity中用RenderTexture.GetPixels

获取纹理像素), 会通过 PCIe 总线从显存拷贝数据到内存

c.同步等待: GPU是并行工作的, 当CPU要读取显存数据时, 可能GPU还没完成写入 ------ 此时CPU会进入等待状态, 导致主线程

阻塞
相关推荐
程序员鱼皮1 小时前
干掉 Claude Code,这个开源 AI 编程工具杀疯了?
前端·后端·计算机·ai·程序员
梁辰兴3 天前
计算机网络基础:MAC 地址
计算机网络·macos·计算机·mac地址·计算机网络基础·梁辰兴·物理地址
lkbhua莱克瓦243 天前
CPU三大核心部件功能详解
计算机·cpu·oc·ir·id
lkbhua莱克瓦243 天前
CPU中核心参数的通俗介绍
计算机·cpu
lkbhua莱克瓦243 天前
手机选购关注的参数-CPU篇
计算机·智能手机·cpu·oc·ir·id
lkbhua莱克瓦243 天前
CPU的架构与技术和实际性能指标
计算机·cpu
菜根Sec4 天前
计算机软考高级介绍
计算机·软考高级·软考
梁辰兴4 天前
计算机网络基础:地址解析协议 ARP
网络·计算机网络·计算机·arp·计算机网络基础·地址解析协议·梁辰兴
面试鸭6 天前
阿里秋招,开始捞人了
计算机·职场和发展·互联网