Games104现代游戏引擎笔记 网络游戏架构基础

挑战1:网络同步

挑战2:是网络的可靠性,包括应对网络的延迟,丢包和掉线

挑战3: 反作弊和安全系统,因为网络游戏的本质是经济系统

挑战4:多样性(不同设备,不同服务器),在不停服的情况下热更新

挑战5:大量人数时对高并发,高操作的要求

Network Protocols 网络协议






Socket编程,通过接口,确认好相互的协议,就可以快速的建立持续的链接

国内是IVP4 居多,最好兼容IPV6,这是世界标准

通过三次握手建立可靠的连接,确保发送的包是有顺序的,会进行流量控制,但网络阻塞时会自动降低发包的效率

基本原理:当任何一个接受者收到一个信息时,给sender发送一个ACK(告知),当sender收到ACK时,才持续的往后发包。如果sender未收到ACK,会持续发送同一个消息

阻塞控制:滑动窗口,可以动态的控制发送数据的大小,当发生阻塞,丢包或者超时时,按照一定算法减少滑动窗口

端对端的传输,更简单,不需要建立长时间的连接,不需要一定要保证稳定,不管有没有收到,不管顺序,不管流量控制。发送完就不管了

对于时间(延迟)不太敏感的操作类型的游戏,可以选择TCP,对于响应特别快速(FPS类),尤其在公网这种不稳定的网络下,用UDP反应较快

对于大型的MMO类型这种来说,不会用单一协议,会用组合协议,用TCP协议来进行签名认证,确认登陆,建立账号连接,心跳包等。当游戏进入到战斗,进入到这个世界里时改用UDP,在聊天,邮件等,又走回TCP通道。

TCP太慢了,需要稳定发送上一个消息,才能继续发下一个消息,并且效率随着带宽变化不稳定

UDP不可靠,无法确认消息到底有没有发送成功

实战中常常对协议进行深度的改造,定制适合的协议:基于UDP的可靠连接

1.需要可靠的连接(TCP)

2.保持一定的顺序(TCP)

3.需要非常快的反应,最好没有延迟 (UDP)

4.需要群发(UDP)

ACK:确认收到

NACK:什么包没收到

SEQ:序列号

ARQ:当我建立一个网络连接传包时,如果我丢包或者未收到,能够有办法能告诉对方

滑动窗口协议:当有很多数据要传输时,会一次性把窗口里的数据全部传输,当我收到接收方返回的ACK包时,如果我收到的2号包的ACK,便确定0,1,2都已传输到位,接下来传输3,4,5,6,因为3已经传了,只需传输4,5,6,直到收到剩下包的ACK,窗口便继续往下滑动

窗口设成1,每个包发送完后要等ACK收到,才往下走

如果发现窗口里的一个包丢失,只把窗口里的包再传输一遍。窗口持续往下走,会被告知NACK(哪个包丢失),把丢失的包重新发送。连接更稳定,能减少带宽的浪费,但是有额外ACK类型,即NACK

解决UDP丢包的问题

丢包率低一个值的时候不管,然后通过FEC的方式把丢掉的包在传输段的另一头计算回来,通过额外的数据量换取稳定性

增加一个E(异或运算校验位),丢包后的数据可以通过异或校验位还原

对D构建一个矩阵B(确保任意抽掉若干行,仍然是一个可逆的矩阵),

B矩阵 乘以 D 矩阵 得到了 G,包含了三个其他多算出来的

传输中出现丢包

B`相对于 B的去掉了丢包数据的行数

B` 的逆矩阵可以重新将数据还原

总结:构造一个矩阵,确保矩阵抽掉若干行仍然可逆。将拿到的信息乘上,抽掉了对应行矩阵的逆,就可以恢复原始信息

定制自己独立的UDP策略:对ARQ有所理解,使用滑动窗口的方法(一个pool)去传递数据,确定resending/retransimission的策略,加上一定FEC的算法,保证即使在一定的丢包率下,包体仍然能正确收到,确保ACK尽量的成功

Clock Synchronization 时钟同步

RTT和Ping非常接近,区别是Ping更底层,是不同的协议层

RTT 很多时候是应用层自己写的,游戏里很多时候不用区分的太严格,RTT用的多一点



在协议包里有四个时间

t0:客户端发送的时间

t1:服务器收到的时间

t2:服务器发送的时间

t3:客户端收到的时间

通过这个算法可以估算出RTT

案例:延迟delay是4秒,按延迟即服务器发送的时间t3,客户端接收到的时间应该是35秒,与客户端本地时间05秒相差30秒。则估算出客户端和服务器相差30秒

算法与现实不符合的假设是:

1.网络的速度是恒定的

2.上下两路是对等的

1.先跑一边NTP算法,算出服务器和客户端的时间差

2.快速调整客户端的时间,然后做多次NTP算法,算出一系列NTP算法

3.把大于offset平均值50%的值扔掉,然后按剩下的offset值取平均值做时钟校准

链路不可靠的情况下,只能逼近准确的服务器时间,无法真正的完全校准

RPC Remote Procedure Call 远程程序调用

socket 编程模式缓解了复杂计算机网络架构的困难,但是在游戏业务逻辑方面其还有一系列的问题

socket 编程会需要使用到Messages的方式来工作,定义很多的消息,消息里面会包含很多的参数

客户端和服务端很多时候系统 OS 不一样

1.常见的有Linux作为服务器收发处理数据,客户端是安卓, IOS,Windows

2.Big Ending 和 Small Ending, 高位在前还是低位在前

3.数据打包之后需要对齐(4个Byte为单位),否则就会有很多空间浪费

4.解密和加密

让程序员像正常写业务代码,作为一个库存在,然后传入参数。之后如何变成Message,如何打包,如何序列化,网络如何路由到服务器,服务器如何接受,处理消息,如何返回等等这些都交给RPC来完成

案例

免去后台的处理过程,专注业务逻辑

IDL Interface Definition Language 界面定义语言

IDL 会定义各种参数,类似schema的定义

RPC Stubs RPC 存根:

当一个客户端或服务器起来之后,彼此会告诉对方自己上线,然后注册一大堆的RPC(用来个函数调用)。

每次call RPC时可以在RPC的存根里查询,如果没有对应RPC,系统会报错,但不影响其他业务逻辑的运行。

真实RPC路径:发出RPC请求后,首先进行压缩,加密,然后网络传输,服务器接收后,进行解密,解压缩

Network Topology 网络拓扑

现在多人游戏用的比较少,很多时候是点对点时使用,主要是switch这种局域网上使用p2p连接

p2p一般不会考虑作弊,没有什么限制

相比P2P,会选择一个玩家作为一个主机然后传输,早期网吧很多局域网游戏是这种类型。

现在一些沙盒类游戏,还有steam上的很多游戏是这种方式

不需要开发商维护一个服务器,玩家自己可以作为服务器

专用服务器:用于更复杂的大型MMO,电竞对战

会在服务端维持一个一致的世界,所有的客户端获得相对公平且稳定的连接

当跨越大洋的时候,物理延迟就是也需要考虑的。尤其是对于全球发行的游戏

所以各个区域一般都设置Protol,然后protol通过专有网络会链接到服务器上,从而不会使用公网的转跳,大大降低延迟

网络游戏加速器也是基于这个原理

Game Synchronization Intro 游戏同步

单人运行,单人输入

操作和显示是有延迟的,所以需要同步两个世界

1.快照同步 2.帧同步 3.状态同步

Snapshot Synchronization:

客户端只负责把输入发给服务器

服务器进行整个游戏世界的模拟

把整个游戏世界的状态生成一个快照(每个物体的血量,位置,速度。。。)

将快照发送给客户端

客户端展示快照的数据信息,(渲染绘制)

保证了整个世界状态的一致性,客户端只是一个渲染绘制的表现。

服务器会希望快照的计算不要占用过多的带宽,帧率会较低,10-20左右,客户端为了更丝滑的效果,帧率会更高。

客户端会在两个服务器快照之间进行插值

快照的数据量较大,且往往两个快照间多数物体没有变化,因此快照一般传递的是变化量,减少传输数据的大小

优点:

1.代码非常的简洁干净

2.绝对一致,无法作弊

缺点:

1.客户端的算力被浪费掉

2.生成快照的数据量很大,所需的上传带宽非常大

Lockstep Synchronization

可以理解为军队行走,整齐划一,某种程度上的高度性

也可以理解为是有回合制的,是有顺序的,类比与下棋

所有的信息一致性的同步的传递给目标,目标一致的处理

最简单的思想

所有客户端的操作统一的发给服务器,服务器再同一的分发给客户端,客户端做一致的模拟。

服务器一般做信息的汇总,同步及转发的处理

第一步初始化游戏内的初始状态(王者荣耀的加载条),必须要做到完全的一致,因为同步的是操作,如果初始条件有一丝偏差,最终结果可能误差非常大。

还需要同步时钟

每一帧都接受所有的客户端输入,确认收到所有输入后统一的发给所有人,所有人然后同时开始模拟

优点:简洁明了

缺点:延迟非常明显,所有人的延迟等于延迟最高客户端的延迟

公网帧同步的优化:

引入了Bucket,每隔一个Bucket(例如100ms)的时间内, 未收到客户端的操作,则丢弃这个客户端的操作

网络差者获利,与网络优者获利。权衡一致性和实时性

帧同步需要整个游戏逻辑具有确定性(Deterministic)

一样的输入,经过各种复杂的迭代运算后,保持一致结果很难

浮点数

随机数

数据容器,计算的算法

数学库

物理的模拟

逻辑执行顺序

帧同步上述一定都要保证一致

浮点数存储要符合IEEE754的标准,可以严格意义上保证浮点数一致性

但是不同平台的实现是不一样的

很多数学运算中需要用到三角函数,根号等,需要用查表法:所有的数字必须要是锁死的,不能各自算各自的

使用Fixed-point number 定点数的方法来计算,使用固定长的数字来处理数学运算,从而保证高度的一致性

整个游戏保持一致确定性几乎是不可能的,要把最核心的业务逻辑确定一致性。比如角色的移动,位置,血量,一些游戏的状态。但是渲染这种不确定不会有太大影响


同步随机数种子,且随机算法必须一致

游戏的确定性是帧同步的基础,如果无法保证一致性,则帧同步不能成立

跟踪和调试

错误是会不断累积的,需要不停地把游戏的状态保存下来,使用checksum的方法。

checksum:把现在所有的变量存在一起,算出一个md5编码,存出去,把游戏里所有的函数的call和parameter编程一个hash值存在那。可能每5-10帧,存下快照,包括input也保存快照

滞后和延迟

把服务器传过来的帧cache几帧,当服务器出现延迟,本地逻辑帧依旧能从cache获取

例如网络视频播放,是分成很多块,每次下载好几块作为cachebuffer

逻辑帧和渲染帧分离:

服务器差不多10帧,期间插入很多渲染帧。

当网络出现延迟或者各种问题时,渲染帧,画面不会因此出现各种各样的抖动。

断线重连:

客户端不仅仅只接收input,每隔一定帧数会有特定key frame把当前所有游戏的状态做一个snapshot并存在本地的内存或磁盘,保证游戏即使崩溃,snapshot的快照还在。

每次重连,从上一次快照的帧数开始演算到当前的帧数。避免从头开始演算

如果发生了重连情况,那么可以放弃渲染帧,只跑逻辑帧,以更快速度的逻辑帧,一定能追上现在游戏的进度

服务器再一些特定的keyFrame保存一个快照

当有些玩家断线时间过长,服务器可以给个更新的快照,帮助客户端设置游戏的状态

另一个应用是观战模式

观战实际上与断线重连的底层技术一模一样。服务器把前面关键帧的信息发送给客户端,再把参与玩家的input发送给客户端。注意观战发送的数据是有主动延迟防止作弊

回放同理

帧同步防作弊

多人情况下:投票机制,每隔一段时间,让所有客户端把游戏里状态的checksum校验码发给服务器,然后进行对比,有不一样的直接踢掉

双人对战的情况下,服务器会有个checksum。有来校验。(通常大部分双人游戏,都是采用p2p,很少帧同步。除非是电竞属性很强的游戏)

帧同步的一个难点是:所有的信息和状态都在客户端上模拟,理论上可以还原出一些不该让玩家看见的信息,例如moba的全图和fps的透视

现代的游戏不会单纯的使用最简单的帧同步,会有很多复杂方法策略的帧同步来规避

优点:

1.带宽要求低,仅同步指令

2.解决确定性问题之后,开发效率很高

3.可以做一些对打击操作非常敏感,精确的游戏

4.方便做游戏录屏

缺点:

1.保持一致性很难

2.难以防止全图挂这种问题

3.如果没有服务器快照,断线较长时,追赶问题会比较严重

State Synchronization



核心思想是不会同步整个宇宙。

每个玩家只会提交自己部分的信息和部分的状态,每个玩家自己模拟自己的世界。

服务器会模拟一个完整的全宇宙,只会把部分的信息,和当前玩家相关的信息发给对应客户端

放作弊的能力会好一点点

Server最大,一切指令以服务器优先级最高

Authorized:是这个玩家对于本身local的操作

Replicated:其他玩家看到的这个玩家的复制品,依赖于服务器传输的信息

玩家1与玩家2客户端看到的情况

玩家1:开火,发送服务器

服务器:玩家1开火,广播所有客户端

玩家2:收到通知,玩家1开火

服务器通知每个客户端重复玩家1炮弹的运动

服务器判定击中了一个单位,广播给所有客户端

状态同步核心思想:

每个人提出自己的动作,整个世界的核心业务逻辑由server完成。server产生的结果与client提出的动作都会被同步给所有客户端。

并不要求所有的客户端保持高度一致性,只需要服务器做出判断。

状态同步只同步对于客户端需要的信息,即一个感知范围内的信息(AOI算法)

有个问题是玩家A如果自己需要操作,如往前走,依旧需要等待服务器的确认,这就会造成非常大的延迟,导致操作不顺手。

1.客户端预测

2.服务器校验

根据客户端预测,提前移动,服务器校验没问题则保持不变

由于RTT和一个command frame的延迟,会导致客户端永远比服务器超前

守望先锋:估计一个RTT,约160ms,半个RTT 80ms,一个command frame 16ms(刷新率60帧每秒),则客户端永远往前预测16+80ms,等服务器消息回来后,进行对齐,对齐是个插值的过程,尽可能使移动变得平滑

client本地一个消息发出到从server回来接收可能长达上百毫秒,本地可能已经跑了好几帧,此时会把本地的每一次预测和每一个状态全部buffer到一个序列帧里。当server的每一个信息回来时,会和过去的信息进行检验。因为从server回来的信息是经过了半个RTT时间的传输,对于client接收的瞬间是过去的信息。

如果和server的校验信息不一致,则以server的信息反向校准

从client角度看,会有做了某件事,但被校准回退的情况发生client需要一个ring buffer,存储在过去几帧的数据,当发现校验问题时,ring buffer之后的数据全部无效,重新算一遍

online游戏很常见,对网速慢的玩家不利,因为对世界的更新不及时,操作反应不如网速快的玩家

丢包问题:

1.server会把用户的输入,用一个ring buffer存储起来,会存储好几帧的输入

2.如果在一定时间内,接收不到用户的输入,有时候会自动把过去的最后一次操作进行复制(如,跑动过程中断网,在其他客户端展示的是扔在一直跑)

3.不同游戏有不同的处理丢包策略

number of players反了

帧同步:适合注重打击感,对抗感,竞技类的游戏。对引擎的要求很高,需要引擎的核心逻辑业务确定性非常高

状态同步:适合网络本身比较复杂,不太稳定,并且游戏业务比较复杂。以及游戏的参与者非常多

现代主流引擎大部分能实现状态同步,实现帧同步通常需要自己的引擎团队专门定制。

相关推荐
Themberfue3 分钟前
基础算法之双指针--Java实现(下)--LeetCode题解:有效三角形的个数-查找总价格为目标值的两个商品-三数之和-四数之和
java·开发语言·学习·算法·leetcode·双指针
AIGC破防黑吗喽4 分钟前
Midjourney零基础学习
人工智能·gpt·学习·ai·stable diffusion·midjourney·ai绘画
LearnTech_12318 分钟前
【学习笔记】手写一个简单的 Spring MVC
笔记·学习·spring·spring mvc
一尘之中1 小时前
网 络 安 全
网络·人工智能·学习·安全
TNT_JQR1 小时前
电子信息类专业技术学习及比赛路线总结(大一到大三)
单片机·嵌入式硬件·学习
漏刻有时1 小时前
微信小程序学习实录9:掌握wx.chooseMedia实现多图片文件上传功能(选择图片、预览图片、上传图片)
学习·微信小程序·notepad++
笑鸿的学习笔记1 小时前
工具笔记之生成图表和可视化的标记语言Mermaid
笔记
大霞上仙2 小时前
jmeter学习(7)beanshell
学习·jmeter
大霞上仙2 小时前
jmeter学习(1)线程组与发送请求
java·学习·jmeter
望森FPGA2 小时前
HDLBits中文版,标准参考答案 |2.5 More Verilog Features | 更多Verilog 要点
学习·fpga开发