什么是RPC
RPC是远程过程调用(Remote Procedure Call)的缩写形式。在学校学编程,我们写一个函数都是在本地调用就行了。但是在互联网公司,服务都是部署在不同服务器上的分布式系统。
SAP(System Applications and Products/企业管理解决方案)系统RPC调用的原理其实很简单,有一些类似于三层构架的C/S系统。
进程间通信(IPC)是在多任务操作系统或联网的计算机之间运行的程序和进程所用的通信技术。有两种类型的进程间通信(IPC):1)本地过程调用(LPC)用在多任务操作系统中,使得同时运行的任务能互相会话,这些任务共享内存空间使任务同步和互相发送信息2)远程过程调用(RPC)UNⅨ操作系统的计算机中。
它是一种计算机通信协议,允许一个计算机程序调用另一个计算机上的子程序,而无需了解底层网络细节。通过RPC,一个计算机程序可以像调用本地程序一样调用远程程序,使得分布式应用程序的开发更加简单和高效。
为什么需要RPC
RPC可以用HTTP协议实现,并且HTTP是建立在TCP之上最广泛使用的RPC,但是互联网公司往往用自己的私有协议,私有协议不具备通用性为什么还要用呢?因为相比于HTTP协议,RPC采用二进制字节码传输,更加高效也更加安全。现在业界提倡"微服务"的概念,而服务之间通信目前有两种方式,RPC就是其中一种。RPC可以保证不同服务之间的互相调用。即使是跨语言跨平台也不是问题,让构建分布式系统更加容易。RPC框架都会有服务降级、流量控制的功能,保证服务的高可用。
总结
服务化:微服务化,跨平台的服务之间远程调用
分布式系统架构:分布式服务跨机器进行远程调用
服务可重用:开发一个公共能力服务,供多个服务远程调用
系统间交互调用:两台服务器A、B,服务器A上的应用a需要调用服务器B上的应用b提供的方法,而应用a和应用b不在一个内存空间,不能直接调用,此时,需要通过网络传输来表达需要调用的语义及传输调用的数据
优点
RPC是一种通过网络从远程计算机程序上请求服务,不需要了解底层网络技术的协议。
RPC主要作用就是不同的服务间方法调用就像本地调用一样便捷。
技术概要
RPC技术简单说就是为了解决远程调用服务的一种技术,使得调用者像调用本地服务一样方便透明。 下图是客户端调用远端服务的过程:
1、客户端client发起服务调用请求。2、client stub 可以理解成一个代理,会将调用方法、参数按照一定格式进行封装,通过服务提供的地址,发起网络请求。3、消息通过网络传输到服务端。4、server stub接受来自socket的消息5、server stub将消息进行解包、告诉服务端调用的哪个服务,参数是什么6、结果返回给server stub。7、sever stub把结果进行打包交给socket8、socket通过网络传输消息9、client slub 从socket拿到消息。10、client stub解包消息将结果返回给client。一个RPC框架就是把步骤2到9都封装起来。
架构图
一次RPC调用流程
客户端(Client)通过本地调用的方式调用服务(以接口方式调用);
客户端存根(Client Stub)接收到调用请求后负责将方法、入参等信息进行组装序列化成能够进行网络传输的消息体(将消息体对象序列化为二进制流);
客户端存根(Client Stub)找到远程的服务地址,并且将消息通过网络发送给服务端(通过sockets发送消息);
服务端存根(Server Stub)收到消息后进行反序列化操作,即解码(将二进制流反序列化为消息对象);
服务端存根(Server Stub)通过解码结果调用本地的服务进行相关处理;
服务端(Server)本地服务业务处理;
服务端(Server)将处理结果返回给服务端存根;
服务端存根(Server Stub)序列化处理结果(将结果消息对象序列化为二进制流);
服务端存根(Server Stub)将序列化结果通过网络发送至客户端(通过sockets发送消息);
客户端存根(Server Stub)接收到消息,进行反序列化解码(将结果二进制流反序列化为消息对象);客户端得到最终的结果。
RPC 功能目标
RPC的主要功能目标是让构建分布式计算(应用)更容易,在提供强大的远程调用能力时不损失本地调用的语义简洁性。为实现该目标,RPC 框架需提供一种透明调用机制让使用者不必显式的区分本地调用和远程调用。
RPC 调用分类
RPC 调用分以下两种:
- 同步调用:
客户方等待调用执行完成并返回结果。
- 异步调用:
客户方调用后不用等待执行结果返回,但依然可以通过回调通知等方式获取返回结果。
若客户方不关心调用返回结果,则变成单向异步调用,单向调用不用返回结果。
异步和同步的区分在于是否等待服务端执行完成并返回结果。
RPC实现分析
我们以java平台实现该RPC框架概念模型为例
导出远程接口
导出远程接口的意思是指只有导出的接口可以供远程调用,而未导出的接口则不能。在 java 中导出接口的代码片段可能如下:
我们可以导出整个接口,也可以更细粒度一点只导出接口中的某些方法,如:
java 中还有一种比较特殊的调用就是多态,也就是一个接口可能有多个实现,那么远程调用时到底调用哪个?这个本地调用的语义是通过 jvm 提供的引用多态性隐式实现的,那么对于 RPC 来说跨进程的调用就没法隐式实现了。如果前面DemoService 接口有 2 个实现,那么在导出接口时就需要特殊标记不同的实现,如:
上面 demo2 是另一个实现,我们标记为 "demo2" 来导出,那么远程调用时也需要传递该标记才能调用到正确的实现类,这样就解决了多态调用的语义。
导入远程接口与客户端代理
导入相对于导出远程接口,客户端代码为了能够发起调用必须要获得远程接口的方法或过程定义。目前,大部分跨语言平台 RPC 框架采用根据 IDL 定义通过 code generator 去生成 stub 代码,这种方式下实际导入的过程就是通过代码生成器在编译期完成的。我所使用过的一些跨语言平台 RPC 框架如 CORBAR、WebService、ICE、Thrift 均是此类方式。
代码生成的方式对跨语言平台 RPC 框架而言是必然的选择,而对于同一语言平台的 RPC 则可以通过共享接口定义来实现。在 java 中导入接口的代码片段可能如下:
在 java 中 'import' 是关键字,所以代码片段中我们用 refer 来表达导入接口的意思。这里的导入方式本质也是一种代码生成技术,只不过是在运行时生成,比静态编译期的代码生成看起来更简洁些。java 里至少提供了两种技术来提供动态代码生成,一种是 jdk 动态代理,另外一种是字节码生成。动态代理相比字节码生成使用起来更方便,但动态代理方式在性能上是要逊色于直接的字节码生成的,而字节码生成在代码可读性上要差很多。两者权衡起来,个人认为牺牲一些性能来获得代码可读性和可维护性显得更重要。