RPC学习 - 技术栈

一、什么是 RPC

RPC（Remote Procedure Call），即远程过程调用，是一种计算机通信协议，它允许运行在一台计算机上的程序调用另一台计算机上的子程序或函数，就好像调用本地程序中的函数一样，无需程序员显式地去编写处理网络通信、数据序列化与反序列化等底层细节的代码。

简单来说，就是让不同机器上的程序之间能够方便地进行通信和交互，使得分布式系统的开发更加便捷高效。

二、为什么要用 RPC

分布式系统需求

在现代的大型应用系统中，往往采用分布式架构，将不同的功能模块部署在不同的服务器上。例如，电商系统中订单处理、库存管理、用户认证等模块可能分别位于不同的机器。RPC 可以方便地实现这些不同模块之间的通信，让它们协同工作，就如同在一个单机系统中一样。
提高系统可扩展性

当业务增长需要增加新的功能模块或者对现有模块进行扩展时，通过 RPC 可以轻松地将新模块添加到分布式系统中，并与其他模块进行交互，而不需要对整个系统进行大规模的重构。
资源共享与复用

不同的应用程序或服务可能需要使用相同的功能，比如多个业务系统都需要进行数据加密、文件上传下载等功能。通过将这些公共功能封装成 RPC 服务并发布出去，其他应用可以方便地调用，实现资源的共享与复用。
跨语言协作

在一个复杂的企业级应用环境中，不同的团队可能使用不同的编程语言来开发各自的模块。RPC 支持多种语言实现，使得不同语言编写的程序之间能够进行通信，例如用 Java 编写的服务可以被 Python 编写的客户端调用，促进了跨语言的协作。

三、常用的 RPC 框架

gRPC
- 由 Google 开发并开源，基于 HTTP/2 协议进行通信，性能较高。
- 使用 Protocol Buffers 作为默认的接口定义语言和消息序列化格式，具有高效的序列化和反序列化能力。
- 支持多种编程语言，如 Java、Python、C++、Go 等，方便在不同语言环境下开发分布式应用。
Dubbo
- 阿里巴巴开源的一款高性能、轻量级的 RPC 框架，在 Java 领域应用广泛。
- 提供了丰富的服务治理功能，如服务注册与发现、负载均衡、容错处理等，能够很好地应对大规模分布式系统中的复杂情况。
- 可以与 Spring 框架无缝集成，方便 Java 开发者使用。
Thrift
- 最初由 Facebook 开发，现在是 Apache 的开源项目。
- 支持多种通信协议（如 TCP、UDP 等）和多种序列化方式（如二进制、JSON 等），具有较高的灵活性。
- 同样支持多种编程语言，可用于构建跨语言的分布式应用。

四、RPC 原理

客户端调用过程
- 当客户端程序需要调用远程服务时，首先会通过本地的代理（Stub）对象来发起调用。这个代理对象就像是远程服务在本地的一个替身，它隐藏了远程调用的底层细节。
- 客户端将调用的参数进行序列化，即将参数对象转换为可以在网络上传输的格式，比如将 Java 对象序列化为字节流。
- 然后通过网络将序列化后的参数发送给远程服务所在的服务器。
服务器端处理过程
- 服务器端有一个对应的骨架（Skeleton）对象，它接收从客户端发送过来的序列化后的参数。
- 首先对接收的参数进行反序列化，将其还原为服务器端能够处理的对象格式。
- 然后根据调用的方法名等信息，找到对应的实际服务实现类，并执行相应的方法。
- 执行完方法后，将返回结果进行序列化，再通过网络发送回客户端。
客户端接收结果
- 客户端接收到服务器端返回的序列化后的结果后，进行反序列化操作，将其还原为本地能够处理的结果对象格式，最后将结果返回给调用的客户端程序部分，完成整个远程调用过程。

五、如何做到透明化远程服务调用

代理机制

通过在客户端创建代理对象（Stub），让客户端程序感觉就像是在调用本地的函数一样。代理对象负责处理与远程服务通信的所有细节，包括参数序列化、网络发送、接收结果、反序列化等，对客户端程序隐藏了这些复杂的远程调用过程。
接口定义一致性

在客户端和服务器端定义相同的服务接口，确保双方对于服务的方法名、参数类型、返回值类型等有一致的理解。这样客户端按照接口定义进行调用，服务器端按照接口定义进行实现和处理，使得远程调用过程在逻辑上更加清晰和一致，仿佛是在本地进行的调用。
服务注册与发现机制

采用服务注册与发现系统，如 Zookeeper、Consul 等。服务器端将自己提供的服务注册到注册中心，客户端通过查询注册中心来获取需要调用的服务的地址等信息。这样，客户端不需要事先知道远程服务的确切位置，只要知道服务的名称等标识信息，就可以通过注册中心找到并调用相应的服务，进一步增强了远程服务调用的透明性。

六、如何对消息进行编码和解码

编码（序列化）
- 选择合适的序列化方式：根据应用场景和需求选择合适的序列化协议，如 JSON、Protocol Buffers、XML 等。不同的序列化方式有不同的特点，例如 JSON 格式简单易懂，适合于与 Web 应用交互；Protocol Buffers 则具有高效的序列化和反序列化性能，适合于对性能要求较高的场景。
- 按照序列化协议规则进行操作：一旦确定了序列化协议，就需要按照该协议的具体规则来对消息对象进行操作。比如，对于 JSON 序列化，需要将对象的属性转换为 JSON 格式的键值对；对于 Protocol Buffers，需要先定义好消息结构的.proto 文件，然后根据文件中的定义将对象进行序列化。
解码（反序列化）
- 识别序列化格式：首先要确定接收到的消息是采用哪种序列化格式进行编码的，这通常可以通过消息头或者约定的标识来判断。
- 按照对应序列化协议规则进行反操作：根据确定的序列化格式，按照其反序列化的规则将接收到的消息还原为原始的对象格式。例如，对于 JSON 序列化的消息，需要将 JSON 格式的键值对转换为对象的属性；对于 Protocol Buffers，需要根据.proto 文件中的定义将接收到的字节流反序列化为对象。

七、如何发布自己的服务

定义服务接口

首先要明确自己要发布的服务提供哪些功能，然后使用合适的接口定义语言（如 Java 中的接口、Protocol Buffers 中的.proto 文件等）来定义服务的接口，包括服务的方法名、参数类型、返回值类型等信息。
实现服务接口

根据定义好的服务接口，在服务器端编写具体的服务实现类，实现接口中定义的各个方法，这些方法将包含具体的业务逻辑来处理客户端的调用请求。
选择 RPC 框架

根据项目的需求和特点，选择合适的 RPC 框架，如前面提到的 gRPC、Dubbo、Thrift 等。不同的框架有不同的特点和优势，需要综合考虑性能、功能、支持的编程语言等因素。
配置服务信息

在选定的 RPC 框架中，按照框架的要求配置服务的相关信息，如服务的名称、端口号、服务所在的主机地址等，以便于其他客户端能够找到并调用该服务。
注册服务

将服务注册到服务注册与发现系统（如 Zookeeper、Consul 等）中，这样客户端就可以通过查询注册中心来获取服务的相关信息，从而实现对服务的调用。在注册过程中，需要提供服务的名称、地址、端口号等关键信息。
启动服务

完成上述步骤后，启动服务，使其处于可被客户端调用的状态。服务启动后，就可以等待客户端的调用请求，并按照服务实现类中的业务逻辑进行处理，将处理结果返回给客户端。