《微服务架构设计模式》之三：微服务架构中的进程通信

概述

交互方式

客户端和服务端交互方式可以从两个维度来分：

维度1：一对一和多对多
一对一：每个客户端请求由一个实例来处理。
一对多：每个客户端请求由多个实例来处理。
维度2：同步和异步
同步模式：客户端请求需要等待服务端响应，客户端等待响应时可能导致阻塞。
异步模式：客户端请求不需要服务端实时响应，服务端可以非实时响应，客户端的请求不会阻塞进程。
一对一交互方式的几种类型：请求/响应、异步请求/响应、单向通知
一对多交互方式的几种类型：
发布/订阅方式：客户端发布通知消息，被零个或多个感兴趣的服务订阅。
- 发布/异步响应方式：客户端发布请求消息，然后等待感兴趣的服务发回响应。
  请求/响应、异步请求/响应、单向通知。

消息的格式

进程通信的本质是交互消息，消息通常包含数据。所以一个重要的设计决策就是要设计消息的格式。

消息的格式可以分为两大类：文本和二进制。

基于文本的消息格式

基于文本的消息格式有JSON和XML。

这种格式的消息好处在于它的可读性很高，同时也是自描述（啥意思？就是字段名可以说明它自己是什么意思吧）。JSON是命名属性的集合，XML是命名元素和值得集合。这样的消息格式可以消息接受方只挑选出他们感兴趣的值，对消息结构的修改可以做到很好的后向兼容性。

使用基于文本格式消息的弊端主要是消息往往过度冗长，特别是 XML。消息的每一次传递都必须反复包含除了值以外的属性名称，这样会造成额外的开销。（确实是这样，用过的都知道0.0）。另外一个弊端是解析文本引入的额外开销，尤其是在消息较大的时候。因此，在对效率和性能敏感的场景下，你可能需要考虑基于二进制格式的消息。

基于文本的消息格式

二进制格式消息作者也写了两段，主要是平时从没用过这种格式，这里就不写了~

使用断路器模式处理局部故障

当客户端向服务端发送同步请求时，永远会面临服务端局部故障的风险。故障的原因可能是服务器挂了、正在维护或者因为负载过多响应缓慢。这时候服务端无法在有限的时间内给客户端回应，客户端将会阻塞，同时又接受新的请求导致资源耗尽，无法处理请求。例如下图调研链路中，移动应用调用Create order端的，再掉OrderServece代理，再掉用OrderService，如果OrderService挂了，OrderService代理会一直等下去，最终API GateWay资源耗尽,整个API GateWay将不可用。

所以我们需要合理的设计服务来防止故障在整个应用程序中的传导和扩散。解决这个问题分为两个部分

必须让远程调用代理用正确处理无响应服务的能力。（作为调用方，自己别受无响应服务的影响，先保护好自己,别自己也搞挂了）
需要决定如何从失败的远程服务中恢复。

开发远程可靠的远程过程调用代理

当一个服务同步调用另一个服务时，它应该使用Netflix 描述的方法(http://techblog.netflixcom/2012/02/faulttolerance-in-high-volumehtml)来保护自己。(啊网飞还干这个？不是同一个吧哈哈！)这种方法包括以下机制的组合。

网络超时:在等待针对请求的响应时，一定不要做成无限阻塞，而是要设定一个超时。使用超时可以保证不会一直在无响应的请求上浪费资源。
限制客户端向服务器发出请求的数量:把客户端能够向特定服务发起的请求设置一个上限，如果请求达到了这样的上限，很有可能发起更多的请求也无济于事，这时就应该让请求立刻失败。
断路器模式 :监控客户端发出请求的成功和失败数量，如果失败的比例超过一定的闽值，就启动断路器，让后续的调用立刻失效。如果大量的请求都以失败而告终，这说明被调服务不可用，这样即使发起更多的调用也是无济于事。在经过一定的时间后客户端应该继续尝试，如果调用成功，则解除断路器。其实就是我们经常提到的"熔断"。

从失败的远程服务中恢复

未完待续

使用服务发现

客户端向服务端发送请求的时候，需要知道服务端的网络地址，就是IP+端口 。在以前，传统的应用程序是部署在物理机上，网络地址通常是静态的。所以客户端可以从配置文件中读取网络地址。但现在是基于云的微服务应用程序，其更具有动态性。确实，现在部署很多用的docker了。服务实例具有动态分配的网络位置。此外，由于自动扩展、故障和升级，服务实例集会动态更改。因此，客户端代码必须使用服务发现。

什么是服务发现

正如刚才所见，你无法使用服务的IP地址静态配置客户端。相反，应用程序必须使用动态发现机制。服务发现的关键组件是服务注册表，它是包含服务实例网络位置信息的一个数据库。

服务实例启动和停止时，服务发现机制会更新服务注册表。当客户端调用服务时，服务发现机制会查询服务注册表以获取可用服务实例的列表，并将请求路由到其中一个服务实例。

实现服务发现有以下两种主要方式：

服务及其客户直接与服务注册表交互
通过部署基础设施来处理服务发现

应用服务发现模式

这种服务发现方法时两种模式的组合：自注册模式和客户发现模式。

自注册模式就是服务实例向服务注册表注册自己。

客户端发现模式就是客户端从服务列表检索可用服务实例列表。并在他们之间进行负载均衡。

平台服务发现模式

使用应用端服务发现模式，还需要客户端和服务端写一些发现和注册的代码，是有一些耦合的。而使用平台发现模式就简单了。

现在许多现代部署平台(如 Docker 和 Kubernetes)都具有内置的服务注册表和服务发现机制。部署平台为每个服务提供DNS 名称、虚IP (VIP)地址和解析为VIP 地址的DNS 名称。客户端向 DNS 名称和VIP 发出请求，部署平台自动将请求路由到其中一个可用服务实例。因此，服务注册、服务发现和请求路由完全由部署平台处理。如下：

这种发现使用了2种模式：

第三方注册：服务实例有第三方观察注册到服务注册表。不用服务端自己注册了。

服务端发现：客户端向路由器发出请求，路由器负责服务发现。

由平台提供服务发现机制的主要好处是服务发现的所有方面都完全由部署平台处理。服务和客户端都不包含任何服务发现代码。因此，无论使用哪种语言或框架，服务发现机制都可供所有服务和客户使用。

基于异步消息模式的通信

使用消息机制时，服务之间的通信是采用异步消息的方式完成。有的是使用消息代理，有的不使用消息代理。由于通信是异步的，因此客户端不会堵塞和等待回复，相反客户端都假定消息不会马上就收到。

什么是消息传递

消息是由消息头部和消息主体组成。

消息有几种不同类型的消息。

文档：仅包含数据的通用消息。接收者决定如何解释它。对命令消息的回复就是文档消息的一种使用场景。
命令：一条等同于RPC请求的消息，指定要调用的操作及其参数。
事件：表示发送方这一端发生了重要的事件。事件通常是领域事件，表示领域对象的状态变更。

消息通道

两种类型的消息通道

点对点通道向正在从、。通道读取的一个消费者传递消息。服务使用点对点通道实现前面描述的一对一交互方式。
发布-订阅通道将一条消息发给所有订阅的接收方。服务使用发布-订阅通道来实现前面描述的一对多交互方式。

实现单向通知

客户端将消息（通常是命令式消息）发送到服务所拥有的点对点通道。服务订阅该通道并处理该消息，但服务不会发回回复。

实现发布订阅

实现发布/异步响应

使用消息代理

无代理架构中，服务可以直接交互消息。

好处

允许更轻的网络流量和更低的延迟。因为消息直接从发送方发送到接收方，不必经过代理转发。
清除了消息代理可能成为性能瓶颈或单点故障的可能性。
具有较低的操作复杂性，因为不需要设置和维护消息代理。

弊端

服务需要了解彼此的位置，因此必须使用服务发现机制。
这样可能会导致可用性降低，因为在交换消息时，消息的发送方和接收方都必须同时在线
在实现例如确保消息能够成功投递这些复杂功能时的挑战性更大。
由于以上限制，大多数企业应用程序使用基于消息代理的架构。

基于代理的消息

消息代理是所有消息的中介节点。发送方将消息写入消息代理，消息代理将消息发送给接收方。使用消息代理的一个重要好处是发送方不需要知道接收方的网络位置，另一个好处是消息代理缓冲消息，直到接收方能够处理它们。

流行的开源消息代理包括Apache ActiveMQ、RabbitMQ、Apache Kafka 。（第一个不了解，其他两个用过）

还有基于云的消息服务，例如AWS Kinesis(https://awsamazon.com/kinesis)和AWSsos(https://aws.amazon.com/sqs/)。

选择消息代理时，你需要考虑以下各种因素：

支持的编程语言:你选择的消息代理应该支持尽可能多的编程语言。
支持的消息标准:消息代理是否支持多种消息标准，比如AMQP和STOMP，还是它仅支持专用的消息标准?
消息排序:消息代理是否能够保留消息的排序?
投递保证:消息代理提供什么样的消息投递保证?
持久性:消息是否持久化保存到磁盘并且能够在代理崩溃时恢复?
耐久性:如果接收方重新连接到消息代理，它是否会收到断开连接时发送的消息?
可扩展性:消息代理的可扩展性如何?
延迟:端到端是否有较大延迟?
竞争性(并发)接收方:消息代理是否支持竞争性接收方?

基于消息代理的好处和弊端

好处

松耦合:客户端发起请求时只要发送给特定的通道即可，客户端完全不需要感知服务实例的情况，客户端不需要使用服务发现机制去获得服务实例的网络位置。
消息缓存:消息代理可以在消息被处理之前一直缓存消息。像HTTP这样的同步请求响应协议，在交换数据时，发送方和接收方必须同时在线。然而，在使用消息机制的情况下，消息会在队列中缓存，直到它们被接收方处理。
灵活的通信:消息机制支持前面提到的所有交互方式
明确的进程间通信:基于RPC的机制总是企图让远程服务调用跟本地调用看上去没什么区别(在客户端和服务端同时使用远程调用代理)。然而，因为物理定律(如服务器不可预计的硬件失效)和可能的局部故障，远程和本地调用还是大相径庭的。消息机制让这些差异变得很明确，这样程序员不会陷人一种"太平盛世"的错觉。

弊端

潜在的性能瓶颈:消息代理可能存在性能瓶颈。幸运的是，许多现代消息代理都支持高度的横向扩展(就是加机器的意思）。
潜在的单点故障:消息代理的高可用性至关重要，否则系统整体的可靠性将受到影响。幸运的是，大多数现代消息代理都是高可用的。
额外的操作复杂性:消息系统是一个必须独立安装、配置和运维的系统组件。现在我们来深入看看基于消息的架构可能会遇到的一些设计难题。

处理并发消息和消息顺序

消息接收方通常是多个实例处理消息，即便单个服务实例也可能用多个线程同时处理消息。所以带来的挑战就是如何保证每个消息只被处理消息，且按发来顺序处理。如消息发送方发来3个消息，创建订单、更新订单、取消订单，消费方要按顺序处理，且每个消息处理一次。

现代消息代理常用的解决方案是使用分片（分区）通道。

分片通道由两个或多个分片组成，每个分片的行为类似于一个通道。
.发送方在消息头部指定分片键，通常是任意字符串或字节序列。通过计算分片键的散列来选择分片。
消息代理将接收方的多个实例组合在一起，并将它们视为相同的逻辑接收方。例如，Apache Kafka 使用术语消费者组。消息代理将每个分片分配给单个接收器。它在接收方启动和关闭时重新分配分片。
简单来说就是把消息放到一个通道里，只会被一个接收器消费。有顺序的消息放同一个通道，可以保证顺序。如按orderId进行分片。

处理重复消息

理想情况下，消息应该保证有且仅有一次传递。（就是kafka中提到的"精准一次"），但是这种传递方式成本非常高，大多数消息代理承诺至少成功传递一次。这时候就可能接收方有可能会收到重复消息，有两种方式可以处理它

编写幂等消息处理程序
跟踪消息并丢弃重复项

编写幂等消息处理器

工作中感觉这种用的最多，如创建订单，一般先查再插 + 订单号作为唯一索引，利用数据库保证幂等。

跟踪消息并丢弃重复消息

未完待续。。。