Java面试题精选:分布式(二)

十四、什么是可靠消息最终一致性方案?

可靠消息最终一致性方案。它是保证事务最终一致性的一种方案,允许数据在业务中出现短暂的不一致状态。

可靠消息最终一致性方案是指,当事务的发起方(事务参与者,也就是消息发送者)执行完本地事务后,同时发出一条消息,事务参与方(事务参与者,也就是消息的消费者)一定能够接收消息并可以成功处理自己的事务,如图所示。

这里面强调两点。

  • 可靠消息:发起方一定得把消息传递到消费者。

  • 最终一致性:最终发起方的业务处理和消费方的业务处理得完成,达成最终一致。

可靠消息最终一致性问题分析

上图是一个可靠消息服务最终一致性方案的流程图,从图中可以看出事务发起方将消息发送给消息中间件,事务消费方从消息中间件接收消息,事务发起方和消息中间件之间,事务消费方和消息中间件之间,都有网络通信,由于网络通信的不确定性,这块会导致数据的问题。下面针对导致的问题来分别进行解决。

(1)事务发起方本地事务和消息发送之间的原子性问题。

此问题是本地事务执行成功,消息必须发出去,否则丢弃消息,即本地事务执行成功和消息的发送成功,要么都成功,要么都失败。来一段伪代码参考一下。

powershell 复制代码
begin transaction;

发送消息;

操作数据库;

commit transaction;

这种情况下,如果发送消息成功,数据库操作失败,则无法保证原子性。调换一下顺序。

powershell 复制代码
begin transaction;

操作数据库;

发送消息;

commit transaction;

这种情况下,如果操作数据库出错,回滚,不影响数据;如果发送消息出错,也回滚,不影响数据。这么一看似乎可以保证原子性,但是会有一种情况,发送消息响应超时,导致数据库回滚,但是消息已经发送成功了。这时原子性还是无法保证的,这个时候就需要人工补偿了。

(2)事务消费方和消息消费的原子性问题。

此时要保证事务消费方必须能接受到消息,如果由于程序故障,导致事务消费方重启,那么需要消息中间件要有消息重发机制;由于网络延时的存在,当事务消费方消费消息成功,没有向消息中间件响应时,而消息中间件由于重发机制,会再次投递消息,就导致了消息重复消费的问题。此时在消费方要有幂等性解决方案。

十五、RocketMQ在分布式事务中如何应用的?

RocketMQ的事务消息,主要为了解决事务生产方执行业务和消息发送的原子性问题。事务消息流程如图所示。

事务消息的几种状态:

  • TransactionStatus.CommitTransaction: 提交状态,它允许消费者消费此消息。

  • TransactionStatus.RollbackTransaction: 回滚状态,它代表该消息将被删除,不允许被消费者消费。

  • TransactionStatus.Unknown: 中间状态,它代表需要检查消息队列来确定状态。

具体流程如下

(1)发送half message。在执行本地业务之前,先向消息队列发送一条事务消息,此时叫做half message,此时消息被标记为(Prepared预备状态),此时的消息是无法被消费者消费的,需要生产者对消息进行二次确认后,消费者才能去消费它。

(2)消息队列回应half message发送成功。

(3)当事务发起方收到消息队列的成功响应之后,开始执行本地业务。

(4)如果本地事务执行成功,则向消息队列发送half message的确认,这样事务消费方就可以消费消息了。

(5)如果本地事务执行失败,则向消息队列发送half message的回滚,删除half message。事务消费方就无法消费消息。

(6)回查机制。当第4步无论是提交还是回滚,由于网络闪断,生产者应用重启等原因,导致生产者无法对消息队列中的half message进行二次确认(即上面的第4步骤,发送提交或者回滚消息)时,消息队列中的half message就不知道应该怎么办了。此时消息队列会定时扫描长期处于half message的消息,并发起一个回查机制,来确认此时的half message应该是提交还是回滚。此时,消息队列主动询问生产者该消息的最终状态(提交还是回滚),即为消息的回查机制。

十六、请说说微服务注册中心的存储结构

可以类比通讯录。

生活中的通讯录示例。

姓 名 电话
张三 139xxxxxxxx

注册中心示例

服务名 服务信息
order-service(订单服务) 服务的IP地址,服务端口,服务对外提供的URL等

可以联想到Java中常用的数据结构Map。

存储结构是用的ConcurrentHashMap,它的键值是服务名,值是个Map。而值的Map中键是服务实例ID,值是租约(租约里面包括服务信息)。

powershell 复制代码
key: value

<服务名:<服务实例:ip+port,服务配置等等。>>

十七、设计一个注册中心需要写哪些接口?

大家想一下,服务启动后,是否需要向注册中心进行注册?所以注册中心需要提供一个接口,让服务调用它来进行服务的登记注册,这就是注册中心的第一个功能, 接受服务注册

服务注册完成后,注册中心得知道这个服务是否还是有效服务?所以此时需要服务定期地告诉注册中心,自己的工作状态(是否可用)。此时需要注册中心提供第二个功能, 接受服务心跳

当服务下线时,要通知注册中心自己要下线,注册中心需要提供对应的接口,来让服务调用。此时需要注册中心的第三个功能, 接受服务下线

如果服务挂了,没有及时通知注册中心,此时注册中心也发现服务,最近没有发送心跳。注册中心要主动剔除挂了的服务。此时需要注册中心第四个功能, 服务剔除

注册表中存储的信息,是要供其他服务查询的,就像通讯录一样,是要供主人查阅的,所以注册中心还需要第五个功能, 查询注册表中的服务信息

一般微服务中,每个服务都要避免单点故障,注册中心也要做集群,所以还要涉及到注册中心间,注册信息的同步。这就是注册中心的第六个功能, 注册中心集群间注册表的同步

如果让你开发,是不是也能开发出一个注册中心呢?其实本质就是一个web服务,提供上面分析的5个接口,供服务调用。这就是平时所说的 注册中心服务端 。那对应的调用注册中心的服务(业务服务),一般称之为 注册中心客户端

十八、谈谈你对RESTful规范的理解?

RESTful就是普通的http请求。其中REST表示Resource Representational State Transfer,直接翻译即"资源表现层状态转移"。

  • Resource代表互联网资源。所谓"资源"是网络上的一个实体,或者说网上的一个具体信息。它可以是一段文本、一首歌曲、一种服务,可以使用一个URI指向它,每种"资源"对应一个URI(统一资源标识符Uniform Resource Identifier)。

  • Representational是"表现层"意思。"资源"是一种消息实体,它可以有多种外在的表现形式,把"资源"具体呈现出来的形式叫作它的"表现层"。例如说文本可以用TXT格式进行表现,也可以使用XML格式、JSON格式和二进制格式;视频可以用MP4格式表现,也可以用AVI格式表现。URI只代表资源的实体,不代表它的形式。它的具体表现形式,应该由HTTP请求的头信息Accept和Content-Type字段指定,这两个字段是对"表现层"的描述。

  • State Transfer是指"状态转移"。客户端访问服务的过程中必然涉及数据和状态的转化。如果客户端想要操作服务端资源,必须通过某种手段,让服务器端资源发生"状态转移"。而这种转化是建立在表现层之上的,所以被称为"表现层状态转移"。客户端通过使用HTTP协议中的常用的四个动词来实现上述操作,它们分别是获取资源的GET、新建或更新资源的POST、更新资源的PUT和删除资源的DELETE。

  • RestTemplate是由Spring提供,用于封装HTTP调用,它可以简化客户端与HTTP服务器之间的交互,并且它强制使用RESTful风格。它会处理HTTP连接和关闭,只需要使用者提供服务器的地址(URL)和模板参数。

十九、分布式系统中为什么引入熔断?

如图所示,C服务和D服务调用B服务,B服务调用A服务。在下面情况1中,服务正常调用。服务在运行过程中,A服务发生故障(网络延时,服务异常,负载过大无法及时响应),系统变成了情况2。由于B服务调用A服务,A服务出故障,导致B服务调用A的代码处也出故障,此时B服务也出故障了,系统变成了情况3。以此类推,系统最终发展成A、B、C、D所有的服务都出错了,整个系统崩塌了。这就是雪崩

微服务系统之间通过互相调用来实现业务功能,但每个系统都无法百分之百保证自身运行不出问题。在服务调用中,很可能面临依赖服务失效的问题(网络延时,服务异常,负载过大无法及时响应),导致服务雪崩,这对于一个系统来说是灾难性的。因此需要一个组件,能提供强大的容错能力,当服务发生异常时,能提供保护和控制,把影响控制在较小范围内,不要造成所有服务的雪崩。

熔断开关状态:开(走降级的方法),关闭(正常的调用),半开()

二十、请描述一下熔断和降级的区别?

从两方面来阐述。

(1)相似性:

①目的一致:都是从可用性和可靠性着想,为防止系统的整体响应缓慢甚至崩溃,而采用的技术手段。

②最终表现类似:对于两者来说,最终让用户体验到的是某些功能暂时不可达或不可用。

③粒度一致:都是服务级别的。

④自治性要求很高:熔断模式一般都是服务基于策略的自动触发,降级虽说可人工干预,但在微服务架构下,完全靠人显然不可能,开关预置、配置中心都是必要手段。

(2)区别:

①触发原因不一样:服务熔断一般是某个服务(下游服务)故障引起,而服务降级一般是从整体负荷考虑。

②管理目标的层次不一样:熔断时一个框架级的处理,每个服务都需要,而降级一般有业务层级之分,例如,降级一般在服务调用的上层处理。

二十一、如何提升系统的并发能力?

分流:负载均衡,消息队列,数据库拆分

导流:缓存,cdn

并行/发:看具体业务。

二十二、你是依据什么来进行服务划分的?

进行微服务设计时,服务的数量相对于单体应用来说,会比较多(你在公司中,有多少个服务)。考虑的重点就是如何准确识别系统的隔离点,也就是系统的边界。只有每个服务的边界确定了,才能在以后的开发中做到更好的协作。识别系统的隔离点。

结合具体业务。电商。负载均衡。不得不拆。

二十三、微服务设计一般都遵循了什么原则?

(1)单一职责原则。让每个服务能独立,有界限的工作,每个服务只关注自己的业务。做到高内聚,服务和服务之间做到低耦合。

(2)服务自治原则。每个服务要能做到独立开发、独立测试、独立构建、独立部署,独立运行,与其他服务进行解耦。

(3)轻量级通信原则。让每个服务之间的调用是轻量级,并且能够跨平台、跨语言。例如采用RESTful风格,利用消息队列进行通信等。

(4)粒度进化原则。对每个服务的粒度把控,其实没有统一的标准,这个得结合解决的具体业务问题。不要过度设计。服务的粒度随着业务和用户的发展而发展。

软件是为业务服务的,好的系统不是设计出来的,而是进化出来的。

二十四、什么是最大努力通知方案?

如果接入过支付宝或者微信的支付接口,会遇到这样一种流程。例如,APP调用支付宝或微信的SDK(Software Development Kit软件开发工具包)进行了支付,钱已经从用户的支付宝或微信账户,转到了公司(开发APP的公司)的支付宝或微信账户上,但是支付系统,并不知道钱是否已经支付成功,需要支付宝或者微信回调公司的支付系统,才能进行后续的业务,如图所示。

这其实就是一个最大努力通知的解决方案。在方案中主要保证两点:

(1)有一定的消息重复通知机制。因为接收通知方(图中的我方支付系统)可能没有接收到通知,此时要有一定的机制对消息进行重复通知。

(2)消息校对机制。如果尽最大努力也没有通知到接收方,或者接收方消费消息后要再次消费,此时可由接收方主动向通知方查询消息信息来满足需求。

这种解决方案,其实针对内部系统和外部系统,有不同的做法。

(1)公司内部系统。针对公司内部系统来做的话,可以通过系统直接订阅消息队列来完成。因为都是自己的系统,直接订阅就可以。

(2)公司外部系统。针对公司外部系统来做的话,直接让消费方订阅消息队列就有点不合适了,毕竟不能让两家公司同时对一个消息队列进行操作,所以此时,可以在内部写一个程序来订阅消息队列,通过RPC的方式,调用消费方,使其被动的的接受通知消息。在接支付宝和微信时,一般都是采用这种方式。

二十五、spring cloud和Dubbo你是如何做选择的?

Spring Cloud Dubbo
注册中心 Eureka,Nacos,Consul,ETCD,Zookeeper Zookeeper
服务间调用方式 RESTful API 基于 http协议 RPC基于dubbo协议
服务监控 Spring Boot Admin Dubbo-Monitor
熔断器 Spring Cloud Circuit Breaker 不完善
网关 Zuul,Gateway
配置中心 Config,Nacos
服务追踪 Sleuth+Zipkin
数据流 Spring Cloud Stream
批量任务 Spring Cloud Task
消息总线 Spring Cloud Bus

从上面的比较可以看出,Spring Cloud的功能比Dubbo更全面,更完善,并且作为Spring 的旗舰项目,它可以与Spring其他项目无缝结合,完美对接,整个软件生态环境比较好。

Spring Cloud就像品牌机,整合在Spring的大家庭中,并做了大量的兼容性测试,保证了机器各部件的稳定。

Dubbo就像组装机,每个组件的选择自由度很高,但是如果你不是高手,如果你选择的某个组件出问题,就会导致整个机器的宕机,造成整体服务的可不用。

二十六、Ribbon的原理是什么?

使用:

powershell 复制代码
@LoadBalanced
RestTemplate 

重点答以下三点。

(1)通过拦截器对被注解@LoadBalanced修饰的RestTemplate进行拦截。

(2)将RestTemplate中调用的服务名,解析成具体的IP地址,由于一个服务名会对应多个地址,那么在选择具体服务地址的时候,需要做负载均衡。

(3)确定目标服务的IP和PORT后,通过Httpclient进行http的调用。

二十七、认证和授权

(1)Authentication(认证) 是验证您的身份的凭据(例如用户名/用户ID和密码),通过这个凭据,系统得以知道你就是你,也就是说系统存在你这个用户。所以,Authentication 被称为身份/用户验证。

(2)Authorization(授权) 发生在 Authentication(认证) 之后。授权,它主要掌管访问系统的权限。例如有些特定资源,只能是具有特定权限的人才能访问例如admin,有些对系统资源操作例如删除、添加、更新只能特定人才具有。

二十八、什么是Cache Aside机制?

Cache Aside(旁路缓存)是一种缓存数据更新机制,可以用于优化系统性能,缓解数据库等数据源的压力。在Cache Aside机制中,系统将缓存视为一个辅助的存储介质,当需要访问某个数据时,系统首先尝试从缓存中获取该数据,如果缓存中不存在该数据,则从数据库等数据源中获取数据,并将数据进行缓存。此时,缓存中就有了该数据的副本,下次需要访问该数据时就可以直接从缓存中获取,而无需再次查询数据库。

当进行数据更新时,除了对数据库进行更新,还需要同时更新缓存。如果只更新数据库而不更新缓存,那么下一次读取该数据时就可能会从缓存中读取到旧的数据。为了避免这种情况的发生,可以通过主动更新缓存或者让缓存过期来实现。主动更新缓存是指在更新数据库后,立即更新缓存中对应的数据。这样可以保证缓存中的数据和数据库中的数据保持一致。让缓存过期是指设置缓存数据的失效时间,当缓存数据过期后,下一次读取该数据时会从数据库中获取最新的数据,并将其更新到缓存中。

Cache Aside是一种缓存数据更新机制,可以有效地提高系统的性能,同时也可以保证数据的一致性和可靠性。在使用Cache Aside机制时需要考虑缓存的大小、缓存的策略、数据库更新时的缓存处理、缓存穿透和缓存雪崩等问题,这些都需要针对具体的应用场景进行合理的设计和调整。

二十九、什么是Read/Write Through机制

在Cache Aside中,有概率虽然很低出现数据不一致的情况,我们也用了延迟双删,但还是比较复杂。但要想避免缓存不一致的出现也很简单即进行写入操作时,直接将结果写入缓存,而再从缓存同步写入到数据提供方。等写入数据提供方操作结束后,写入操作才被返回。

这就是Read/Write Through写入机制

在这种机制下,调用方只需要和缓存打交道,而不需要关心缓存后方的数据提供方。而由缓存来保证自身数据和数据提供方的一致性。

结论:读操作只和缓存打交道,直接读取缓存的结果;写操作的话,调用方写入缓存,再由缓存同步写入数据提供方。

和Cache-Aside的区别?

在Cache Aside机制中,数据写入缓存的操作,是由调用方的查询结果触发的,

而在Read/write through 机制中,则需要缓存在启动时,自身完成将所有数据从数据提供方读入缓存的过程(在项目启动的时候,其实初始化什么也没有,也没有什么需要读取的,一会有修改,缓存就是新的数据,也不用读)。

比较一下Cache Aside和Read/write through机制。在Cache aside中,缓存只是一个辅助的存在,即使缓存不工作,调用方也可以通过数据提供方完成所有的读写操作,正如其名,缓存在边上,像胯子。

而在Read/write through中,缓存直接对接了调用方,屏蔽了数据提供方,这就意味着缓存系统不可或缺,要求十分可靠。

相关推荐
我科绝伦(Huanhuan Zhou)2 分钟前
Linux 系统服务开机自启动指导手册
java·linux·服务器
旦沐已成舟1 小时前
K8S-Pod的环境变量,重启策略,数据持久化,资源限制
java·docker·kubernetes
S-X-S1 小时前
项目集成ELK
java·开发语言·elk
Ting-yu1 小时前
项目实战--网页五子棋(游戏大厅)(3)
java·java-ee·maven·intellij-idea
程序研6 小时前
JAVA之外观模式
java·设计模式
计算机学姐6 小时前
基于微信小程序的驾校预约小程序
java·vue.js·spring boot·后端·spring·微信小程序·小程序
黄名富6 小时前
Kafka 日志存储 — 日志索引
java·分布式·微服务·kafka
m0_748255026 小时前
头歌答案--爬虫实战
java·前端·爬虫
DM很小众6 小时前
Kafka 和 MQ 的区别
分布式·kafka
小白的一叶扁舟7 小时前
深入剖析 JVM 内存模型
java·jvm·spring boot·架构