软件架构
定义: 是一个系统的基本组织,由其组件、组件之间的关系以及与环境的关系组成,同时包括设计和演化的原则
核心概念:
- 组件:系统的功能单元,负责特定任务的执行。例如模块、服务、类、库等
- 连接器:定义组件之间如何交互的机制,包括数据流、调用协议等。例如HTTP、消息队列、函数调用等
- 关系:描述组件之间的依赖或交互方式。例如调用关系、数据共享、事件发布-订阅模式等
- 架构风格:一组通用的设计原则和模式,例如分层架构、微服务架构、事件驱动架构等
- 质量属性(QA):系统非功能需求,包括性能、安全性、可扩展性、可维护性等,这些属性对架构设计有重要影响
- 视图:软件架构通常以不同的视图来呈现,帮助不同角色(如开发者、运维人员)理解系统。常见的视图有逻辑视图、物理视图、开发视图、运行时视图等
作用:
- 指导开发:提供系统开发的蓝图,明确系统的结构和开发方向
- 支持决策:帮助团队衡量QA,如性能和安全之间的平衡
- 促进沟通:通过架构视图和文档,促进团队成员之间的沟通和理解
- 适应变化:通过合理的设计原则和模式,使系统能适应需求变化和技术演进
实践:
- 需求分析:识别功能性和非功能性需求
- 选择架构模式:单体架构、微服务架构
- 定义组件和接口:明确系统模块的职责和交互方式
- 验证和优化:通过架构评审或原型验证设计是否合理
三种视图结构
模块结构
概述: 描述系统的静态分解,即系统由哪些模块组成,以及这些模块之间的关系
核心特点:
-
关注开发时的静态组织
-
体现模块的职责分配和分层结构
-
主要面向开发者和架构师,帮助理解代码的分解和组织
主要形式:
- 分层结构 :
- 系统被分为若干层,每层负责特定功能,并依赖于下层
- 示例:表示层(UI) -> 业务逻辑层(BLL) -> 数据访问层(DAL)
- 分块结构:
- 系统被分解为功能模块,强调模块的职责和边界
- 示例:用户模块、订单模块、支付模块
- 使用结构:
- 描述模块之间的依赖关系
- 示例:模块A使用模块B的接口
作用:
- 确定模块的职责和边界,便于开发分工
- 明确模块之间的依赖关系,避免循环依赖
分配结构
概述: 描述系统的动态部署,即软件模块如何分配到硬件或组织上运行
核心特点:
- 关注系统在实际运行中的部署形态
- 面向运维工程师、架构师、强调部署、性能和资源分配
主要形式:
- 部署结构(Deployment Structure):
- 描述模块与物理硬件的映射关系
- 示例:Web服务部署在服务器A,数据库部署在服务器B
- 实施结构(Implementation Structure):
- 关注模块分配到开发团队或代码仓库的组织方式
- 示例:模块X分配给团队A,模块Y分配给团队B
- 工作分配结构(Work Assignment Structure):
- 关注模块与团队或人员的对应关系
- 示例:订单服务由团队A开发维护
作用:
- 确保资源利用的效率和系统性能
- 提供开发、部署和运维的清晰指导
C&C架构
概述: 描述系统的运行时视角,即组件如何通过连接器交互完成工作
核心特点:
- 关注系统的动态行为和交互模式,面向架构师和性能分析师
- 组件是独立功能单元,连接器是组件之间的通信机制
主要形式:
- 通信结构(Communication Structure):
- 描述组件之间的通信模式
- 示例:HTTP请求、消息队列、RPC调用
- 并发结构(Concurrency Structure):
- 关注组件之间的并发交互
- 示例:多个线程或进程之间的协作
- 协作结构(Coordination Structure):
- 描述组件如何协同完成任务
- 示例:客户端调用服务端,服务端调用数据库
作用:
- 描述系统的运行时行为,指导实现动态交互逻辑
- 帮助分析系统的性能、并发性和容错能力
七类设计决策
技术决策
概述: 选择实现系统的技术栈和工具,包括编程语言、框架、库、数据库、消息队列等
目的: 确保技术选型满足功能和非功能需求,同时考虑团队能力和项目环境
示例:
- 选择JS或TS开发前端
- 使用PostgreSQL作为关系型数据库
- 引入Kafka作为消息队列处理异步任务
架构模式决策
概述: 决定系统使用的整体架构模式,影响系统的高层结构和模块间交互方式
目的: 为系统的组织和分解提供整体指导框架
常见模式:
- 分层架构:将系统分为UI层、业务逻辑层和数据层
- 微服务架构:将系统拆分为多个独立服务,按业务模块划分
- 事件驱动架构:通过事件队列实现松耦合和异步通信
示例:
- 一个电商系统采用微服务架构来支持模块化和独立扩展
模块划分决策
概述: 决定如何将系统划分为功能模块,以及模块之间的职责和依赖关系
目的: 确保模块化设计,提高系统的可维护性和可扩展性
示例:
- 划分出用户模块、订单模块、支付模块,每个模块独立负责一部分业务逻辑
- 采用依赖注入(Dependenccy Injection)管理模块间的依赖
接口设计决策
概述: 决定模块或组件之间的交互接口,包括接口的协议、数据格式和调用方式
目的: 确保模块间的通信高效、清晰且符合需求
示例:
- REST API设计:定义一个/api/orders的POST接口用于创建订单
- 使用gRPC协议传输结构化数据,提高通信性能
- 确定内部模块使用接口,而外部模块暴露公共API
数据管理决策
概述: 决定如何存储、管理和访问数据,包括数据库选型、分区策略、缓存方案等
目的: 保证系统的数据一致性、持久性和高效访问
示例:
- 使用MySQL作为主数据库,redis用于缓存热数据
- 对大规模数据库采用分库分表策略
- 引入ElasticSearch提供全文检索功能
非功能需求决策
概述: 围绕系统的QA(性能、可用性、安全性、扩展性等)所作的设计决策
目的: 确保系统在功能之外的特性满足需求
示例:
- 为高并发场景设计负载均衡方案
- 提供每日备份机制以增强灾难恢复能力
- 使用OAuthr2协议确保系统的安全性
运维部署决策
概述: 涉及系统在实际运行环境中的部署方式、监控方案和故障处理策略
目的: 提高系统在生产环境中的可用性和可操作性
示例:
- 使用Docker容器化所有服务
- 部署Kubernetes集群管理微服务
- 设计健康检查和自动重启机制来处理服务故障
LTS
概述: Long-Term Support 是一个软件产品或版本提供长期维护和支持的策略,旨在为用户和开发团队提供更稳定的环境和更低的项目风险。
稳定性和可靠性
作用:
- LTS版本专注于稳定性,通常不会频繁引入重大变化和新特性
- 开发团队可以依赖一个稳定的版本,避免频繁的版本迁移带来的不确定性
降低风险:
- 减少由于升级或兼容性问题导致的功能中断
- 降低开发过程中不可预测的环境变化风险
安全性保障
作用:
- LTS版本的厂商或社区通常会长期提供安全补丁和漏洞修复
- 用户可以确保系统在生命周期内的安全性,即使版本较老
降低风险:
- 避免因不再维护的旧版本导致的安全漏洞
- 提供定期安全更新,降低系统收到攻击的可能性
成本控制
作用:
- LTS版本减少了频繁升级或迁移的需求,从而降低开发和运维成本
- 团队可以专注于功能开发,而非花费大量时间适配新版本
降低风险:
- 避免因频繁升级导致的不必要投入
- 减少开发周期内技术债务的积累
提高开发效率
作用:
- LTS版本提供长期支持,意味着工具链、依赖库和文档会保持一致性
- 团队可以专注于产品的核心功能,而非对应工具的环境的频繁变更
降低风险:
- 减少开发团队因频繁学习和适应新技术导致的效率下降
- 提高开发流程的一致性和可预测性
减少技术不确定性
作用:
- LTS版本的特性和行为经过充分测试和验证
- 减少因使用实验性或不稳定功能导致的不可预测后果
降低风险:
- 避免因新技术选择错误而引发的项目失败
- 提供长期验证的技术方案,适合关键任务和大规模项目
满足合规性和行业标准
作用:
- LTS版本通常更符合行业合规性要求
- 企业用户在选择软件时,LTS版本更易于通过合规审查
降低风险:
- 避免因使用未经过支持的版本导致的法律或合规问题
- 确保系统满足长期运行所需的行业标准
模式(Patterns)与策略(Tactics)的关系
定义与作用
模式:
- 定义:模式是经过验证的、在特定上下文中解决特定问题的高层设计方案或模板
- 作用:提供系统整体结构和模块间交互的通用解决方案
- 示例:
- 架构模式:如分层架构、微服务架构、事件驱动架构
- 设计模式:观察者模式、单例模式、工厂模式
策略:
- 定义:策略是实现系统QA的低层次技术方法或设计选择
- 作用:通过具体的实现手段优化系统的特定属性
- 示例:
- 性能策略:缓存数据、使用异步处理
- 安全策略:使用加密、身份验证
层次关系
模式是高层次的,策略是低层次的:
- 模式描述了整体设计框架,用于组织系统结构
- 策略是在模式中应用的具体方法,用于实现质量目标
模式包含策略:
- 一个模式通常由多个策略组成,这些策略支持模式的实现
- 示例:在微服务架构模式中,可能需要使用缓存策略来提高性能, 或者使用服务注册与发现策略来增强可用性
策略支持模式的质量目标:
- 模式的选择通常受到QA的驱动,而策略的应用则是为了更好地满足这些QA
设计关系
模式与策略的设计关系:
- 驱动关系:系统的QA需求驱动模式的选择,而模式的实现依赖策略的具体应用
- 组合关系:模式之间可以相互组合,一个系统可能同时应用多个模式,每个模式中使用相应的策略来支持QA
- 实践关系:在实际项目中,模式提供了整体解决方案,策略在实施过程中细化模式的细节
举例说明
分层架构模式:
- 模式描述:系统被分为表示层、业务逻辑层和数据访问层,每层负责特定职责
- 应用的策略:
- 性能策略:在业务逻辑层引入缓存以减少对数据层的请求
- 可靠性策略:在表示层使用超时和重试机制应对网络问题
- 安全策略:在数据访问层增加数据库连接加密
微服务架构模式:
- 模式描述:系统被拆分为多个独立服务,每个服务独立部署、独立运行
- 应用的策略:
- 性能策略:在每个服务之间引入消息队列以处理高并发
- 安全策略:使用OAuth2进行服务间身份验证
- 可用性策略:实现断路器模式以防止单点故障
事件驱动架构模式:
- 模式描述:系统基于事件通知机制运行,模块通过事件消息通信
- 应用的策略:
- 性能策略:使用异步事件队列处理大量并发事件
- 可靠性策略:引入事件持久化以防止消息丢失
- 扩展性策略:使用分布式事件总线支持水平扩展
质量属性(QA)
类型
运行时QA:
运行时QA | 概念和目标 | 示例策略 |
---|---|---|
性能(Performance) | 系统响应速度、吞吐量及资源利用率。目标是满足用户对响应时间或处理能力的期望。 | 缓存、负载均衡、异步处理、数据分片 |
可用性(Availability) | 系统在指定时间内的正常运行能力,通常以"运行时间的百分比"度量 | 冗余(Redundancy)设计、容错机制、健康检查与自动恢复 |
安全性(Security) | 保护系统免受未授权访问或攻击,保证数据和系统的机密性、完整性和可用性 | 加密、身份验证、访问控制、日志审计 |
可靠性(Reliability) | 系统在规定条件下和规定时间内执行成功功能的能力 | 冗余设计、重试机制、监控和报警 |
可扩展性(Scalability) | 系统在增加负载或资源后,仍然能有效处理任务的能力 | 水平扩展(增加节点)、垂直扩展(增强单节点能力)、使用分布式架构 |
可用性(Usability) | 系统对最终用户的易用性和可操作性 | 友好的用户界面、直观的导航、帮助文档 |
非运行时QA:
非运行时QA | 概念和目标 | 示例策略 |
---|---|---|
可维护性(Maintainability) | 系统的可修改性和可调试性,易于修复缺陷和适应需求变化 | 模块化设计、清晰的代码规范、自动化测试 |
可测试性(Testability) | 测试系统是否符合需求的容易程度,目标是确保问题可以快速发现和定位 | 测试驱动开发(TDD)、依赖注入、使用模拟(mock)测试 |
可部署性(Deployability) | 系统的快速部署能力,支持灵活升级和版本回退 | 容器化部署、蓝绿部署、持续交付 |
可移植性(Portability) | 系统在不同硬件或软件环境中运行的能力 | 使用平台无关技术、抽象接口层 |
可复用性(Resuability) | 系统组件的复用能力,用于节省开发时间和资源 | 组件化设计、使用共享库、标准化接口设计 |
互操作性(Interoperability) | 系统与其他系统或组件协同工作的能力 | 使用开放标准(如RESTful API)、数据格式转换(如JSON与XML) |
概念
核心特点:
- 非功能需求(NFRs):QA通常不直接涉及系统的功能,但它们对于系统是否能否满足用户需求至关重要的
- 权衡与优先级:不同QA之间可能存在冲突,例如提高性能可能会降低安全性,架构涉及需要根据项目目标进行平衡
- 驱动设计决策:QA决定了架构模式、组件划分和系统部署方式
属性场景(Quality Attributes Scenarios) :
为了明确和测试QA,通常使用属性场景来定义其需求和评估标准。一个完整的属性场景包括:
- 刺激源:触发系统的外部或内部事件
- 刺激:对系统施加的具体操作
- 环境:系统在何种状态下发生刺激(如正常负载或高负载)
- 响应:系统在刺激下的行为
- 响应度量:用于评估响应是否达到期望的指标
策略
通用策略
- 模块化设计:通过分离关注点提高可维护性、可测试性和可复用性
- 分层架构:支持扩展性、可移植性和安全性
- 容错设计:提高可靠性和可用性
- 性能优化:如引入缓存、压缩数据、负载均衡等
具体QA策略
概览:
QA | 策略 |
---|---|
性能 | 使用缓存| CDN | 索引优化 | 减少数据传输量 | 异步处理耗时任务 |
安全性 | 加强访问控制 | 实现日志记录与审计 | 使用TLS/SSL协议保护传输数据 |
可用性 | 实现自动恢复机制 | 增加故障转移(Failover) | 使用负载均衡 |
可靠性 | 数据冗余与备份 | 使用事务来保证数据一致性 | 实现健康检查与监控 |
可维护性 | 实现代码分层与模块化 | 遵循编码规范 | 使用自动化工具生成测试和文档 |
可扩展性 | 引入分布式架构 | 水平扩展(增加服务器) | 垂直扩展(提高硬件性能) |
互操作性 | 使用开发协议和标准 | 提供明确的API文档 | 支持多种数据格式的转换 |
可用性和相关策略
概述: 系统在指定时间内保持正常运行并提供服务的能力,通常用"运行时间百分比"来衡量
目标:
- 确保服务不中断
- 快速恢复故障
- 提供冗余和容错能力
故障检测:
- 健康检查(Health Check):周期性检查服务或组件是否正常工作。比如HTTP健康检查接口
/health
- 心跳机制(Heartbeat Mechanism):服务通过定期发送心跳信号告知其他组件其状态。比如分布式系统中,节点通过心跳确认彼此在线
- 监控与日志:实时监控关键性能指标(如响应时间、错误率),并记录日志以便问题排查。工具Prometheus、Grafana
故障处理:
- 自动故障转移(Failover):在主节点故障时,将流量自动切换到备用节点。使用AWS的弹性负载均衡(ELB)和多区域部署
- 数据冗余与备份:通过复制数据或定期备份防止因数据丢失导致系统不可用。比如使用RAID、数据库库复制(MySQL主从复制)
- 断路器模式(Circuit Breaker Pattern):在故障频繁时临时停止对问题服务的调用,避免系统过载
快速恢复:
- 重试机制:在失败时自动重试,以应对短暂性故障。比如API调用失败后每隔几秒重试
- 自动化恢复:利用容易编排工具(如Kubernetes)自动重新启动失败的服务
性能和相关的策略
概述: 衡量系统在不同负载下完成任务的效率,主要涉及响应时间、吞吐量和资源利用率
目标:
- 降低响应时间
- 提高系统处理能力(吞吐量)
- 合理使用系统资源
响应时间优化:
- 缓存(Caching):减少重复计算或数据库查询,将常用数据缓存在内存中。比如使用Redis或Memcached
- CDN(内容分发网络):加速静态内容的分发,减少延迟。比如使用Cloudflare加快网页加载速度
- 异步处理:将耗时任务放入后台队列,避免阻塞主线程。比如使用消息队列RabbitMQ/Kafka
吞吐量提升:
- 负载均衡(Load Balancing):将请求分发到多个服务器,避免单点瓶颈。比如Nginx、HAProxy
- 数据库分片(Sharding):将数据分布到多个数据库,提高读写并发性能
资源优化:
- 压缩与最小化:压缩文件大小,减少网络传输开销
- 优先级调度:为高优先级任务分配更多资源
安全性及相关的策略
概述: 是保护系统及其数据免受未授权访问、攻击和恶意行为的能力
目标:
- 保证数据的机密性、完整性和可用性
- 防止未授权的访问和攻击
身份验证与授权:
- 身份验证(Authentication):确认用户身份。比如使用OAuth2、JWT(JSON Web Token)
- 授权(Authorization):确定用户可以访问的资源范围。比如基于角色的访问控制(RBAC)
数据保护:
- 加密(Encryption):保护数据在传输和存储中的安全性。比如使用HTTPS(TLS/SLL),数据库字段加密
- 数据校验:使用哈希算法(如SHA-256)验证数据完整性
攻击防护:
- 输入验证:防止SQL注入和跨站脚本攻击(XSS)。比如使用参数化查询,过滤用户输入
- 防火墙与WAF(Web Application Firewall):阻止恶意流量。比如Cloudflare WAF
- 速率限制:限制单个IP或用户的请求频率,防止DoS攻击
安全监控:
- 安全事件日志:记录用户登录、失败尝试等行为。比如使用SIEM(Security Information and Event Management)工具
- 实时威胁检测:利用AI分析系统日志,识别潜在威胁
互操作性和相关策略
概述: 是指系统能够与其他系统或组件协同工作,并交换和利用信息的能力
目标:
- 通过标准接口实现不同系统间的兼容性
- 使服务之间可以无缝发现和协作
标准化通信:
- 使用开放协议和标准:如REST、gRPC、SOAP等
- 数据格式兼容性:支持JSON、XML等通用数据格式
服务发现: 服务发现使得系统组件能动态地找到彼此的位置,尤其是在分布式环境中。
- 客户端发现模式:客户端通过服务注册表查找其他服务的位置。比如Netflix Eureka
- 服务器端发现模式:客户端将请求发送到负载均衡器,由负载均衡器查找服务。比如AWS Elastic Load Balancing
- DNS发现:通过DNS查找服务。比如Kubernete的CoreDNS
数据转换:
- 数据网关:在不同数据格式间转换。API Gateway将JSON数据转换为XML数据
- 中间件:提供不同系统之间的桥梁,解决协议或数据不匹配的问题
API设计:
- 提供清晰的文档和版本控制
- 使用工具如 Swagger/OpenAPI自动生成文档
架构模式
P2P
简介
概述: Peer to Peer 是一种分布式网络架构,其中每个节点(Peer)既可以充当客户端发送请求,也可以充当服务器响应请求。与传统的客户端-服务器模型不同,P2P取消了中心化的控制节点,所有节点地位平等
基本概念:
- 节点(Peer):系统中的每个实体都称为节点,既可以请求服务,也可以提供服务
- 去中心化:系统中不存在单一的中央控制点或服务器,减少了单点故障
- 资源共享:节点共享计算机资源(如存储、带宽)以提高整体效率
- 动态拓扑:节点可以自由加入和离开网络,网络拓扑结构可能会实时变化
- 分布式查找与路由:数据存储和检索由多个节点协同完成,典型算法由DHT(分布式哈希表)和超节点路由
相关的QA
可用性
挑战:
- 节点动态加入和离开可能导致网络不稳定
- 数据丢失或部分节点不可用时,服务可能受到影响
相关策略:
- 数据冗余与副本存储:将数据复制到多个节点以提高数据可用性
- 智能路由 与重试机制:在节点故障时,自动重新路由请求到其他节点
- 超节点:在纯P2P网络中引入部分高性能节点,负责关键任务(如路由或数据存储)
性能
挑战:
- 网络通信延迟:因分布式特性,节点间通信可能较慢
- 数据检索效率:节点数量庞大时,查找目标数据可能耗时较长
相关策略:
- 缓存策略(Caching):在常用节点间缓存常用数据以减少通信延迟
- 高效路由协议:采用如Chord和Kademlia的DHT算法,优化节点间查找
- 负载均衡:将任务动态分配到多个节点,避免部分节点过载
可靠性
挑战:
- 节点故障可能导致数据丢失或网络分割
- 系统规模扩大可能影响网络健壮性
相关策略:
- 容错机制(Fault Tolerance):通过校验和机制、节点间心跳检测确保网络健壮性
- 定期同步:确保副本数据一致性和完整性
可扩展性
挑战:
- 节点数量大幅增加时,可能引发网络拥堵或管理复杂度
相关策略:
- 分层架构:通过超节点实现逻辑分区管理,减少全网通信
- 动态负载均衡:实时检测并调整节点任务分配,减轻单点压力
优势
- 去中心化
- 高扩展性
- 高资源利用率
- 低成本
弱点及改进方法
不稳定性(节点频繁加入或离开):
- 使用稳定性协议(如Gossip协议)快速感知网络拓扑变化
- 引入超节点机制,让稳定节点承担重要角色
数据一致性问题:
- 使用强一致性模型(如Paxos、Raft)保障关键数据的一致性
- 引入事件驱动的同步机制确保节点间的状态同步
安全问题:
- 采用加密通信(如TLS)防止数据泄露
- 通过认证机制防止恶意节点加入
查找效率问题:
- 优化分布式哈希表(DHT)路由协议(如Kademlia的高效查找算法)
- 引入缓存机制减少频繁数据查找
跟踪
跟踪系统需要监控以下方面:
- 节点状态:监控节点的在线状态、负载情况以及资源利用率
- 网络拓扑:实时可视化网络连接结构,记录拓扑变化
- 数据传输:跟踪数据传输延迟、吞吐量以及失败率
- 故障日志:记录节点故障、网络分裂等异常事件,用于分析和改进
工具和技术:
- 分布式监控系统,如Prometheus和ELK
- 去中心化追踪协议,如分布式日志协议
MapReduce
概述: 是一种分布式计算架构模式,用于处理和生成大规模数据库。核心思想是将任务分为映射(Map)和归约(Reduce)两个阶段,适用于大规模数据的并行处理
核心概念
映射(Map):
- 将输入数据分割成小的子任务,每个子任务独立处理
- 通过映射函数生成键值对(Key-Value Pair),便于后续分组和归约
归约(Reduce):
- 将映射阶段生成的中间键值对按照键分组
- 对每个分组应用归约函数,聚合或总结结果,生成最终输出
分发(Distribution):
- 数据和任务分布在多个节点上进行并行计算
- 中间结果通过分布式存储进行管理
容错机制:
- 由于MapReduce在分布式环境中运行,节点可能发生故障,系统会自动重新分配失败任务,确保整体计算的完成
工作流程
- 数据分片(Data Splitting):将输入数据划分成固定大小的分片(Split),分配到各个计算节点
- Map阶段:每个节点运行Map函数,将数据转换为中间键值对
- Shuffle阶段(分组与排序):
- 将Map输出的中间结果根据键值分组并排序
- 分发到相应的Reduce节点
- Reduce阶段:每个Reduce节点对每组数据运行归约函数,生成最终结果
- 结果输出:通常存储在分布式文件系统中
相关的QA
可扩展性(Scalability):
- 特点:支持通过增加节点扩展处理能力
- 策略:任务分片和分发机制,使任务能够动态适应集群大小
性能(Performance):
- 特点:支持大规模并行计算
- 策略:
- 数据本地化(将任务调度到数据所在节点)
- 任务管道化(不同阶段的任务同时运行)
可靠性(Reliability):
- 特点:内置容错机制,支持节点故障恢复
- 策略:
- 定期存储中间结果(快照)
- 使用任务重试机制处理失败任务
可用性(Availability):
- 特点:分布式存储和计算,避免单点故障
- 策略:
- 主节点和从节点分工协作
- 使用分布式文件系统(如HDFS)保证数据持久性
优势
- 高并行性:分布式任务分配使得多个节点可以同时处理任务,提高效率
- 容错能力:自动任务重试和故障节点检测保证计算任务顺利完成
- 易于扩展:可以通过增加节点线性扩展系统性能
- 适应大规模数据库:适合对TB到PB级别的大数据集进行处理
弱点及改进方法
数据传输开销大:
- 问题:Map和Reduce阶段之间的数据传输量可能非常打,导致性能瓶颈
- 改进方法:
- 使用压缩减少数据传输量
- 优化Shuffle阶段的分组算法(如预分区)
不适合低延迟应用:
- 问题:MapReduce的批处理模式对实时性要求高的应用效果较差
- 改进方法:
- 使用Spark的内存计算替代MapReduce的磁盘IO模式
编程模型有限:
- 问题:MapReduce的编程模型适合线性任务,但对复杂逻辑支持有限
- 改进方法:
- 使用更高级的分布式计算框架(如Flink、Beam)
单点故障风险:
- 问题:主节点失效可能导致整个任务失败
- 改进方法:
- 主节点高可用配置
- 使用分布式协调服务(如ZooKeeper)管理任务
应用场景
- 大规模日志处理:分析网站访问日志、提取用户行为模式
- 搜索引擎索引构建:解析网页内容并生成倒排索引
- 分布式数据库处理:数据清洗、排序、聚合等操作
- 机器学习训练:并行计算模型参数
Pub/Sub
概述: Pub/Sub是一种面向消息通信的架构模式,适用于松散耦合的系统。在该模式中,发布者(Publisher)和订阅者(Subscriber)不直接交互,而是通过一个消息代理(Broker)或事件总线作为中介,实现消息的分发和处理。
核心概念
发布者:
- 负责生成消息或事件并发送给消息代理
- 特点:不关心谁会接收消息,只专注于生产
订阅者:
- 通过消息代理订阅感兴趣的消息类型
- 特点:只处理于自身相关的消息,不关系消息来源
消息代理(Message Broker):
- 作为中间层,负责消息的路由、分发和存储
- 典型实现包括RabbitMQ、Kafka、ActiveMQ
工作流程
基本步骤:
- 发布者将消息发送到消息代理,并附带消息的主题或标签(Topic/Channel)
- 消息代理根据主题或标签,将消息分类并存储
- 已订阅相关主题的订阅者接收消息代理推送的消息
消息类型:
- 主题(Topic):一种广播模式,消息发送到一个特定的主题,所有订阅者均可接收
- 队列(Queue):一种点对点模式,消息按FIFO顺序分发给单个订阅者
相关的QA
可扩展性(Scalability):
- 特点:通过分布式消息代理扩展系统处理能力
- 策略:
- 分片消息存储
- 使用多个代理节点均衡负载(如Kafka的分区)
可用性(Availability):
- 特点:分布式架构和副本机制确保消息持久化和高可用
- 策略:
- 副本存储(如Kafka)
- 主从备份和自动故障转移
性能(Performance):
- 特点:支持高吞吐量的并行消息处理
- 策略:
- 使用批量传输降低网络开销
- 消息压缩优化传输性能
可靠性(Reliability):
- 特点:确保消息不丢失或重复传递
- 策略:
- 消息确认机制(ACK/NACK)
- 使用事务性消息处理
优势
- 松耦合:发布者和订阅者互相独立,通过消息代理解耦
- 高扩展性
- 异步通信
弱点及改进方法
延迟问题:
- 问题:消息代理可能称为瓶颈,导致消息延迟增加
- 改进方法:
- 增加代理节点,提升并发处理能力
- 优化网络协议(如使用gRPC替代HTTP)
消息丢失风险:
- 问题:系统崩溃或网络中断可能导致消息丢失
- 改进方法:
- 使用持久化存储
- 消息代理支持事务性消息
重复消息处理:
- 问题:消息代理可能导致重复消息发送
- 改进方法:
- 使用幂等性设计,在订阅者侧确保重复消息无害
- 消息代理引入唯一标识符
运维复杂性:
- 问题:分布式消息代理系统需要专业运维
- 改进方法:
- 引入自动化运维工具(Kubernetes
- 使用托管服务(AWS SNS、Azure Service Bus
应用场景
- 实时事件驱动系统
- 分布式日志处理(如Kafka)
- 消息通知和广播系统(如电子邮件、短信通知)
- 流处理:分析实时数据流
MVC
概述: Model-View-Controller 广泛应用于构建交互式应用程序,特别是在Web开发中。MVC模式通过将应用程序分为三个主要部分:模型、视图和控制器实现了关注点分离(Speration of Concerns),使得代码更加模块化、可维护和可扩展
核心概念
模型:
- 职责:负责处理应用程序的核心数据和业务逻辑,它代表了应用程序的状态、数据以及数据库或其他持久化存储交互的功能
- 特点:
- 包含数据结构(如对象、表格、文档等)
- 提供数据访问和业务逻辑操作的接口
- 不依赖于视图或控制器,可以单独测试或维护
视图:
- 职责:负责显示模型的数据,并为用户提供交互界面,是用于与系统交互的界面部分,通常是HTML页面、桌面窗口或移动界面等
- 特点:
- 视图与模型解耦,只关心如何展示数据,而不关心数据的实际来源
- 接收用户输入,但不会直接处理这些输入,通常将其传递给控制器
控制器:
- 职责:负责接收用户输入、处理用户请求并更新模型和视图。它是视图和模型之间的中间层,确保数据流和控制流的正确性
- 特点:
- 接收用户操作(如点击按钮、提交表单)并调用模型进行数据更新
- 根据模型的变化更新视图,或者根据用户输入选择展示不同的视图
工作流程
- 用户通过视图与应用交互
- 用户的输入事件被控制器捕捉,控制器将请求转发给模型
- 模型根据控制器的请求处理数据,并更新状态
- 模型状态变化后,控制器更新视图,重新渲染数据给用户
用户输入 -> 控制器 -> 模型 -> 控制器 -> 视图
相关的QA
可扩展性(Scalability):
- 特点:由于MVC模式将应用程序的不同部分分离,可以独立扩展模型、是视图和控制器
- 策略:
- 模型和视图可以在不同的服务中扩展,控制器可以通过路由机制动态处理不同的请求
可维护性(Maintainability):
- 特点:通过关注点分离,MVC使得应用程序的各个部分更易于修改和扩展
- 策略:
- 通过解耦的设计,修改模型、视图或控制器的一部分不影响其他部分
- 可以在不同层次独立进行单元测试
可重用性(Reusability):
- 特点:模块化设计促进了不同部分的宠用,视图和控制器可以多次复用
- 策略:
- 视图和模型的解耦使得同一模型可以支持多个视图形式
优势
- 关注点分离
- 易于维护和扩展
- 支持多种视图展示(Web、桌面、移动程序)
- 提高开发效率
弱点及改进方法
复杂性增加:
- 问题:MVC模式处理简单应用时可能显得过于复杂
- 改进方法:
- 对于小型项目可以采用MVVM、MVP等轻量设计模式
- 在MVC中加入设计模式,如工厂模式和策略模式减轻复杂性
不适用所有应用:
- 问题:MVC模式特别适合数据驱动型应用,但对于具有复杂界面和业务逻辑的应用可能不够灵活
- 改进方法:使用MVVM或MVP
应用场景
- 许多Web框架如Django、Rails、Sping MVC
- 桌面开发框架如Java Swing、.NET WinForms等
- 移动应用开发
Pipe-and-Filter
概述: 管道-过滤器是一种常用于数据流处理的架构模式,特别适合处理流数据或需要依次处理多个阶段的任务。这个模式将应用程序的处理过程分解为多个独立的过滤器,并通过管道将过滤器连接起来。
核心概念
过滤器(Filter):
- 职责:是管道中的一个处理单元,负责对输入数据进行某种处理(如数据转换、过滤、聚合等)。每个过滤器通常是单一职责的、独立进行某一特定任务
- 特点:
- 接收输入数据,处理并输出结果
- 通常具有清晰的输入和输出接口
- 过滤器之间没有直接的依赖关系,增加或修改一个过滤器不会影响其他部分
管道(Pipe):
- 职责:管道用于连接各个过滤器,数据通过管道从一个过滤器流向下一个过滤器
- 特点:
- 管道是数据的传输通道,允许过滤器之间的数据流动
- 数据本身通常不进行任何数据处理,只负责传输数据
工作流程
- 数据输入:输入数据流经过管道进入第一个过滤器
- 数据处理:第一个过滤器处理数据,并将结果输出到下一个过滤器
- 数据传递:每个过滤器接收前一个过滤器的输出,进行处理,然后将结果传递给下一个过滤器
- 数据输出:最终通过管道传递给输出端
相关的QA
可扩展性(Scalability):
- 特点:可以灵活地通过增加新的过滤器或管道来扩展系统
- 策略:
- 增加更多过滤器来处理不同的任务
- 通过多线程或分布式计算提升性能和吞吐量
可维护性(Maintainability):
- 特点:每个过滤器都是独立的模块,易于修改和替换,不会影响整个系统
- 策略:
- 可以独立测试和更新每个过滤器
- 新功能可以通过添加新的过滤器来实现,而不需要重构整个系统
性能(Performance):
- 特点:是用于处理大量数据的场景,尤其是当数据需要经过多个独立处理阶段时
- 策略:
- 通过管道并行化或分布式处理提升性能
- 针对每个过滤器的性能进行优化
优势
- 模块化设计
- 可扩展性强
- 清晰的责任分离
- 简化调试与测试
- 支持并行处理
弱点及改进方法
数据传输开销:
- 问题:每个过滤器需要通过管道传递数据,可能会引入性能开销,特别时数据需要频繁地在过滤器之间传递时
- 改进方法:
- 可以优化管道的设计,减少不必要的传输步骤
- 在需要时将数据批量处理,减少管道开销
过滤器之间的依赖问题:
- 问题:如果过滤器之间存在数据依赖关系,处理链可能变得复杂
- 改进方法:
- 在设计时尽量减少过滤器间的依赖,可以通过异步处理或消息队列进行解耦
错误处理和恢复:
- 问题:由于过滤器通常是单向流动的数据,错误可能在中间阶段发生,导致整个数据流失败
- 改进方法:
- 引入容错机制,例如在每个过滤器中加入错误捕获和恢复策略
- 使用事务会回滚机制来确保数据处理的可靠性
应用场景
- 数据流处理系统:如数据分析系统,ETL工具
- 编译器:编译器的各个阶段(如词法分析、语法分析、优化)通常会采用管道与过滤器模式,每个过滤器负责特定的编译任务
- 日志处理系统:在日志收集与分析系统中,日志数据通过多个过滤器进行预处理(如解析日志格式、过滤敏感信息、转换日志格式等)
- 音视频处理系统:在音视频流处理中,每个过滤器负责处理视频帧、音频数据、最后输出处理后的流媒体数据
软件架构设计和评估工具
ATAM
概述: Architecture Tradeoff Analysis Method 是一种架构评估方法,旨在帮助架构师和团队分析软件架构的质量属性和设计决策之间的权衡(tradeoff),并帮助确定最适合项目的设计决策
步骤:
- 准备阶段:
- 选择架构团队:组件由架构师、开发人员、质量保证人员以及可能的利益相关者组成的评估团队
- 收集架构文档:准备架构文件、设计描述、功能要求等,以便评估
- 质量属性场景的定义:
- 需求收集:收集系统的主要质量属性要求(如性能、安全性等)
- 场景定义:与利益相关者一起,确定系统必须处理的关键场景,这些场景描述了系统如何在不同条件下运行,以及如何满足质量属性
- 架构分析:
- 识别架构决策:通过分析架构设计,识别与质量属性相关的架构设计决策
- 分析权衡:评估不同设计决策如何影响系统的质量属性,并识别潜在的权衡点。例如,提高系统的可扩展性可能会降低可维护性
- 风险识别与评估:
- 识别风险:基于架构决策的分析,识别可能影响系统成功的关键风险
- 评估风险的影响:评估每个风险的严重性和可能性,并提出相应的缓解措施
- 总结与报告:
- 总结结果:撰写评估报告,包含架构决策、风险、权衡和改进建议
- 建议架构改进:为架构的改进和优化提出建议,帮助架构团队做出更合适的设计决策
优势:
- 帮助识别架构设计中潜在风险和问题
- 使架构决策变得更加透明,并为利益相关者提供更清晰的决策依据
- 促进架构师之间的沟通和协作
ASRs
概述: Architecture Significant Requirements(架构显著需求)是影响软件架构设计的关键需求。它们不仅定义了系统的功能需求,还涉及到性能、安全性、可用性、扩展性等质量属性。ASRs通常决定了架构涉及的关键决策,并且对架构的整体结构、组件、接口设计等有重大影响
步骤:
- 需求收集:
- 从项目的需求文档、利益相关者会议等来源收集所有功能性和非功能性需求
- 需求通常被分为"显著需求"和"普通需求",显著需求(ASRs)是那些直接影响架构设计的需求
- 需求分类:
- 功能性需求:描述系统需要做说明(如用户认证、数据处理等)
- 非功能性需求:描述系统应如何做(如性能、可用性、可扩展性等)
- 识别ASRs:
- 从非功能性需求中,选择那些对架构有重大影响的需求。例如,若一个系统需要高并发数据访问,这将影响系统的架构设计,需要考虑性能、可扩展性等架构方面的决策
- 跟踪ASRs变化:
- 在软件开发过程中,跟踪ASRs的变化,确保架构设计始终符合这些关键需求
优势:
- 确保架构设计能够有效地满足项目的关键需求
- 通过定义ASRs,有助于明确架构的设计目标和评估标准
ADD
概述: Attribute-Driven Design 是一种迭代方法,允许架构师选择系统的一部分进行设计,并为这一部分所有具有架构意义的需求,然后创建并测试针对这一部分的设计。ADD的核心是围绕系统的质量属性,逐步细化架构,同时满足功能和非功能需求
关键点:
- 基于系统的QA和ASR来驱动设计过程的
- 是一种迭代方法,强调逐步设计和验证架构
Utility Tree
概述: 效用树是用于分析架构决策对质量属性的影响的工具。它是ATAM方法的一部分,帮助架构师和评估者理解不同设计决策对系统QA的具体影响。效应树通过将质量属性的要求分解为更小的子目标,帮助团队识别优先级最高的QA需求,并在架构设计中做出相应的权衡
步骤:
- 定义质量属性
- 构建效用树:
- 将每个QA进一步分解为更小的子目标。子目标描述了如何衡量和优化该QA
- 例如,性能的目标可以分解为"响应时间"、"吞吐量"、"并发性"等
- 确定优先级:
- 根据项目的需求和目标,评估不同QA和子目标的优先级。哪些QA对项目的成功最为关键,哪些是可以在后续阶段优化的
- 评估架构决策:
- 使用效用树来评估架构设计中的各个决策,通过分析这些决策如何影响不同QA和子目标,架构师可以更好地衡量结果
- 更新和调整:
- 在项目进展中,根据实际情况和需求变化调整效用树,确保架构设计能够始终满足关键QA需求
优势:
- 提供了一种系统化的方式来分析和优化QA
- 帮助团队聚焦于最重要的QA,并确保这些QA在架构设计中得到优先考虑
参与者角色
概述: Participants' Roles 是指在架构过程中的不同参与者及其职责。
架构师(Architect): 是架构设计过程中的核心任务,负责整体架构的设计、决策和指导。架构师在设计和决策过程中通常具有主导地位,确保系统架构能够满足所有QA
- 定义系统架构、技术堆栈和设计模式
- 确保架构能满足业务需求和质量属性需求
- 管理架构的复杂性,并确保其可扩展性和可维护性
- 在系统生命周期中,跟踪架构的变化,确保其与需求变化一致性
- 为开发团队提供架构指导,并解答架构相关问题
开发人员(Developer): 负责根据架构师的设计实现具体的功能和模块。开发人员通常会根据架构文档和设计方案来编码和构建系统的各个部分,并可能会在实现过程中提出技术上的改进建议
- 根据架构设计实现系统功能
- 保证代码质量,遵循架构设计中的约定和标准
- 与架构师和其他开发人员合作,确保各个模块的接口和交互符合架构要求
- 参与单元测试和系统集成,确保架构的实现能够顺利工作
项目经理(Project Manager): 负责管理项目的进度、资源、预算和团队协作。虽然项目经理不直接参与架构设计,但他们必须确保架构设计能够按时完成,并满足项目的资源需求和时间安排
- 管理项目进度和风险,确保架构设计按计划完成
- 协调各方参与者的合作
- 跟踪项目预算和资源分配,确保架构设计能够在可用资源范围内实现
- 与客户和利益相关者沟通,确保架构设计符合业务需求
测试人员(Tester): 验证架构设计和实现的系统是否符合质量标准。测试人员会根据架构文档和需求文档设计测试用例,并执行各种测试(单元测试、集成测试、系统测试等),确保架构的正确性和可靠性
- 设计和执行测试用例,确保系统的各项功能和QA符合要求
- 发现系统中的缺陷并报告给开发人员
- 参与架构评审和风险评估,帮助架构师识别潜在的设计问题
- 确保架构实现具有高可用性、可扩展性和安全性等关键QA
利益相关者(Stakenholder): 是对系统有直接或间接影响的人或组织。他们可以是业务人员、客户、终端用户、市场团队、法律团队等。利益相关者通常不会直接参与架构设计,但他们提供需求和反馈,这些反馈对架构设计的调整和优化至关重要
- 提供系统需求,确保架构能够满足业务目标
- 提供对架构设计和决策的反馈
- 参与架构评审过程,确保架构设计与业务需求一致
- 根据系统运行和维护的情况,提出对架构的改进建议
安全专家(Security Expert): 负责确保架构在设计和实现过程中满足安全性要求
- 识别架构设计中的安全风险,并提出相应的改进措施
- 设计并实施安全控制措施,如身份认证、数据加密和访问控制
- 在架构评审过程中审查系统的安全性,并验证架构是否符合安全最佳实践
开放题
抽象公共服务策略旨在减少耦合,但它也可能降低内聚性
耦合与内聚性:
- 耦合(Coupling):指的是系统中各个模块或组件之间的依赖关系。耦合越低,意味着模块间的依赖越少,系统的各个部分相对独立,便于维护和扩展。
- 内聚性(Cohesion):指的是模块内部各个组件或功能之间的关联程度。内聚性越高,意味着模块内的功能和组件越紧密地协作。
抽象公共服务策略:
- 指的是将系统中多个组件共享的功能或服务进行抽象,形成一个公共的服务层。这样,多个组件可以通过访问这个公共服务来避免重复实现相同的功能。通常,公共服务通过定义接口或服务抽象层来隐藏具体的实现细节
- 示例:一个电商系统中有多个模块(如支付、订单、用户管理等),这些模块可能会共享某些基础功能,如日志记录、身份验证、数据库访问等。为了避免各个模块重复实现这些功能,设计师可能会将这些功能抽象成一个公共服务,所有模块通过调用这个公共服务来获得这些功能
减少耦合:
-
抽象公共服务策略的核心目的是减少耦合,通过将常见的功能抽象成公共服务,系统的各个模块可以通过该服务进行交互,而不需要知道具体的实现细节。这种设计使得模块间的依赖减少,因为每个模块不再需要直接引用其他模块的具体实现,只需要依赖于公共服务的接口,这种松散的耦合关系提高了系统的灵活性和可维护性
-
示例:支付模块可以通过公共的支付服务接口来进行支付处理,这样更容易地修改或替换支付服务而不影响其他模块
可能降低内聚性:
- 因为通过抽象和拆分系统功能,可能会使得一些模块的职责变得不再单一,甚至不再专注于一个功能领域
- 示例:支付模块本应该专注于支付相关的逻辑,但如果它频繁地依赖于公共服务层来进行日志记录、身份验证等功能,那么支付模块的职责就变得不那么清晰,变得更加"分散"。虽然各个服务可以独立开发和维护,但这也可能导致模块的功能变得不再紧密相关,降低了模块内部的内聚性。
讨论编程语言的选择(技术选择的一个例子)及其与体系结构的一般关系
编程语言选择的考虑因素
系统需求与目标:
- 性能要求:对于高性能系统(如游戏引擎、实时系统等),可能需要选择具有高执行效率的编程语言,如C/C++
- 开发速度与易用性:如果系统需要快速开发,且业务逻辑比较复杂,可能更倾向于选择动态语言,如Python、Ruby或JavaScript,这些语言具有丰富的库和框架支持,可以大大加快开发速度
- 并发和分布式处理:对于需要大量并发处理的系统(如大规模分布式系统、云计算平台等),可以能会选择Go、Erlang、Rust这样的语言,它们内建强大的并发支持
体系结构的需求:
- 微服务架构:在微服务架构中,每个微服务可能采用不同的技术栈和编程与语言,可能是Java或C#,因为它们在企业级应用中有成熟的支持,而另一些微服务可能使用Go或Node.js,因为它们能够高效地处理并发请求
- 服务器无关架构:如果架构目标是跨平台或无服务器架构(如云函数),编程语言的选择就变得更加最重要。选择支持容器化(Docker)和五服务器架构的语言(如Node.js、Python或Go)可能会使得系统更容易部署到云平台上
团队技术栈与经验:
如果团队对某种语言有很强的熟练度,可以选择该语言提高开发效率和降低学习曲线。
性能与资源限制:
对于资源受限的系统(如嵌入式设备或移动设备),可能需要选择更加轻量级的语言或针对硬件优化的语言。例如C或Rust在性能和内存管理方面的控制能力优于Java或Python。
维护和可扩展性:
某些编程语言的设计理念和生态系统使得它们更适合维护和扩展,比如Java和C#
编程语言与体系架构的关系
架构风格的选择:
- 微服务架构:强调系统由多个独立的服务组成,每个服务可以使用不同的编程语言和技术栈。因此在这种架构下,编程语言的选择更多地受到服务单元的需求和团队技术栈的影响。
- 单体架构:所有的功能和模块都紧密耦合在一个应用中,可能需要选择一个同一的编程语言,通常是企业级语言,如Java或C#
- 事件驱动架构:强调系统通过事件进行通信和处理,语言的选择需要考虑事件流的高效处理。例如Node.js由于其事件驱动和非阻塞IO的特性,适合开发高并发的事件驱动系统。
架构的可扩展性与性能:
- 高并发和分布式系统:如GO和Erlang天生适合高并发和分布式系统,因为它们在并发处理、消息传递和容错方面具有内建的支持。
- 性能优化:对于需要极高性能的系统,如实时系统或需要低延迟的交易系统,选择像C++或Rust这样的语言,可以更好低控制内存和硬件资源,从而使得架构就具有更高的执行效率和更低的资源消耗
架构的可维护性和开发效率:
- 可维护性:面向对象编程语言提供了良好的模块化和封装特性,适合开发大型企业级应用。相比之下Python和Ruby提供了更简单的语法和更快的开发周期
- 开发效率:一些编程语言(如Python、Javascript)在开发速度和生态系统支持方面非常强大,适合快速构建和原型支持,通常用于敏捷开发方法中
设计高可测试性和高容错性的系统
可测试性: 使系统中的故障能够快速且轻松地暴露,以便在测试阶段能够检测并恢复故障
容错性: 使系统在运行时"隐藏"故障,通过机制如冗余、回退或恢复,确保系统在故障发生时仍能正常运行
兼容可测试性和容错性的设计方法:
- 故障注入测试:通过在测试阶段主动引入故障,观察系统的响应能力,从而兼容容错性和可测试性的目标。例如:
- 在分布式系统中模拟节点故障
- 注入网络延迟、数据损坏等问题以测试容错机制
- 增强日志和可观测性:
- 使用详细的日志记录和监控工具,暴露系统的内部状态
- 即使容错机制正在掩盖故障,日志和监控可以帮助开发者了解系统运行过程中的潜在问题
- 测试模式与生产模式分离:
- 测试模式:在测试环境,禁用部分容错机制,允许故障显现并方便调试
- 生产模式:启用完整的容错机制,确保系统的稳健运行
- 优雅降级:
- 设计容错机制时,使其在功能降级的同时保留部分信息暴露。比如当某个模块失效时,显示"降级模式"警告而非完全隐藏问题
- 冗余机制双重用途:
- 使用冗余组件不仅用于容错,还可以在测试阶段使用冗余组件来捕获隐藏的故障
- 例如在分布式系统中,通过比较多个副本的输出来检测潜在错误
为ATM设计安全性场景,并修改其设计以满足这些场景
安全性场景设计
防止未授权访问
- 场景描述:某用户尝试插入银行卡,但输入了三次错误的PIN码,系统应锁定该帐户并通知银行后台
- 安全需求:
- 必须限制PIN码的尝试次数
- 系统需实时记录帐户锁定事件并发送通知
防止数据泄露:
- 场景描述:ATM与银行服务器之间传输的数据被第三方拦截。需要确保敏感数据(如PIN码、帐户信息)不被窃取
- 安全需求:
- 数据传输必须采用加密协议(如TLS)
- PIN码等敏感信息在传输和存储时需加密
防止内部攻击
- 场景描述:内部工作人员尝试通过直接访问ATM设备或后端系统窃取用户数据。
- 安全需求:
- 系统需记录并监控所有管理员操作。
- 后端访问权限应采用最小权限原则,严格控制。
修改ATM设计以满足安全性场景
增加用户认证机制:
- PIN码验证失败3次后,锁定账户并通知银行后台。
- 支持生物识别(如指纹或人脸识别)作为双重验证。
加强数据加密传输:
- 使用TLS加密协议对数据传输进行加密。
- PIN码和账户信息在设备端进行加密,再传输至服务器。
后端访问控制:
- 对管理员和银行操作员的访问权限进行严格控制,所有操作需记录并可追溯。
- 定期审计后台操作记录,识别并防范内部攻击。
补充
CAP定理
概述: 它指出在一个分布式系统中,Consistency-Availability-Partition Tolerance(分区容错性)三者不能同时完全满足。在实际应用中,为了保证高可用性和分区容错性,通常牺牲强一致性,提供最终一致性
冗余设计
概述: 是一种通过引入额外资源或组件来提升系统可用性和容错能力的策略。其核心思想是通过增加冗余的计算、存储或网络资源,使系统在遇到故障时能够继续运行,从而减少服务中断的概率
主要形式:
- 硬件冗余:增加物理设备
- 软件冗余:在软件层面设计备用逻辑或服务
- 时间冗余:在系统中重复执行相同操作,以检测和修复偶发性错误
- 信息冗余:通过增加校验信息来检测和纠正数据错误
- 网络冗余:配置备用网络路径或路由器
实现方式:
- 主备切换(Active-Passive):一个主节点工作,备用节点处于待机状态
- 双活设计(Active-Active):多个节点同时处于活跃状态,共同分担负载
- 多重备份(N+1或N+M冗余)
- 数据复制(Data Repication):将数据复制到多个存储节点中
- 故障检测与切换:使用心跳检测和健康检查机制,即使发现故障并切换执行