企业级大数据安全架构(二)安全方案

作者:楼高

1 Knox访问控制

Apache Knox是一个为Apache Hadoop部署提供交互的应用网关,通过其REST API和用户友好的UI,为所有与Hadoop集群的REST和HTTP交互提供了统一的访问点。Knox不仅仅是一个访问网关,它还具备强大的访问控制功能,可以精确管理用户对Hadoop资源的访问权限。另外,Knox与企业常用的身份管理和单点登录(SSO)系统集成,使得企业可以直接使用现有的身份验证系统,将其身份用于访问Hadoop集群,无需复杂的认证步骤,为企业数据安全提供了更高的便利性和保障性。

Knox 网关为多个 Hadoop 集群提供安全性,具有以下优点:

  • 简化访问:通过将 Kerberos 封装到群集中来扩展 Hadoop 的 REST/HTTP 服务。
  • 提高安全性:暴露 Hadoop 的 REST/HTTP 服务,而不会透露网络细节,提供 SSL 开箱即用。
  • 集中控制:集中执行 REST API安全性,将请求路由到多个 Hadoop 集群。
  • 企业集成:支持 LDAP,AD,SSO,SAML 等认证系统。

典型安全流程:防火墙,通过 Knox 网关路由

Knox 可以与两个不安全的 Hadoop 集群和 Kerberos 安全集群一起使用。在采用 Kerberos 安全集群的企业解决方案中,Apache Knox Gateway 提供了企业安全解决方案:

  • 与企业身份管理解决方案相结合
  • 保护 Hadoop 集群部署的细节(主机和端口从最终用户隐藏)
  • 简化客户需要交互的服务数量

2数据授权与管理

现在解决大数据平台中的第二个隐患即保护大数据平台中资源安全,资源包括数据资源(HDFS、HIVE、HBASE等),系统资源包括YARN资源队列等,虽然这些系统都有各自的权限管理功能,但是比较分散比较原始,此时我们需要引入Ranger统一管理配置

Apache Ranger是一个用来在Hadoop平台上进行监控,启动服务,以及全方位数据安全访问管理的安全框架。

Ranger愿景是在Apache Hadoop生态系统中提供全面的安全管理。随着企业业务的扩展,企业可能在多用户环境中运行多个工作任务,这就要求Hadoop内的数据安全性需要扩展为同时支持多种不同的需求进行数据访问,同时还需要提供一个可以对安全策略进行集中管理,配置和监控用户访问的框架。Ranger由此产生。

2.1 Ranger目标

(1)允许用户使用Web UI或者Rest API对所有和安全相关的任务进行集中化的管理

(2)允许用户使用一个管理工具对操作Hadoop体系中的组件和工具的行为进行细粒度的授权

(3)支持Hadoop体系中各个组件的授权认证标准

(4)增强了对不同业务场景需求的授权方法支持,例如基于角色的授权或者基于属性的授权

(5)支持对Hadoop组件所涉及安全的审计行为的集中化管理

2.2 Ranger支持的框架

(1)Apache Hadoop

(2)Apache Hive

(3)Apache HBase

(4)APache Storm

(5)Apache Knox

(6)Apache Solr

(7)Apache Kafka

(8)NIFI

(9)YARN

...

2.3 Ranger架构

3 Kerberos认证机制

解决Hadoop服务的安全隐患我们的思路是引入Kerberos认证机制,通过集成Kerberos协议,就能够使用Kerberos用户代替服务器本地的Linux用户,让大数据平台中Hadoop相关服务全部使用Kerberos用户通过认证中心去认证,防止datanode regionserver等组件冒充加入集群解决了服务端到服务端的认证,也解决了客户端到服务端的认证,提升平台的安全性

Kerberos 是一种网络认证协议,其设计目标是通过密钥系统为客户机 / 服务器应用程序提供强大的认证服务。该认证过程的实现不依赖于主机操作系统的认证,无需基于的信任,不要求网络上所有主机的物理安全,并假定网络上传送的数据包可以被任意地读取、修改和插入数据。在以上情况下, Kerberos 作为一种可信任的第三方认证服务,是通过传统的密码技术(如:共享密钥)执行认证服务的。

最后整个框架是以Knox做代理访问,kerberos做前端验证,ldap做后端用户存储,Ranger做数据权限控制。

更多技术信息请查看云掣官网https://yunche.pro/?t=yrgw

相关推荐
艾莉丝努力练剑16 小时前
【Linux网络】Linux 网络编程入门:UDP Socket 编程(下)
linux·运维·服务器·网络·计算机网络·安全·udp
风落无尘1 天前
《智能重生:从垃圾堆到AI工程师》——第二章 概率与生存
大数据·人工智能
档案宝档案管理1 天前
无缝对接财务软件,实现会计档案全流程自动化流转
大数据
alxraves1 天前
医疗器械软件注册指导原则注意事项
网络·安全·健康医疗·制造
juniperhan1 天前
Flink 系列第21篇:Flink SQL 函数与 UDF 全解读:类型推导、开发要点与 Module 扩展
java·大数据·数据仓库·分布式·sql·flink
科研前沿1 天前
2026 数字孪生前沿科技:全景迭代报告 —— 镜像视界生成式孪生(Generative DT)技术白皮书
大数据·人工智能·科技·算法·音视频·空间计算
Elastic 中国社区官方博客1 天前
Elastic-caveman : 在不损失 Elastic 最佳效果的情况下,将 AI 响应 tokens 减少64%
大数据·运维·数据库·人工智能·elasticsearch·搜索引擎·全文检索
互联网推荐官1 天前
上海软件定制开发全流程拆解:需求分析、技术选型与交付管理的工程实践
大数据·数据库·需求分析
samFuB1 天前
【数据集】分省农林牧渔总产值、农业总产值数据(2007-2024年)
大数据
liann1191 天前
3.2_红队攻击框架--MITRE ATT&CK‌
python·网络协议·安全·网络安全·系统安全·信息与通信