华为公司将自助分析作为一种公共能力,在企业层面进行了统一构建。一方面,面向不同的消费用户提供了差异性的能力和工具支撑;另一方面,引入了"租户"概念,不同类型的用户可以在一定范围内分析数据、共享数据结果。
1. 针对三类角色提供的差异性服务
面向三类角色的分析架构能力。
(1)面向业务分析师,提供自助分析能力,业务人员通过"拖、拉、拽"即可快速产生分析报告
- 基于多租户环境,提供数据资产订阅、报表作品搜索、服务订阅等能力。
- 实现从数据查询到数据拖拽式分析的端到端的一站式自助作业,增强数据即席查询和数据建模等功能。
- 提供数据搜索、数据获取、自助分析、数据消费等一站式自助分析服务,缩短报表开发周期。
- 支持租户管理、工具集管理、日志管理功能,集成数据底座权限模型,提供稳定的分析环境。
(2)面向数据科学家,提供高效的数据接入能力和常用的数据分析组件,快速搭建数据探索和分析环境
- 集成数据可视化、数据建模能力,降低数据分析门槛,提高平台的易用性。
- 识别公共诉求,提供R Studio、Zeppelin等工具集,增强NLP基础服务、人工智能等分析装备对于机会点的支撑能力,支撑各种大数据分析应用场景。
- 提供源系统到分析平台的数据实时同步功能。
- 为数据科学家提供数据目录导航入口。
- 提供数据分析环境,支持权限申请和计算资源的分配,缩短建模周期。
(3)面向IT开发人员,提供云端数据开发、计算、分析、应用套件,支撑海量数据的分析与可视化,实现组件重用
- 整合数据接入、数据计算、数据挖掘、数据展现等能力,提供高效、安全的数据集成、数据开发、报告开发、数据管理等服务,减少重复建设,实现组件重用。
- 整合第三方资源,依托HIC能力通道,提供自助、按需、在线的基础数据服务,包括分布式处理、实时处理、内存计算等。
2. 以租户为核心的自助分析关键能力
(1)多租户管理能力
租户是指把数据、分析工具、计算资源有机组合的工作环境,用户可以在租户内自助完成数据搜索、数据加工、在线分析、报表共享等工作。
多租户技术也称多重租赁技术,是一种软件架构技术。多租户技术可以实现多个租户之间共享系统实例,同时也可以实现租户的系统保证系统共性的部分被共享,个性的部分被单独隔离。例如,按国家设定不同租户,这样在本租户内共享该国的经营分析结果,共同进行异常分析和经营改进;同时,该租户数据对其他国家屏蔽,避免了数据扩散等安全风险。
为了合理分配软硬件资源,满足各领域在线、自助、个性化的数据分析诉求,促进数据的安全共享和价值变现,明确了租户申请、租户命名、数据准备、数据同步、数据加工、数据申请、权限管理、安全与隐私、运维与运营等方面的要求,旨在通过正确的引导,确保数据消费的便捷、高效与安全合规,支持公司的数字化转型。
在多租户建设中,相对于技术层面的解决方案,租户管理的职责需要在企业里建立共识,将共识以标准规范的形式固化下来。。
租户的4个关键角色如下所示。
- 租户Owner:租户管理的第一责任人,由公司正式任命的管理者或者变革项目经理担任,是租户内数据消费的总责任人。
- 租户管理员:由租户Owner指定并授权,是对租户内资产、用户、报告的日常维护、配置、授权承担具体管理职责的人员。
- 查看者:申请并被允许加入租户,只对租户内的报告有查看权限的租户用户。
- 分析师:申请并被允许加入租户,对数据资产可执行申请数据入租户、申请租户授权通过分析工具分析数据、制作报告、查看报告、分享报告等操作的租户用户。
(2)数据加工能力
在同一个租户空间内,对数据进行关联、过滤等操作,满足最终分析报告的数据需求。
用户可将多个数据进行关联,构建自己的宽表,可对宽表进行数据过滤,选择合适的字段以及增加计算字段。
(3)数据分析能力
基于消费场景,利用租户内授权的数据资产,通过分析工具对数据进行分析并生成可视化报告。
用户可以选择即席查询自行配置各类条件后的结果数据,再基于这些数据直接链接到不同的分析工具,进行进一步的数据分析。
1)即席查询
提供通过筛选条件展示结果数据的能力。
提供生产环境的实时数据内容,有助于用户通过筛选后的结果数据判断能否满足最终的分析需求。
分析结果支持以文件服务器的方式下载,满足本地化处理的需求,同时避免数据被过度共享。
2)可视分析
查看已授权并加工好的数据的详情,进入可视化分析阶段,充分利用企业现有的分析工具,或打通主流的商业分析工具,减少开发成本,降低学习成本。
数据打通,已授权加工后的数据可以直接进入分析工具进行分析操作。最大程度利用各种分析工具的已有功能。
(4)自助分享能力
基于自助分享能力,可以对分析报告进行密级设定和权限管理,向租户个人或者群体分享报告,不仅可以分享给本租户内指定的用户,而且可以进行跨租户分享。这样一方面可以扩大报告的使用范围,降低报告重复建设过程中的成本,另一方面也有助于解决分析结果不一致的问题。
- 对报表提供浏览和编辑能力,查找需要浏览的报表,选择查看、编辑、分享、删除功能。
- 提供对生成的报告定义密级的能力,报告生成者作为报告的Owner,定义密级和管控分享范围。