【华为数据之道学习笔记】6-7打造业务自助分析的关键能力

华为公司将自助分析作为一种公共能力,在企业层面进行了统一构建。一方面,面向不同的消费用户提供了差异性的能力和工具支撑;另一方面,引入了"租户"概念,不同类型的用户可以在一定范围内分析数据、共享数据结果。

1. 针对三类角色提供的差异性服务

面向三类角色的分析架构能力。

1)面向业务分析师,提供自助分析能力,业务人员通过"拖、拉、拽"即可快速产生分析报告

  • 基于多租户环境,提供数据资产订阅、报表作品搜索、服务订阅等能力。
  • 实现从数据查询到数据拖拽式分析的端到端的一站式自助作业,增强数据即席查询和数据建模等功能。
  • 提供数据搜索、数据获取、自助分析、数据消费等一站式自助分析服务,缩短报表开发周期。
  • 支持租户管理、工具集管理、日志管理功能,集成数据底座权限模型,提供稳定的分析环境。

(2)面向数据科学家,提供高效的数据接入能力和常用的数据分析组件,快速搭建数据探索和分析环境

  • 集成数据可视化、数据建模能力,降低数据分析门槛,提高平台的易用性。
  • 识别公共诉求,提供R Studio、Zeppelin等工具集,增强NLP基础服务、人工智能等分析装备对于机会点的支撑能力,支撑各种大数据分析应用场景。
  • 提供源系统到分析平台的数据实时同步功能。
  • 为数据科学家提供数据目录导航入口。
  • 提供数据分析环境,支持权限申请和计算资源的分配,缩短建模周期。

(3)面向IT开发人员,提供云端数据开发、计算、分析、应用套件,支撑海量数据的分析与可视化,实现组件重用

  • 整合数据接入、数据计算、数据挖掘、数据展现等能力,提供高效、安全的数据集成、数据开发、报告开发、数据管理等服务,减少重复建设,实现组件重用。
  • 整合第三方资源,依托HIC能力通道,提供自助、按需、在线的基础数据服务,包括分布式处理、实时处理、内存计算等。

2. 以租户为核心的自助分析关键能力

(1)多租户管理能力

租户是指把数据、分析工具、计算资源有机组合的工作环境,用户可以在租户内自助完成数据搜索、数据加工、在线分析、报表共享等工作。

多租户技术也称多重租赁技术,是一种软件架构技术。多租户技术可以实现多个租户之间共享系统实例,同时也可以实现租户的系统保证系统共性的部分被共享,个性的部分被单独隔离。例如,按国家设定不同租户,这样在本租户内共享该国的经营分析结果,共同进行异常分析和经营改进;同时,该租户数据对其他国家屏蔽,避免了数据扩散等安全风险。

为了合理分配软硬件资源,满足各领域在线、自助、个性化的数据分析诉求,促进数据的安全共享和价值变现,明确了租户申请、租户命名、数据准备、数据同步、数据加工、数据申请、权限管理、安全与隐私、运维与运营等方面的要求,旨在通过正确的引导,确保数据消费的便捷、高效与安全合规,支持公司的数字化转型。

在多租户建设中,相对于技术层面的解决方案,租户管理的职责需要在企业里建立共识,将共识以标准规范的形式固化下来。。

租户的4个关键角色如下所示。

  • 租户Owner:租户管理的第一责任人,由公司正式任命的管理者或者变革项目经理担任,是租户内数据消费的总责任人。
  • 租户管理员:由租户Owner指定并授权,是对租户内资产、用户、报告的日常维护、配置、授权承担具体管理职责的人员。
  • 查看者:申请并被允许加入租户,只对租户内的报告有查看权限的租户用户。
  • 分析师:申请并被允许加入租户,对数据资产可执行申请数据入租户、申请租户授权通过分析工具分析数据、制作报告、查看报告、分享报告等操作的租户用户。

(2)数据加工能力

在同一个租户空间内,对数据进行关联、过滤等操作,满足最终分析报告的数据需求。

用户可将多个数据进行关联,构建自己的宽表,可对宽表进行数据过滤,选择合适的字段以及增加计算字段。

(3)数据分析能力

基于消费场景,利用租户内授权的数据资产,通过分析工具对数据进行分析并生成可视化报告。

用户可以选择即席查询自行配置各类条件后的结果数据,再基于这些数据直接链接到不同的分析工具,进行进一步的数据分析。

1)即席查询

提供通过筛选条件展示结果数据的能力。

提供生产环境的实时数据内容,有助于用户通过筛选后的结果数据判断能否满足最终的分析需求。

分析结果支持以文件服务器的方式下载,满足本地化处理的需求,同时避免数据被过度共享。

2)可视分析

查看已授权并加工好的数据的详情,进入可视化分析阶段,充分利用企业现有的分析工具,或打通主流的商业分析工具,减少开发成本,降低学习成本。

数据打通,已授权加工后的数据可以直接进入分析工具进行分析操作。最大程度利用各种分析工具的已有功能。

(4)自助分享能力

基于自助分享能力,可以对分析报告进行密级设定和权限管理,向租户个人或者群体分享报告,不仅可以分享给本租户内指定的用户,而且可以进行跨租户分享。这样一方面可以扩大报告的使用范围,降低报告重复建设过程中的成本,另一方面也有助于解决分析结果不一致的问题。

  • 对报表提供浏览和编辑能力,查找需要浏览的报表,选择查看、编辑、分享、删除功能。
  • 提供对生成的报告定义密级的能力,报告生成者作为报告的Owner,定义密级和管控分享范围。
相关推荐
找方案8 天前
智慧政务数据中台建设及运营解决方案
大数据·政务·数据中台·智慧政务
靠谱杨8 天前
数据仓库、大数据平台和数据中台都是指什么
大数据·数据仓库·etl工程师·数据中台
程序媛一枚~9 天前
2024153读书笔记|《春烂漫:新平摄影作品选》——跳绳酷似人生路,起落平常,进退平常,莫惧征途万里长
读书笔记·诗集·诗词·中国文化古典诗词品鉴·春烂漫:新平摄影作品选·新平
Leo.yuan14 天前
35页PDF | 元数据与数据血缘落地实施(限免下载)
数据中台·元数据·数据血缘
Leo.yuan23 天前
26页PDF | 数据中台能力框架及评估体系解读(限免下载)
数据中台
isNotNullX2 个月前
数据中台一键大解析!
大数据·数据库·数据仓库·信息可视化·数据中台
三花学编程2 个月前
《左耳听风--传奇程序员练级攻略》读书笔记一
读书笔记
一条晒干的咸魚3 个月前
数据技术进化史:从数据仓库到数据中台再到数据飞轮的旅程
数据仓库·数据·数据中台·数据飞轮
乙真仙人3 个月前
数据中台!企业的必备还是可有可无?(附数据中台构建完整脑图)
大数据·数据中台
不叫猫先生3 个月前
从数据仓库到数据飞轮:数据技术演进的探索与思考
大数据·数据仓库·spark·数据中台·数据飞轮