BI报表及可视化分析类工具使用经验总结(上)

作为数据工程师,必定会在日常工作中会频繁的使用到BI报表及可视化分析类工具。这些工具可以帮助领导或者一线业务人员快速的查看数据,发现数据规律,探查数据背后的业务价值。以下是基于十多年的工作经历中实际的使用经验,对这类工具进行的经验总结。

一、工具列表

以下是深度参与开发或者运维的工具(按照使用时间的先后顺序排列):

  1. 微软SSRS:曾在国外的某ToB数据营销供应商中使用,SSRS作为报表工具,常常配套SQL Server一并使用,与微软系列产品匹配度较高。数据源除了支持SQL Server之外,也支持Oracle、Teradata、DB2以及任何符合 ODBC/OLE DB 规范的数据源。工具使用便捷,上手容易。适合小型项目中使用。
  2. Oracle BIEE:曾在某OTA在线旅游公司中参与开发和运维,该工具被用于给近百位各条线一线业务人员及中层领导推送各类日报、周报数据。OBIEE特别的地方在与其数据集建模功能强大,可以利用三层模型来表示复杂的数据关系。但入门曲线较陡,使用较复杂目前OBIEE产品线已停止维护,后续由Oracle Analytics Server来替代。整体产品价格较贵。
  3. 帆软FineReport:目前在某小型券商中开发基于该工具的报表,Finereport定位制式表格类报表,尤其擅长中国式复杂报表。整体功能强大,支持各类数据源(传统DBMS及大数据系统),支持嵌入脚本语言(javascript),可支持做一个简单的小型应用系统。
  4. 网易有数BI:目前在某小型券商中参与采购选型并基于该平台进行数据报告及数据门户的开发。有数BI定位为数据可视化交互分析,页面美观,通过自带的数据门户功能可快速集成各类展示报告、填报入口及外部第三方网址,迅速搭建一个小型的应用系统。支持高性能缓存(如ClickHouse),支持移动端展示,价格较便宜,购买后不限制License数量。早期版本性能不太稳定,新的版本(如V9.0)已稳定很多。
  5. Excel:在没有BI工具的情况、数据量较小的情况下,Excel透视图也可以做简单的图表,如折线图,饼图等。

以下是作为用户参与使用或评测的工具:

  1. Tableau:曾在某澳洲保险公司数据仓库项目中使用,作为国外的一款数据可视化和交互式分析工具,Tableau视觉效果卓越(据说是有心理学家参与设计视觉UI配色等方面),操作便捷,上手容易,常用于多维数据分析场景,适合数据分析师和数据科学家使用。缺点是License价格较贵(据说按照安装机器数量进行收费:Desktop, 一万左右一个, Server10万,只有10个账号,每增加一个账号需要2千)。
  2. Apache Superset:开源免费工具,最初源于 Airbnb 内部的一个 hackathon 项目,2022 年初成为 Apache 的顶级项目。除了作为数据可视化工具外,还可以当做数据开发工具(后台开启相应设置后,就可以针对数据源编写DDL/DML语句)。缺点:学习曲线较陡。
  3. Dataease:国产的一款小型开源BI工具,部署便捷。
  4. PowerBI:PowerBI定位为数据可视化分析工具,功能强大。
  5. FineBI:FineBI定位为可视化交互分析,按照开发用户数量收费,相对来说费用较高。

二、部署架构

软件部署一般分为C/S架构和B/S架构。C/S架构中C代表客户端,用户通过客户端可以直连本地的数据源,直接制作报告图表。B/S架构B代表浏览器,用户首先通过浏览器连接服务器,再基于服务器进行操作。另外还有混合架构,将客户端服务器端进行一体化部署。
具体来看:
1、C/S架构:主要有Tableau、SSRS,一般都是基于Windows环境部署客户端和服务器端。

  1. Tableau:采用Desktop客户端(只支持Windows或者MacOS图形化操作系统安装)进行开发,安装客户端的机器需要能与各类数据源服务器的网络联通上,利用Tableau Server来发布部署报告,这样报告使用者只需要用浏览器访问server服务器即可。Tableau public(只能安装在Windows服务器上):用于静态报表发布(数据源数据无法动态更新获取最新数据)。
  2. SSRS:本地采用SSRS客户端软件进行开发(需要有访问数据源的权限),RDL/RDS/DATA等文件本地保存。发布时首先需要在服务器端安装SSRS服务,然后将本地报表文件上传至服务器。

以下是典型的C/S架构的报表工具部署架构图(以Tableau为例)

2、B/S架构:主要有网易有数BI、OBIEE、Superset,一般都是基于Linux服务器后端进行部署,利用网页端进行报表设计。

  1. 网易有数BI:整体应用部署在Linux环境服务器上,报告、数据源等各类元数据部署在Mysql数据库中(内置或者外接)。报表开发者无需使用客户端软件,直接连接服务器基于网页端进行开发。报表查看者同样基于网页进行访问。后台管理界面中可设置不同用户对同一张报表的访问权限。

  2. OBIEE:基于后台服务器进行部署,开发时基于网页端进行报告开发。而数据集建模功能则需要在Windows环境中安装客户端连接服务器并在客户端中进行设计开发(模型保存成RPD文件)。

以下是典型的B/S架构的报表部署架构图

总结:架构没有优劣,只有合适与否。实际选择架构时一般会根据企业的环境来适配。不同的企业中,环境管理差别较大,在外企中,数据类系统中往往会有开发环境、测试环境及生产环境。此时可采用C/S架构的工具,本地安装好客户端之后可以直接连接测试环境的数据源进行报表开发。当开发完成后,将报告发布到服务器上(需要将报告中的数据源替换成生产环境的数据源)。而如果企业中,只有一套环境(中小型民企比较常见),此时B/S架构的工具,可以直接部署到生产环境,连接各类数据源。通过反向代理等技术,可以将生产环境的服务器映射到办公网络,供开发人员或者测试人员进行使用。
以上为各类BI报表及可视化分析类工具的架构分析,下一篇会针对各个工具的功能特性、性能调优以及典型应用场景进行总结。

相关推荐
GIS数据转换器6 小时前
“一张图”背景下的地质灾害监测预警与防治能力建设
大数据·人工智能·数据分析·无人机·智慧城市
看海的四叔7 小时前
【SQL】SQL-管好你的字符串
大数据·数据库·hive·sql·数据分析·字符串
Mr数据杨7 小时前
飞船乘客状态预测与金融风控建模启发
大数据·机器学习·数据分析·kaggle
eqwaak09 小时前
4月30号(科技信息差)
python·科技·信息可视化·数据挖掘·数据分析
Mr数据杨9 小时前
花卉图像分类在植物识别与生态监测中的应用
人工智能·机器学习·分类·数据挖掘·数据分析·kaggle
Mr数据杨9 小时前
埃姆斯住宅房价预测与自动化估值建模
运维·机器学习·数据分析·自动化·kaggle
帅次10 小时前
Android AI 面试速刷版
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·数据分析
生物信息与育种10 小时前
全基因组重测序及群体遗传与进化分析技术服务指南
人工智能·深度学习·算法·数据分析·r语言
PaperData10 小时前
2012-2022年农业产业结构高级化
数据库·人工智能·数据分析·经管
PaperData11 小时前
2014-2026.3应届生网络招聘大数据
大数据·数据库·人工智能·数据分析·经管