企业光拥有冷冰冰的数据毫无价值,想要取得商业成功,如何分析和利用拥有的数据才是关键。
今天我们推荐一款开源数据可视化项目,它比很多收费软件还要强大,更好的让数据产生价值实现商业智能,它就是:superset。
superset是什么?
Superset 是一个现代数据探索和数据可视化平台。Superset 可以取代或增强许多团队的专有商业智能工具。Superset 与各种数据源很好地集成。可以在不编码的情况下,快速构建自己的分析图表。
superset几乎支持了所有的常见数据库:
另外Superset还提供了以下的特性:
- 用于快速构建图表的无代码界面
- 用于高级查询的强大的、基于 Web 的SQL 编辑器
- 用于快速定义自定义维度和指标的轻量级语义层
- 对几乎所有 SQL数据库或数据引擎的开箱即用支持
- 各种精美的可视化效果 可展示您的数据,从简单的条形图到地理空间可视化
- 轻量级、可配置的缓存层有助于减轻数据库负载
- 高度可扩展的安全角色和身份验证选项
- 用于编程定制的API
- 为扩展而从头开始设计的云原生架构
安装Superset
Superset支持了多种安装方式,比如Docker、Docker Compose、K8s、PyPI等。
作为快速上手体验的话,肯定推荐Docker的方式。
首先设置一下Superset的版本信息,下面的latest_version可以在官方文档查到:
ini
$ export SUPERSET_VERSION=<latest_version>
之后拉取Docker
shell
$ docker pull apache/superset:$SUPERSET_VERSION
启动Docker
shell
$ docker run -d -p 8080:8088 \
-e "SUPERSET_SECRET_KEY=$(openssl rand -base64 42)" \
-e "TALISMAN_ENABLED=False" \
--name superset apache/superset:$SUPERSET_VERSION
创建Admin
sql
$ docker exec -it superset superset fab create-admin \
--username admin \
--firstname Admin \
--lastname Admin \
--email admin@localhost \
--password admin
配置示例
bash
$ docker exec -it superset superset db upgrade &&
docker exec -it superset superset load_examples &&
docker exec -it superset superset init
这里会载入一些示例的数据,所以会需要一些时间。
使用Superset
完成Superset配置新实例后,前往http://localhost:8080并使用默认创建的帐户登录:
makefile
username: admin
password: admin
因为我们这里了导入了示例数据,所以这里已经有了几个示例的Dashboard。我们一块来看下superset中的几个核心内容,因为每个部分都会涉及到很多详细配置,我这里仅仅是展示一下,不是一个详细的教程。
连接数据库
数据分析工具首先肯定是要添加数据源。点击右上角的加号,打开添加数据源。
默认superset的docker里使用sqllite,我们加载了一个Sample的数据。如果是实际使用可以连接到自己的数据源,默认docker里不带任何连接库,所以还需要把库装好。这里我就不一一说明了,大家可以自己按文档来搞。
数据集
连接到数据库后,就可以把数据里的表添加为数据集了。
示例数据已经都导入好了数据集,我们也可以在上面做一些修改。
图表
有了数据集之后,我们就可以创建图标。选择关联的数据集、图表的类型,就可以创建一个新的图表了。
之后就会进入图表的详细配置页面,这里就是你需要深入调试的内容,知道得到你希望的数据图为止。
SQL query
Superset 提供了 SQL query ,可以在这里深入定制SQL来执行制定查询,并根据查询的结果来生成图表。
Dashboard
在接下来我们就可以创建Dashboard,并把之前建立好的图表添加到对应的Dashboard里面。
Superset 的功能非常全面,如果你有BI方面的需求,那么值得深入研究和使用。
项目特性
superset具备了以下的特性:
- 快速直观:无论数据量有多大,Superset都可以快速、准确地分析和展示。它提供了丰富的可视化方式,从简单的折线图到高度详细的地理空间图,用户可以轻松地以可视化的方式浏览和探索数据。
- 强大的易用性:Superset具有强大的易用性,可以快速容易地集成,从而浏览数据,而这一切通过SQL IDE或者无需编写代码,通过可视化构建器即可完成。它还支持多种数据库,可以通过SQL Alchemy连接到任何基于SQL的数据源,包括云原生的数据库以及PB级的数据引擎。
- 丰富的可视化方式与仪表盘:Superset提供了多种精美的可视化效果,从非常简单的饼图到复杂的地理空间图,都可以得到非常好的支持。此外,它还支持仪表盘功能,用户可以根据自己的需要创建和分享自定义的仪表盘。
- 可视化插件体系结构:Superset具有可视化插件体系结构,使得构建自定义的可视化变得更为容易。同时,它还提供了丰富的API和插件接口,可以方便地进行二次开发和功能扩展。
- 高度定制化:Superset的高度定制化特性使用户可以根据自己的需求配置规则来决定谁可以访问哪些产品功能和数据集。同时,它还支持自定义登录验证等功能,可以灵活地满足用户的各种需求。
- 云原生架构:Superset是云原生的,旨在提供高可用性。它可以扩展到大型分布式环境,并且在容器中运行良好。这意味着用户可以在云环境中轻松部署和扩展Superset。
项目信息
- 项目名称:Superset
- GitHub 链接:github.com/apache/supe...
- Star 数:57K+