【工具使用-数据可视化工具】Apache Superset

1. 工具介绍

1.1. 简介

一个轻量级、高性能的数据可视化工具

1.2. 核心功能

  • 丰富的可视化库:支持 40+ 预置可视化类型,包括折线图、柱状图、饼图、散点图、地图等,满足时序、地理信息等多种分析需求
  • 强大的 SQL Lab:内置 Web 化 SQL 编辑器,支持多数据源查询和结果可视化,无需离开平台即可完成数据探索
  • 自定义可视化插件:支持通过 JavaScript/TypeScript 编写可视化插件,实现企业级定制,满足特殊展现需求

2. 安装Superset

2.1. 系统依赖

ubuntu20.04 系统依赖,其他系统参考官方文档

bash 复制代码
sudo apt-get install build-essential libssl-dev libffi-dev python-dev python3-pip libsasl2-dev libldap2-dev default-libmysqlclient-dev

2.2. Python环境

  • 建议单独为SuperSet创建一个虚拟环境,用这个环境将Superset进程后台执行
bash 复制代码
conda create -n superset python=3.10
# python环境里安装superset
pip install --upgrade setuptools pip
pip install apache-superset marshmallow==3.26.1

2.3. Superset数据库配置

  • 初始化数据库(底层的操作是建库,建表)
bash 复制代码
# 添加环境变量
export FLASK_APP=superset
# flask是一个python web框架,superset使用的就是flask框架

# 生成随机的秘钥
openssl rand -base64 42
# 复制上面生成的秘钥
# 添加到环境变量(替换"openssl-secret-key"为上面生成的秘钥)
export SUPERSET_SECRET_KEY="openssl-secret-key"
bash 复制代码
# 初始化数据库
superset db upgrade
  • 按照显示来设置用户名和密码
bash 复制代码
superset fab create-admin
  • Superset初始化
bash 复制代码
superset init

3. 使用Superset

3.1. 启动和停止

  • Gunicorn:是一个用于UNIX系统的Python WSGI HTTP服务器,以其易用性、性能优越及与多种Python web框架的兼容性而被广泛应用于部署Python网络应用。
bash 复制代码
pip install gunicorn
# 启动superset
gunicorn --workers 5 --timeout 120 --bind 127.0.0.1:8787  "superset.app:create_app()" --daemon

--workers:指定进程个数

--timeout:worker进程超时时间,超时会自动重启

--bind:绑定本机地址 ,即为Superset访问地址

--daemon:后台运行

  • 查看本机ip地址
bash 复制代码
ifconfig

根据自己的需求场景,选择合适的ip地址,进行bind配置:

场景 推荐 --bind 配置 说明
本地开发测试 127.0.0.1:8000 安全且仅本地访问
局域网/公网直接访问 公网ip地址:8000 绑定具体网卡IP,需开放防火墙端口
生产环境(Nginx代理) 127.0.0.1:8000 + Nginx配置 高安全性和性能优化
Docker容器内运行 0.0.0.0:8000 需映射容器端口到宿主机
  • 关闭/杀死后台superset进程
bash 复制代码
ps -ef |grep superset |grep -v grep |awk '{print $2}' |xargs kill -9

3.2. Web端配置使用

TODO

相关推荐
XMYX-05 小时前
解决 Apache/WAF SSL 证书链不完整导致的 PKIX path building failed 问题
网络协议·apache·ssl
IT·陈寒6 小时前
怎么这么多 StringUtils —— Apache、Spring、Hutool 全面对比
java·spring·apache
IT研究室8 小时前
大数据毕业设计选题推荐-基于大数据的分化型甲状腺癌复发数据可视化分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·信息可视化·spark·毕业设计·源码·bigdata
q567315238 小时前
手把手教你用Go打造带可视化的网络爬虫
开发语言·爬虫·信息可视化·golang
阿豪39 小时前
2025 年职场:B 端产品经理用计算机专业技能优化产品全攻略(经验分享)
大数据·人工智能·科技·信息可视化·产品经理
数据智研9 小时前
【数据分享】土地利用矢量shp数据分享-甘肃
大数据·信息可视化
云天徽上15 小时前
【数据可视化-106】华为2025上半年财报分析:用Python和Pyecharts打造炫酷可视化大屏
开发语言·python·华为·信息可视化·数据分析·pyecharts
杨超越luckly1 天前
HTML应用指南:利用GET请求获取全国招商银行网点位置信息
前端·arcgis·信息可视化·html·银行网点
云天徽上1 天前
【数据可视化-108】2025年6月新能源汽车零售销量TOP10车企分析大屏(PyEcharts炫酷黑色主题可视化)
python·信息可视化·数据挖掘·数据分析·汽车·数据可视化·零售
喂完待续1 天前
【Big Data】云原生与AI时代的存储基石 Apache Ozone 的技术演进路径
云原生·架构·apache·big data·序列晋升