AI平台Dataiku 支Windows系统安装过程总结

目录

    • 〇、浅语
    • 一、理想情况下的安装过程
      • [1.1 安装启动器](#1.1 安装启动器)
      • [1.2 启动启动器](#1.2 启动启动器)
    • 二、安装问题处理过程记录
      • [2.1 Java17问题](#2.1 Java17问题)
      • [2.2 在可访问外网的机器上下载 DSS 离线包](#2.2 在可访问外网的机器上下载 DSS 离线包)
      • [2.3 安装python3.11](#2.3 安装python3.11)
      • [2.4 离线安装Dataiku DSS](#2.4 离线安装Dataiku DSS)
      • [2.5 离线安装Dataiku DSS,指定python路径版](#2.5 离线安装Dataiku DSS,指定python路径版)
    • [三、Dataiku DSS的启动、停止方式](#三、Dataiku DSS的启动、停止方式)
      • [3.1 命令行启动](#3.1 命令行启动)
      • [3.2 命令行停止](#3.2 命令行停止)
      • [3.3 查看状态](#3.3 查看状态)
      • [3.4 创建桌面快捷方式](#3.4 创建桌面快捷方式)
    • 四、后记
    • 参考信息

〇、浅语

最近看到一个不错的网站:Towards Data Science,偶尔看到一个博主提到他所用的工具:Dataiku。后来简单了解了一下,这个工具真不错,作为分析工具十分适合。它是数据科学工作室 (DSS) 平台提供简单易用的可视化数据准备方案,以及一套完整的 AutoML 功能。即使不懂代码的用户也能导入和清理数据,并在生产环境中训练和部署机器学习模型------所有操作均可在图形用户界面 (GUI) 环境中完成,无需编写任何代码。

由此,便在电脑上安装适用了一下,整体感觉很不错。下面就是安装过程中遇到的小问题进行了记录。(本来dss就不推荐windows系统,但小菜鸟就熟悉windows,所以霸王硬上弓!)

备注:

  • Dataiku DSS 最初并非设计用于在 Windows 系统上原生运行。它目前以实验版本提供,仅供测试使用。
  • 适用于 Windows 的 Dataiku Launcher 应用程序可帮助您安装和更新到最新版本的 Dataiku DSS。您只需下载一次即可。

一、理想情况下的安装过程

如果一切正常的情况下,基本上就是下载安装包,一键傻瓜式安装。具体如下[1](#1)

1.1 安装启动器

1.2 启动启动器

  • 从开始菜单或 Windows 桌面上的快捷方式启动 Dataiku Launcher 应用程序。
  • 首次打开启动器时,它将引导完成 Dataiku DSS 的安装。
  • 如果尚未启用长路径支持,启动器会询问是否要在计算机上启用长路径支持(推荐)。
  • 安装完成后,Dataiku DSS 会自动在浏览器标签页中打开(支持 Chrome 和 Firefox)。如果关闭了标签页并想重新打开 Dataiku DSS,双击系统托盘(通知区域)中的小鸟图标,或右键单击该图标并选择"打开 Dataiku DSS",或者打开一个新标签页并访问 http://localhost:11200

下面是针对按照上述安装时,提示安装失败时,我的处理方式记录。

二、安装问题处理过程记录

如果上节: 一、理想情况下的安装过程 安装失败。那大概率需要采用离线安装包进行安装了。

总体目标是:

在可联网机器下载 DSS 安装包 → 拷贝到内网机器 → 放入 Launcher 本地 kits 目录 → 让 Launcher 自动识别并完成安装。

据此,遇到的需要解决的几个问题如下。

2.1 Java17问题

默认的Launcher 在自动从 GitHub 下载 OpenJDK 17,可能会因为下载时被防火墙 / 代理 / 不稳定网络中断 + 安装残留锁定进程 等问题被阻断。即使 DSS 包已经下载成功,只要 Java 安装失败,整个安装就会回滚。

备注:目前

针对该问题处理方案如下:

  1. 先彻底关闭残留的 Dataiku Launcher 进程
  • 打开 任务管理器(Ctrl + Shift + Esc)
  • 在"进程"里结束以下所有相关进程:
  • Dataiku Launcher
  • Dataiku
  • node.exe(如果命令行显示路径指向 Dataiku)
  • 确认没有残留进程后再继续。

如果任务管理器无法结束,可直接重启电脑一次。

  1. 清理失败的残留安装目录
  • 删除以下目录(如果存在):

C:\Users\用户名\AppData\Local\Dataiku

C:\Users\用户名\AppData\Local\Programs\Dataiku Launcher\

  • 注意:这是本地安装缓存目录,删除不会影响系统其他软件。
  • 删除完成后,确认这两个目录不存在。
  1. 手动安装 Java 17,再让 Dataiku 识别
  • 手动下载安装 Java 17:在浏览器中打开Adoptium Temurin JDK 17 官方页面: https://adoptium.net/temurin/releases/?version=17下载:Windows x64 MSI 或 ZIP 均可(推荐 MSI 安装版).

  • 安装完成后,确认。打开 CMD,执行下列命令,能看到 Java 17 版本信息。

shell 复制代码
java -version
  • 设置 JAVA_HOME(如果安装器未自动设置)
    假设安装路径类似:
shell 复制代码
C:\Program Files\Eclipse Adoptium\jdk-17.x.x\

设置系统环境变量:新建变量名:JAVA_HOME,变量值:上面的 JDK 路径

在 Path 中追加:

shell 复制代码
%JAVA_HOME%\bin

重新打开 CMD 验证:

shell 复制代码
java -version

2.2 在可访问外网的机器上下载 DSS 离线包

  1. 打开官方下载页面
  1. 拷贝安装包文件到目标机器的指定目录下
  • 目标机器创建目录(如果不存在):
shell 复制代码
C:\Users\用户名\AppData\Local\Dataiku\DataScienceStudio\kits
  • 拷贝安装包到 上面的kits 目录下
  1. 手动解压 DSS 安装包
  • 右键:dataiku-dss-14.3.1-win.tar.gz → 解压到当前文件夹。
  • 最终目录结构应为:
shell 复制代码
kits
 ├── dataiku-dss-14.3.1-win
 │    ├── bin
 │    ├── installer
 │    ├── lib
 │    └── ...
 └── dataiku-dss-14.3.1-win.tar.gz   (可保留或删除)

⚠️ 非常关键:必须解压到 kits 目录本身,而不是子目录里套一层。

2.3 安装python3.11

虽然 DSS 包内带有 Python 目录,但 Windows 离线安装脚本仍然要求系统层可识别 Python 3.11 可执行文件(在 PATH 或显式指定)。

⚠️ 手动指定 Python 可执行路径给安装器(如果你已经有 Python 3.11),且目前用的Dataiku必须使用3.11版本。

  1. 下载 Python 3.11 安装包
  • 根据下列路径,在页面下方选择下载:Windows installer (64-bit)
shell 复制代码
https://www.python.org/downloads/release/python-3119/
  1. 拷贝到目标机器并安装
  • 在目标机器上右键安装包 → 以管理员身份运行

  • 第一个界面一定要勾选:Add Python 3.11 to PATH (这是为了快捷,不然后续也可手动指定)

  • 点击:Install Now

  • 安装完成后关闭窗口。

  • 验证 Python 是否生效,打开新的 CMD 或 PowerShell:

    python --version

  • 必须显示:Python 3.11.x(如果显示找不到命令,说明 PATH 没配置成功,需要手动修复。)

2.4 离线安装Dataiku DSS

  1. 以管理员身份打开 CMD
  2. 进入 DSS 安装目录。
shell 复制代码
cd C:\Users\用户名\AppData\Local\Dataiku\DataScienceStudio\kits\dataiku-dss-14.3.1-win
  1. 选择一个 DSS 数据目录(DATADIR)
  • 该目录是 DSS 存放:项目数据、配置、日志、模型文件 的工作目录,不能放在 kits 目录里。这里以下面路径为例:
shell 复制代码
C:\Users\用户名\DataikuDSS

⚠️ 后续按照中需要指定和使用该目录。

  1. 安装Dataiku DSS
  • 执行命令
shell 复制代码
powershell -ExecutionPolicy Bypass -File installer.ps1 -d C:\Users\用户名\DataikuDSS -p 10000

2.5 离线安装Dataiku DSS,指定python路径版

如果考虑到多python环境管理的问题,也可以手动指定dss依赖的python3.11路径。

  1. 假如python3.11文件路径如下:
shell 复制代码
C:\Python311\python.exe
  1. 选择一个 DSS 数据目录(DATADIR)
  • 该目录是 DSS 存放:项目数据、配置、日志、模型文件 的工作目录,不能放在 kits 目录里。这里以下面路径为例:
shell 复制代码
C:\Users\用户名\DataikuDSS

⚠️ 后续按照中需要指定和使用该目录。

  1. 使用参数指定python路径,具体命令示例如下
shell 复制代码
powershell -ExecutionPolicy Bypass -File installer.ps1 -d C:\Users\用户名\DataikuDSS -p 10000 -py C:\Python311\python.exe

⚠️ 前提是下面命令必须返回 Python 3.11.x。

shell 复制代码
C:\Python311\python.exe --version

三、Dataiku DSS的启动、停止方式

3.1 命令行启动

  • 安装完成后,你可以通过以下命令启动 DSS:
shell 复制代码
C:/Users/用户名/DataikuDSS/bin/dss.cmd start

3.2 命令行停止

shell 复制代码
C:/Users/用户名/DataikuDSS/bin/dss.cmd stop

3.3 查看状态

复制代码
C:/Users/用户名/DataikuDSS/bin/dss.cmd status

📝以上三步可作为日常操作流程。

3.4 创建桌面快捷方式

如果希望通过双击图标启动 DSS,可以手动创建快捷方式:

  • 在桌面右键 → 新建 → 快捷方式。
  • 目标路径填:
shell 复制代码
C:\Windows\System32\cmd.exe /k "C:\Users\用户名\DataikuDSS\bin\dss.cmd start"
  • 给快捷方式命名,比如 Dataiku DSS。
  • 以后双击就会打开命令窗口并启动 DSS。

四、后记

还是要保持阅读最新的一些高质量博文,包括国内、国外。在这个匆匆忙忙的世界,信息技术日新月异,保持内核的同时,也需要向外生长。

参考信息


  1. Dataiku官网 ↩︎

  2. 在 Windows 上安装说明文档 ↩︎

相关推荐
云小逸14 小时前
【windows核心编程】Windows GDI编程深度解析:从消息循环到双缓冲动画的完整实现
windows
奋斗羊羊16 小时前
rocketmq 及依赖环境编译安装过程记录(windows)
windows·rocketmq
鲨辣椒1008617 小时前
Linux软件编程基石——基础指令使用
linux·windows·microsoft
云小逸17 小时前
【Nmap 源码学习】深度解析:main.cc 入口函数详解
网络·windows·学习·nmap
郝学胜-神的一滴17 小时前
Python美学的三重奏:深入浅出列表、字典与生成器推导式
开发语言·网络·数据结构·windows·python·程序人生·算法
牙牙要健康18 小时前
【open3d】Windows 下编译 Open3D C++ 源码完整教程
开发语言·c++·windows
露天赏雪18 小时前
JDK8 的入门避坑指南
java·服务器·windows·spring boot·后端·spring·性能优化
仗剑天涯 回首枉然18 小时前
Linux 和 windows 共享文件
linux·运维·windows
良逍Ai出海18 小时前
在 Windows & macOS 上安装 Claude Code,并使用第三方 Key 的完整教程
windows·macos
404Clukay18 小时前
Windows Server 配置 Let‘s Encrypt 免费 HTTPS 证书(WACS + Nginx 自动化方案)
windows·nginx·https