Quantanexus(QN)深算工场AI智能调度平台安装

深算工场是一个智能调度平台,实现了AI显卡的智能调度。线上公有云(https://www.hi168.com

深算工场是它的私有云版本,有免费的个人版,下面安装的就是个人版。

为了清晰可见,可以通过exsi或者pve,做4个vm(最低要求8核16G),创建好后,截图如下:

|--------------|------------------------------------------------------------|-----------------|----------------|
| 主机 | 发行版 | ip | 作用 |
| qni-141 | Ubuntu 22.04+/Centos8/ redhat/OracleLInux/ Openoler等主流版本均可 | 192.168.103.141 | 主控vm,用来控制k8s节点 |
| qni-master-1 | Ubuntu 22.04+/Centos8/ redhat/OracleLInux/ Openoler等主流版本均可 | 192.168.103.142 | k8s-master-1节点 |
| qni-master-2 | Ubuntu 22.04+/Centos8/ redhat/OracleLInux/ Openoler等主流版本均可 | 192.168.103.142 | k8s-master-2节点 |
| qni-worker-1 | Ubuntu 22.04+/Centos8/ redhat/OracleLInux/ Openoler等主流版本均可 | 192.168.103.143 | worker节点 |

1)设置免密登录:在qni主控服务上执行ssh-keygen 生成秘钥

复制代码
Last login: Wed Sep 10 05:35:14 2025 from 172.16.99.231
/usr/bin/xauth:  file /root/.Xauthority does not exist
root@qni-141:~# cd .ssh
root@qni-141:~/.ssh# ls
authorized_keys
root@qni-141:~/.ssh# ssh-keygen
Generating public/private ed25519 key pair.
Enter file in which to save the key (/root/.ssh/id_ed25519):
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_ed25519
Your public key has been saved in /root/.ssh/id_ed25519.pub
The key fingerprint is:
SHA256:M+IySdUAXTXR4JauItGJnA983gHym6Tw0hAFsigxvec root@qni-141
The key's randomart image is:
+--[ED25519 256]--+
|+...oo....=+     |
|.=..  .o . o.    |
|+ ... o . +      |
|. .+.B o o       |
|  ooO B S .      |
|   *E@ = =       |
|  . O B o        |
|   . + .         |
|                 |
+----[SHA256]-----+
root@qni-141:~/.ssh# ls
authorized_keys  id_ed25519  id_ed25519.pub
root@qni-141:~/.ssh# cat id_ed25519.pub
ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIGL2xzhHFuWDAqOM1lIZnllXnxQMmZ95ehUEQwujvv/3 root@qni-141
root@qni-141:~/.ssh#

2) 在三台节点上设置插入秘钥

142,143,144每个节点都把id_ed25519.pub内容插入/root/.ssh/authorized_keys的末尾。

或者通过下图:cloud-init插入再重启也可以。

3) 在qni-141启动安装。

其中的用户名和密码项是141主控用来登录远程主机142,143,144的,如果设置好了免密登录,则无需填写,如果未设置免登陆,则需要填写142,143,144的用户名root和密码。(非root未测试过,因为要装k8s,所以一般都用root省事)

复制代码
root@qni-141:~# wget https://d.hi168.com/qni.sh
--2025-12-10 04:32:09--  https://d.hi168.com/qni.sh
Resolving d.hi168.com (d.hi168.com)... 114.80.200.110
Connecting to d.hi168.com (d.hi168.com)|114.80.200.110|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 103913 (101K) [application/octet-stream]
Saving to: 'qni.sh'

qni.sh                           100%[==========================================================>] 101.48K  --.-KB/s    in 0.02s

2025-12-10 04:32:09 (5.33 MB/s) - 'qni.sh' saved [103913/103913]

root@qni-141:~# bash qni.sh
==================================================
    K8s 高可用集群规划配置工具
==================================================

[INFO] 本脚本将帮助您配置K8s高可用集群的节点信息

=== 第1步:获取所有主机IP ===
[INFO] 请输入所有K8s集群节点的IP地址(用空格分隔,至少需要3个节点)
请输入所有节点IP:

安装已经启动! 等待安装完成,大约需要10分钟。

安装完毕后,直接访问 http://192.168.103.142 admin/admin

部署第一个应用:

加上系统本来就要赠送的,算1000个算力点。

有了算力,回到前台,就可以愉快的部署了。

深算工场还支持: S3 存储桶,快照,云端互联,备份,模型数据集,科研论文,自制应用 AI调度,GPU切片等功能。

是个大杀器,大家各取所需吧。

相关推荐
小白|几秒前
CANN与联邦学习融合:构建隐私安全的分布式AI推理与训练系统
人工智能·机器学习·自动驾驶
艾莉丝努力练剑8 分钟前
hixl vs NCCL:昇腾生态通信库的独特优势分析
运维·c++·人工智能·cann
梦帮科技9 分钟前
Node.js配置生成器CLI工具开发实战
前端·人工智能·windows·前端框架·node.js·json
程序员泠零澪回家种桔子11 分钟前
Spring AI框架全方位详解
java·人工智能·后端·spring·ai·架构
Echo_NGC223713 分钟前
【FFmpeg 使用指南】Part 3:码率控制策略与质量评估体系
人工智能·ffmpeg·视频·码率
纤纡.23 分钟前
PyTorch 入门精讲:从框架选择到 MNIST 手写数字识别实战
人工智能·pytorch·python
大大大反派24 分钟前
CANN 生态中的自动化部署引擎:深入 `mindx-sdk` 项目构建端到端 AI 应用
运维·人工智能·自动化
程序猿追25 分钟前
深度解读 AIR (AI Runtime):揭秘 CANN 极致算力编排与调度的核心引擎
人工智能
深鱼~27 分钟前
数学计算加速利器:ops-math在昇腾平台的应用详解
ai·开源·cann
2601_9495936530 分钟前
深入解析CANN-acl应用层接口:构建高效的AI应用开发框架
数据库·人工智能