Quantanexus(QN)深算工场AI智能调度平台安装

深算工场是一个智能调度平台,实现了AI显卡的智能调度。线上公有云(https://www.hi168.com

深算工场是它的私有云版本,有免费的个人版,下面安装的就是个人版。

为了清晰可见,可以通过exsi或者pve,做4个vm(最低要求8核16G),创建好后,截图如下:

|--------------|------------------------------------------------------------|-----------------|----------------|
| 主机 | 发行版 | ip | 作用 |
| qni-141 | Ubuntu 22.04+/Centos8/ redhat/OracleLInux/ Openoler等主流版本均可 | 192.168.103.141 | 主控vm,用来控制k8s节点 |
| qni-master-1 | Ubuntu 22.04+/Centos8/ redhat/OracleLInux/ Openoler等主流版本均可 | 192.168.103.142 | k8s-master-1节点 |
| qni-master-2 | Ubuntu 22.04+/Centos8/ redhat/OracleLInux/ Openoler等主流版本均可 | 192.168.103.142 | k8s-master-2节点 |
| qni-worker-1 | Ubuntu 22.04+/Centos8/ redhat/OracleLInux/ Openoler等主流版本均可 | 192.168.103.143 | worker节点 |

1)设置免密登录:在qni主控服务上执行ssh-keygen 生成秘钥

复制代码
Last login: Wed Sep 10 05:35:14 2025 from 172.16.99.231
/usr/bin/xauth:  file /root/.Xauthority does not exist
root@qni-141:~# cd .ssh
root@qni-141:~/.ssh# ls
authorized_keys
root@qni-141:~/.ssh# ssh-keygen
Generating public/private ed25519 key pair.
Enter file in which to save the key (/root/.ssh/id_ed25519):
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_ed25519
Your public key has been saved in /root/.ssh/id_ed25519.pub
The key fingerprint is:
SHA256:M+IySdUAXTXR4JauItGJnA983gHym6Tw0hAFsigxvec root@qni-141
The key's randomart image is:
+--[ED25519 256]--+
|+...oo....=+     |
|.=..  .o . o.    |
|+ ... o . +      |
|. .+.B o o       |
|  ooO B S .      |
|   *E@ = =       |
|  . O B o        |
|   . + .         |
|                 |
+----[SHA256]-----+
root@qni-141:~/.ssh# ls
authorized_keys  id_ed25519  id_ed25519.pub
root@qni-141:~/.ssh# cat id_ed25519.pub
ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIGL2xzhHFuWDAqOM1lIZnllXnxQMmZ95ehUEQwujvv/3 root@qni-141
root@qni-141:~/.ssh#

2) 在三台节点上设置插入秘钥

142,143,144每个节点都把id_ed25519.pub内容插入/root/.ssh/authorized_keys的末尾。

或者通过下图:cloud-init插入再重启也可以。

3) 在qni-141启动安装。

其中的用户名和密码项是141主控用来登录远程主机142,143,144的,如果设置好了免密登录,则无需填写,如果未设置免登陆,则需要填写142,143,144的用户名root和密码。(非root未测试过,因为要装k8s,所以一般都用root省事)

复制代码
root@qni-141:~# wget https://d.hi168.com/qni.sh
--2025-12-10 04:32:09--  https://d.hi168.com/qni.sh
Resolving d.hi168.com (d.hi168.com)... 114.80.200.110
Connecting to d.hi168.com (d.hi168.com)|114.80.200.110|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 103913 (101K) [application/octet-stream]
Saving to: 'qni.sh'

qni.sh                           100%[==========================================================>] 101.48K  --.-KB/s    in 0.02s

2025-12-10 04:32:09 (5.33 MB/s) - 'qni.sh' saved [103913/103913]

root@qni-141:~# bash qni.sh
==================================================
    K8s 高可用集群规划配置工具
==================================================

[INFO] 本脚本将帮助您配置K8s高可用集群的节点信息

=== 第1步:获取所有主机IP ===
[INFO] 请输入所有K8s集群节点的IP地址(用空格分隔,至少需要3个节点)
请输入所有节点IP:

安装已经启动! 等待安装完成,大约需要10分钟。

安装完毕后,直接访问 http://192.168.103.142 admin/admin

部署第一个应用:

加上系统本来就要赠送的,算1000个算力点。

有了算力,回到前台,就可以愉快的部署了。

深算工场还支持: S3 存储桶,快照,云端互联,备份,模型数据集,科研论文,自制应用 AI调度,GPU切片等功能。

是个大杀器,大家各取所需吧。

相关推荐
yumgpkpm5 分钟前
银行的数据智能平台和Cloudera CDP 7.3(CMP 7.3)的技术对接
数据库·人工智能·hive·hadoop·elasticsearch·数据挖掘·kafka
雅欣鱼子酱8 分钟前
Type-C 终端应用里 给产品增加PD快充取电 PD取电诱骗芯片有什么推荐?
人工智能·单片机·芯片·电子元器件
liulanba9 分钟前
大模型训练参数调优完整指南
人工智能·深度学习
liulanba10 分钟前
AI Agent技术完整指南 第三部分:监控与管理
人工智能
fanruitian15 分钟前
springboot openai 调用functioncall
java·spring boot·spring·ai·springai
火山引擎开发者社区18 分钟前
火山引擎发布系列《AI 安全白皮书》,构筑AI云原生可信基座
人工智能·安全·火山引擎
TonyLee01721 分钟前
pytorch深度学习训练随机种子设置
人工智能·pytorch·深度学习
蓑雨春归22 分钟前
2025 AI Coding实践总结 - AI Coding工具真的好用吗?
人工智能·ai编程
IT·小灰灰25 分钟前
大模型API成本优化实战指南:Token管理的艺术与科学
人工智能·python·数据分析
Mintopia25 分钟前
⚙️ AI冲击下的职场新物种:超级个体
人工智能·llm·aigc