一、基础操作与权限配置
| 命令 | 作用 | 重要说明 |
|---|---|---|
sudo usermod -aG HwHiAiUser $USER |
将当前用户加入昇腾用户组 | 解决非sudo下无法执行npu-smi info的问题,执行后必须重启终端/服务器生效 |
| 无sudo vs 有sudo | 命令执行差异 | 加sudo和不加sudo时,返回的card id和chip id会不一致,建议统一使用sudo执行NPU命令 |
二、基本信息查询
| 命令 | 作用 | 备注 |
|---|---|---|
sudo npu-smi info |
查看NPU整体基本信息 | 核心基础命令,需sudo或用户组权限 |
sudo npu-smi info -l |
查看NPU卡的数量和ID列表 | 快速确认可用的card id |
sudo npu-smi info -t product -i 1 |
查询指定ID(1)的NPU卡型号 | -i 1中的1为card id,可替换为实际ID |
cat /sys/devices/virtual/dmi/id/product_name |
查看主机型号 | 系统级信息,无需sudo |
cat /sys/devices/virtual/dmi/id/sys_vendor |
查看主机厂商 | 系统级信息,无需sudo |
三、资源占用监控
| 命令 | 作用 | 备注 |
|---|---|---|
sudo watch npu-smi info -t usages -i 0 -c 0 |
实时监控指定NPU卡的资源占用 | watch:实时刷新(默认2秒/次)-i 0:指定card id为0-c 0:指定chip id为0监控内容:内存、AICPU、硬件加速单元占用率 |
四、CPU核数配置
| 命令 | 作用 | 备注 |
|---|---|---|
sudo npu-smi info -t cpu-num-cfg -i 1 -c 0 |
查看指定NPU卡的CPU核数配置 | -i 1 -c 0:指定card id=1、chip id=0 |
sudo npu-smi set -t cpu-num-cfg -i 1 -c 0 -v 6:2:0 |
配置NPU卡的CPU核数 | -v 6:2:0:配置参数(格式:AICPU核数:CTRLCPU核数:预留核数)配置后必须重启NPU卡/服务器生效 |
总结
-
执行昇腾NPU命令时,建议统一加
sudo,避免card id/chip id不一致的问题;若无sudo权限,需将用户加入HwHiAiUser组并重启。 -
核心查询命令:
npu-smi info(基础信息)、npu-smi info -t usages(资源占用)、npu-smi info -t cpu-num-cfg(CPU配置)。 -
配置类命令(如CPU核数)执行后,需重启相关设备才能生效。