主要信息查看方法
查看寒武纪MLU卡的信息,最直接的方法是使用寒武纪提供的cnmon
命令。如果您已经安装了寒武纪的驱动和工具链(通常位于/usr/local/neuware
),可以尝试运行:
bash
bash
/usr/local/neuware/bin/cnmon
或者直接:
bash
cnmon
如果系统能找到这个命令,它会显示一个监控界面,包含MLU的利用率、显存(MLU内存)使用情况、温度、卡型号 等关键信息,界面和 nvidia-smi
类似。
🔍 其他辅助查看手段
如果 cnmon
命令还不可用,或者您想从系统层面确认设备是否存在,可以尝试以下方法:
-
使用
lspci
命令查找设备在终端中输入以下命令,来搜索所有已连接的PCI设备,并筛选出寒武纪的设备:
bash
lesslspci | grep -i cabc # 尝试用 'cabc' 过滤,这是寒武纪的PCI厂商标识之一:cite[1]
或者更广泛地搜索:
bash
perllspci | grep -i 'cambricon|mlu'
如果成功识别,输出会包含寒武纪MLU卡的PCI设备信息。
-
检查驱动加载情况
使用
lsmod
命令可以查看已加载的内核模块,通过grep
过滤出寒武纪相关的模块:bash
perllsmod | grep -i 'cambricon|cn'
如果有类似
cambricon
或cn
前缀的模块(例如cndrv
)显示,通常意味着驱动模块已加载。 -
查看寒武纪设备文件
检查
/dev
目录下是否存在寒武纪的设备文件,这是驱动安装成功的一个重要标志:bash
bashls -l /dev/cambricon*
常见的设备文件是
/dev/cambricon_dev0
(第一张卡)等。
📊 寒武纪MLU信息查看方式汇总
为了让您更清晰地了解,我将查看寒武纪MLU卡信息的主要命令和用途整理如下:
| 查看目标 | 主要命令/方法 | 作用说明 |
|---------------------|-------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------|
| 实时状态(利用率、显存、温度) | cnmon
| 寒武纪官方监控工具,类似 nvidia-smi
,最直接全面 |
| PCI设备识别 | `lspci | grep -i 'cambricon | mlu | cabc'` | 从系统PCI总线层面确认硬件是否被识别 |
| 内核驱动模块 | `lsmod | grep -i 'cambricon | cn'` | 检查驱动模块(如 cndrv
)是否已加载 |
| 设备文件节点 | ls -l /dev/cambricon*
| 检查驱动是否正确创建了设备文件(如 /dev/cambricon_dev0
) |
⚠️ 重要提醒
- 驱动是关键 :以上所有寒武纪专用命令(尤其是
cnmon
)的可用性,都取决于是否已正确安装寒武纪的驱动程序(DKMS方式)和Neuware基础工具包 。如果尚未安装,您需要先安装它们。 - 安装资源 :寒武纪的驱动和SDK通常需要从寒武纪官方或其提供的渠道获取 .
- 环境变量 :安装完成后,记得设置环境变量 (如
PATH
,LD_LIBRARY_PATH
)并执行source ~/.bashrc
使其生效,否则系统可能找不到cnmon
等命令。
💎 总结
查看寒武纪MLU卡的信息,首推使用官方的 cnmon
命令。如果该命令尚未可用,您可以依次通过:
lspci
命令确认硬件是否被系统识别。lsmod
和检查/dev
目录设备文件来确认驱动状态。