某款服务器插上4张TDP功耗75瓦PCIE卡无法开机的调试过程

1.服务器厂家说这款服务器测过别家的4卡,所以一开始并没有怀疑服务器硬件有问题

2.拔掉另外三张,只保留cpu0对应的riser0 slot0上的一张卡,仍然无法开机。

3.怀疑是这张pcie卡bar空间太大导致。换另一款bar空间小的卡,仍然无法开机。又尝试插一张普通的显卡还是无法开机。

4.进入BIOS修改相关的配置,做过以下实验,均无效:

强制为gen1,关掉sriov,关掉串口控制台,AES,虚拟化等

5.将卡拔掉,插入其它槽位,可以开机,卡也能识别。换到其它二个槽位,也可识别。目前为止,其它三个槽位均可识别,怀疑这个槽位有问题。

6.服务器厂家再次确认,之前的信息不对。这款服务器没有插过4张卡,只插过2张卡,且为独立供电,也不确认这个槽位是否插过。有问题的槽位在最底部,从散热的角度,并不是最好的位置。如果整机只插2张卡,应该不会是它。

7.从服务器机盖上可以看到有二种riser型号。另一种是有3个x8 slot的,于是让厂家服务器厂家协调这种型号的riser,将卡插在slot1和2上,可以正常开机.目前为止可以识别到4张卡。

8.最后服务器厂家解释:cpu0对应的riser只提供了24个lane。对应二种riser卡型号:x16+x8,3个x8。至于为什么插上无法开机,还没有进一步分析。

相关推荐
郝学胜-神的一滴21 小时前
Linux 进程控制块(PCB)解析:深入理解进程管理机制
linux·服务器·开发语言
CSCN新手听安21 小时前
【linux】多线程(六)生产者消费者模型,queue模拟阻塞队列的生产消费模型
linux·运维·服务器·c++
Wang's Blog21 小时前
Linux小课堂: 软件安装与源码编译实战之从 RPM 到源码构建的完整流程
linux·运维·服务器
超级大福宝21 小时前
在 Linux 下修改百度网盘的缩放比例
linux·运维·服务器·ubuntu
Wang's Blog21 小时前
Linux小课堂: 深入理解前后台进程控制机制——基于 &、nohup、Ctrl+Z、bg 与 fg 的完整实践体系
linux·运维·服务器
-SGlow-21 小时前
Linux相关概念和易错知识点(48)(epoll的底层原理、epoll的工作模式、反应堆模式)
linux·服务器·c语言·网络·c++
秉承初心21 小时前
Linux中Expect脚本和Shell的脚本核心特点解析、以及比对分析和应用场景
linux·运维·服务器·sh·exp
脏脏a21 小时前
【Linux】Linux:sudo 白名单配置与 GCC/G++ 编译器使用指南
linux·运维·服务器
十铭忘1 天前
基于SAM2的眼动数据跟踪2
java·服务器·前端
孙同学_1 天前
【Linux篇】软链接vs硬链接:Linux文件系统中的两种引用机制
linux·运维·服务器