说起更换磁盘,都会说非常简单,但无数次的血淋淋的教训让我们再次来审视一下更换磁盘的专业步骤。本文就是介绍最专业的也是最简单的磁盘更换步骤。常在河边走哪有不湿鞋,希望做了几十年攻城狮的你不要在这里翻船。
本文介绍的内容适用于Ontap 8和7的7-mode,cluster mode,或者到了9版本,命令有了很大的差异,甚至有了ADP的磁盘,很多内容不再适用。如果在新的ontap 9版本更换磁盘有问题可以add wechat at StorageExpert进行沟通。
首先,肉眼确定故障磁盘,这个很容易,如果有盘故障,一般都会亮起黄灯,当然也有个例,磁盘已经在要坏的边缘,但还没有亮起黄灯。
第二就是用命令行来确定故障磁盘的位置。这里介绍7-mode下的方式,在c-mode下可以转换到node shell下来运行同样的命令,这里不在详细介绍。
使用aggr status命令可以确定那个磁盘有故障,如果aggr status看不出有故障的磁盘,也可以使用aggr status -d 来查看输出结果中的"not available"或者"Failed"的磁盘即可确定有故障的磁盘位置。
确定了逻辑位置以后,我们还需要确定故障磁盘的实际物理位置,我们知道,NetApp在FAS存储系统中对于一块磁盘是按照loop, shelf和bay的三者结合来唯一确定一块磁盘位置。
一个存储系统可以有好几个loop,这取决于最早的物理配置,一个loop中可以有多个shelf,一个shelf根据shelf的不同可以有不同的磁盘数。
如下图是一个DS2246的磁盘扩展柜
在shelf的右边可以看到shelf ID,这里是2,每个shelf里面的磁盘从0开始到23,上图中划红线的磁盘位置就是 2.5,前面再加上loop ID就可以准确确定这块磁盘的位置。
确定了磁盘的位置以后,我们可以使用命令来点亮这个磁盘的LED灯,更清楚的确定磁盘的位置。
命令如下:
首先进入高级模式
Priv set advanced
使用命令 led_on 来点亮磁盘,使用led_off来熄灭磁盘LED灯。
举例如下:
Filer>priv set advanced
Filer*>led_on 0a.2.5
输入priv set 退出advanced 模式。
确定了物理位置以后,就可以开始正式的更换了。首先移除有问题的磁盘,如果有多个磁盘更换,在每个磁盘移除之间至少要等45秒钟,不要一下子把所有的有问题磁盘都抽出来。
等待45秒钟以后,再将更换的磁盘插入到磁盘插槽中。如果有多个磁盘更换,要等前一个磁盘被系统认到,如果系统自动进行磁盘微码升级,要等升级完成后,才能进行下一个磁盘的更换。
磁盘更换后,在console中可以看到磁盘auto assign的输出,auto assign是在系统的全局变量中进行设置 disk.auto_assign 为ON,否则系统不会自动assign磁盘,需要人工干预。
如果console中没有auto assign的输出,在命令行中输入 disk show -n 的命令来查看是否有没有owned的磁盘存在。如果有磁盘存在,并且就是我们刚更换的磁盘位置,则说明刚更换的磁盘没有被assign owner, 需要手工干预。
输入 disk assign <disk name>来把这个磁盘assign到正确的控制器上,执行完这个命令后,磁盘状态应该变为 spare。
可以使用 aggr status -r 命令来查看磁盘状态。
查看console中的输出,如果有message要求upgrade 磁盘微码,则需要对该磁盘进行微码升级
输入下面的命令
Filer>disk_fw_update
磁盘微码升级完成,到此,一个故障磁盘的更换才完整完成,如果还有其他故障磁盘需要更换,重复上面的步骤。