vsphere集群内的ESXI主机(DL580物理机)报错存储设备 naa.600a098038314953xxxxx4xxxd6c4730 的路径冗余已降级。路径 vmhba3:C0:T1:L0 已关闭。受影响的数据存储: A400-A-LUN01-15T 。

情况发现

日常巡检vsphere集群 发现其中一台主机报错:
存储设备 naa.600a098038314953xxxxx4xxxd6c4730 的路径冗余已降级。路径 vmhba3:C0:T1:L0 已关闭。受影响的数据存储: A400-A-LUN01-15T 。

登录问题主机IPMI

登录IPMI查看到network报错:

报错

该物理机与存储设备连接的PCIE接口 slot7(位置7) HBA卡的port1端口down的问题

PCIE接口是一种高速串行计算机扩展总线标准 属于高速串行点对点双通道高带宽传输,所连接的设备分配独享通道带宽,不共享总线带宽,支持主动电源管理、错误报告、端对端的可靠性传输、热插拔以及服务质量等功能 它的主要优势就是数据传输速率高

排查port1为什么down

找到该物理机 图为机器PCIE接口 7位置 port1 (位置以及端口信息)

根据port1光纤标签找到对应的SAN交换机 看到对应的端口 报橘色灯或者不亮

总结多种原因

1、SAN交换机连接物理机的光模块有问题
2、物理机PCIE接口 位置7 port1光模块有问题
3、或者光纤线有问题

测试拔插两端光模块排查

首先查看SAN交换机 光模块有光 重新拔插光模块 问题依旧
然后查看物理机端光模块有光 重新拔插发现SAN交换机端灯正常绿色了一分钟左右,随后又报橘色灯再随后灯不亮
总结:
物理机端光模块有光 SAN交换机端亮橘色灯
物理机端光模块没光 SAN交换机端灯不亮

到此为止问题排查到是物理机端光模块问题

联系厂商上门维修

HPE热线电话:4008100504
在IPMI上把日志以及问题情况复述给厂商,厂商排查光模块问题或者HBA卡问题
初步解决方法为 先更换光模块,若问题依旧更换HBA卡

问题解决

更换光模块问题解决

IPMI查看port1正常
vsphere 查看该主机存储设备已还原