01故障现象
某PC工作站R通过交换机接收某设备S发送的数据,但不定时,PC工作站接收数据出现报错信息。工作站R向设备S发送个ICMP请求数据包,均有响应并且延迟正常。
02故障分析思路
常规的故障分析思路有:分层思路、对比分析思路和排除法思路。
首先,分析发送和接收数据所需的带宽要求及承载的传输协议(UDP或者TCP);
其次,根据分层的思路,从工作站R的网卡、网线链路、交换机网口、交换机本身转发芯片、交换机网口、网线链路和设备S的网卡的角度进行查看分析,可从中间层交换机向两边进行分析查看并结合排除法排除无故障的节点。
03故障定位解决
实际场景,发送和接收数据承载的传输协议是UDP,不可靠的传输协议,对传输链路要求较高,链路存在丢帧即影响数据的传输。
登录交换机查看连接工作站R的接口和连接设备S的接口得知:连接工作站R的接口状态正常,接口工作协商速率1Gbps,但连接设备S的接口存在大量的CRC,如下图所示;
经质询,工作站R至交换机的网线是成品网线,设备S至交换机的网线是手工作的。替换连接设备S的网线两端的水晶口,清除接口的CRC统计,工作站R可正常接收到设备S发送的数据,无报错,交换机接口CRC为0。
备注1:清除接口CRC的统计方式;
SWresetcountersinterfaceGigabitEthernet1/0/1
备注2:ping为发现丢包,为何UDP数据传输报错?
Windows系统默认的ping包小大是32字节并ping包之间有间隔。Ping功能主要定位网络链路的通断和延迟。依赖不可靠的UDP传输协议传输大量的数据包,对网络链路的丢帧敏感。
04脑补之CRC技术
CRC技术简介
数据在传输过程中因传输介质故障或外界的干扰而产生比特差错,从而导致接收方接收到错误的数据。为尽量提高接收方收到数据的正确率,在接收数据之前需要对数据进行差错检测,仅当检测的结果为正确时才接收数据。
常见差错检测的方式有奇偶校验、求和校验、CRC校验等,工作原理类似,即,首先,发送端对传输数据按照算法计算出校验码,其次,校验码和传输数据一起发送到接收端,最后,接收端对收到的数据和校验码按照相同的算法验证,以此判断接收到的数据是否正确、完整。
循环冗余校验CRC(CyclicRedundancyCheck)由W.WesleyPeterson在年发表的论文中提出,鉴于CRC校验在速度、成本、正确率等方面比其他校验方式更具有优势,因此,CRC成为计算机信息、通信领域最为普遍的校验方式。例如在EthernetII格式的以太帧中,最后4个字节的冗余位用于存储CRC校验的值,此冗余位又称为帧检验序列FCS(FrameCheckSequence)。
备注:EthernetII格式的以太帧释义
目的MAC