华为10GSDH本地环网业务中断故障分析处理
驻马店市云网运营中心:余秋霞
一、故障描述
11月6日5时50分,驻马店本地网管显示:华为10G本地网南环平舆、新蔡2个网元脱管,同时新蔡网元下挂华为2.5G县乡环、平舆和新蔡华为县乡OTN环网均脱管。8时08分起,新蔡、平舆县局维护人员陆续电话报障、语音专线中断,新蔡农行、平舆医保等多条专线业务也报中断。
二、故障分析及处理
立即针对受影响业务查询分析,初步判定为新蔡站点双向同时故障致使环网保护失效。因新蔡、平舆两网元脱管,无法网管查询平舆、新蔡设备状态,遂通知平舆、新蔡、正阳三个县维护人员设备现场配合查测。测试结果为26局-平舆-新蔡段收发光均正常,正阳收新蔡光衰太大。网管操作将平舆网元的网关由新蔡切换为综合楼后,平舆、新蔡两个网元恢复可管理状态,但很快又脱管了。在不能利用网管快速确定平舆-新蔡段失效原因、消除故障的情况下,只能对正阳-新蔡段线路进行降衰处理以尽快恢复中断业务。经新蔡、正阳两县维护人员测试备用纤芯,证实另一根光缆也处于受损状态,无法将业务代出。通知长线局将割接点封头盒拆开重熔,同时两县将机房内尾纤进行清洁、更换。
15:09平舆、新蔡两网元能够网管,经网管查询对比衰耗下降2dB,业务勉强能够通过,但产生大量误码。农行发现业务恢复后,通过*企部门要求暂时不要进行操作,业务虽通但隐患存在。
市局维护人员随即细查平舆、新蔡两县网元各项性能,发现平舆至驻马店间光功率正常,但使用J0字节测试,平舆收不到26局字节,初步判断可能原因为:1、平舆网元26局方向光路收芯尾纤接错,所收光不是26局正常发光。2、平舆网元26局方向光板故障。
查测持续进行中,下午17:12,因正阳至新蔡段误码累计过大,业务再次中断、涉及网元脱管。随后两县维护人员再次更换尾纤及珐琅盘,经多次调整后光衰又下降1.2dB,基本达到设备光衰要求,业务恢复正常。
经断光测量,平舆至26局段光路收发对应正确,排除尾纤接错可能。因26局至平舆传送距离过远,两端设备均加有放大板。网管排查26局光路板和光放大板均未上报异常告警,现场排查26局设备单板无故障后,配合平舆进行排查。平舆收光路由为外线路ODF-BPA-DCU-SL64A,经多次实验及板卡拔插复位,SL64A单板多次重启后开始上报告警,故障原因为平舆网元26局方向SL64A光板性能劣化,遂联系华为厂家紧急调拨备件。
11月11日收到备件赶赴平舆更换。11:00更换故障单板后,网管测试J0字节收发正常,查询光功率正常,观察10分钟后平舆网元26局向保护倒换事件消失,确定链路性能恢复正常。
三、案例总结
华为10G本地环网承载着驻马店市重要大客户专线业务,环网虽具有保护功能,但在日常维护工作中也要加强监控、维护,避免出现环路双向同时故障造成大量重要业务中断影响用户网络感知。要充分借助网管手段,网巡发现光衰劣化时要快速处理,及时消除网络隐患。
预览时标签不可点收录于话题#个上一篇下一篇