第一篇:爱立信 WCDMA 基站常见告警处理方法
爱立信 WCDMA 基站常见告警处理方法
1.PDH Loss of Signal:PDH信令丢失告警
Maj PDH Loss of Sign loss_of_signal Subrack=1,Slot=1,PlugInUnit=1,Cbu=1,ExchangeTerminal=1,E1PhysPathTerm=pp4 告警原因:传输不通。
2.Plug-In Unit General Problem:配置错误告警
Maj Plug-In Unit General Problem replaceable_unit_problem Subrack=1,Slot=2,PlugInUnit=1 告警原因:对应槽位没有板子,或板子读取不到。
处理方法:拔插相应槽位的板子,如拔插无效,则需更换板子。3.AuxPlugInUnit_PiuConnectionLost:辅助单元设备告警
Maj AuxPlugInUnit_PiuConnectionLost equipment_malfunction AuxPlugInUnit=1 告警原因:外部告警先没接。影响:无
处理方法:由于现在外部告警线不需要接,可闭掉AuxPlugInUnit=1 这个MO,以消除告警。4.AuxPlugInUnit_LossOfMains:RRU电源告警
Maj AuxPlugInUnit_LossOfMains commerical_power_failure SectorAntenna=1,AuxPlugInUnit=RRU-1 告警原因:RRU掉电 影响:该小区将退服。
处理方法:到现场检查RRU电源。5.Carrier_RejectSignalFromHardware:
Carrier_SignalNotReceivedWithinTime:载频告警
Maj Carrier_RejectSignalFromHardware message_not_expected Sector=1,Carrier=1 Maj Carrier_RejectSignalFromHardware message_not_expected Sector=2,Carrier=1 Maj Carrier_SignalNotReceivedWithinTime timeout_expired Sector=2,Carrier=1 告警原因:RU或RRU故障。影响:该小区退服
处理方法:尝试对故障小区的RU进行重启,如无效,安排代维人员更换该小区RU或RRU.6.RbsLocalCell_CellReleaseFailure 小区释放失败
Maj RbsLocalCell_CellReleaseFailure software_error RbsLocalCell=S1C1 Maj RbsLocalCell_CellReleaseFailure software_error RbsLocalCell=S2C1 告警原因:小区软件错误。影响:该小区退服
处理方法:对该站进行热启动。
7.OpticalInterfaceLink_OpticalInterfaceLinkFailure:光纤接口连接失败
Maj OpticalInterfaceLink_OpticalInterfaceLinkFailure equipment_malfunction OpticalInterfaceLink=1-UL 告警原因:RRU的光纤没接或者RRU硬件没装,从而检测不到RRU。RRU未加电有时也会出现。影响:该小区退服
处理方法:代维人员或督导到现场检查RRU光纤或电源。8.RruDeviceGroup_GeneralSwError:RRU软件告警 RruDeviceGroup_GeneralHwError:RRU硬件告警
Maj RruDeviceGroup_GeneralSwError software_error SectorAntenna=1,AuxPlugInUnit=RRU-1,RruDeviceGroup=1 告警原因:系统读取不到RRU的数据。影响:该小区退服
处理方法:对该RRU进行重启,如不能恢复,更换RRU,一般软件告警重启都能恢复。9.TrDeviceSet_GeneralHwError TrDeviceSet_GeneralSwError 发射设备告警
Maj TrDeviceSet_GeneralHwError equipment_malfunction RbsSubrack=RU1,RbsSlot=6,AuxPlugInUnit=1,RuDeviceGroup=1,TrDeviceSet=1 告警原因:发射单元告警,该单元位于RU中或RRU中。影响:对应小区退服
处理方法:一般重启对应RU或RRU都能解决,如果不能解决,更换RU或RRU.10.RuDeviceGroup_GammaUplinkFailure 连接失败告警
Maj RuDeviceGroup_GammaUplinkFailure Equipment=1,RbsSubrack=RU1,RbsSlot=6,AuxPlugInUnit=1,RuDeviceGroup=1
3206的RU22的站每个小区的FU与RU之间有三条连线,即如:A小区的连线,就是RfCable=FU1_2_RX_A1,RfCable=FU1_2_RX_B1,RfCable=RU1_2_TX.告警原因:RU到FU的连线故障 影响:对应小区退服
处理方法:到现场检查RU到FU的连线,可尝试重启RU,相关告警:RfCable_Disconnected DigitalCable_Disconnected 11.DbccDevice_GammaDownlinkFailure 连接失败告警
Maj DbccDevice_GammaDownlinkFailur equipment_malfunction Subrack=1,Slot=8,PlugInUnit=1,TxDeviceGroup=1,DbccDeviceSet=1,DbccDevice=2 告警原因:TX板故障,RU连线故障 影响:相关小区退服
处理方法:重启TX板,重启或更换相应小区RU.12.AntennaBranch_AntennaSystemProblemInBranchA: AntennaBranch_AntennaSystemProblemInBranchB:馈线告警
Maj AntennaBranch_AntennaSystemProblemInBranchA equipment_malfunction SectorAntenna=4,AntennaBranch=A Maj AntennaBranch_AntennaSystemProblemInBranchA equipment_malfunction SectorAntenna=5,AntennaBranch=A Maj AntennaBranch_AntennaSystemProblemInBranchB equipment_malfunction SectorAntenna=4,AntennaBranch=B Maj AntennaBranch_AntennaSystemProblemInBranchB equipment_malfunction SectorAntenna=5,AntennaBranch=B 告警原因:天馈线驻波比超过门限值。影响:A口告警影响
处理方法:代维人员或督导到现场检查天馈线。
13.Power Failure Left Slot:电源告警
Maj Power Failure Left Slot power_problem_m3100 Subrack=1 告警原因;停电后,正在发电,导致直流电压值达不到所允许的电压范围值,从而出现电源告警。影响:暂时无影响,但如不及时处理,会导致掉站。处理方法:到现场检查电源。
14.IMA Link Reception Unusable at Far End IMA Link Reception Misconnected:
Remote Defect Indication on IMA Link:传输告警。
Warn Remote Defect Indication on IMA Link remote_node_transmission_error ImaGroup=1-1-ima1,ImaLink=1 Maj IMA Link Reception Misconnected local_node_transmission_error ImaGroup=1-1-ima1,ImaLink=1 Warn IMA Link Reception Unusable at Far End remote_node_transmission_error ImaGroup=1-1-ima1,ImaLink=1
告警原因:传输不同,或传输误码
影响:2条以上不影响掉站,但影响网络指标。处理方法:上站检查传输。
15.IMA Link Reception Unusable at Far End remote imalink告警
Warn IMA Link Reception Unusable at Far End remote_node_transmission_error ImaGroup=1-1-ima1,ImaLink=3 Warn IMA Link Transmit Unusable at Far End remote_node_transmission_error ImaGroup=1-1-ima1,ImaLink=3 告警原因:imalink disabled 或RNC侧VC12被lock 影响:2条以上不影响掉站
处理方法:如果检查4条传输都是通的,则应该是VC12被lock,解开RNC侧对应的VC12 16.NbapCommon_Layer3SetupFailure:Nbap建立失败
Crit NbapCommon_Layer3SetupFailure communication_subsystem_failure Iub=Iub_WHS6518,NbapCommon=1 告警原因:RNC 的NbapCommon协议被LOCK住了。影响:该站无法正常通信
处理方法: 在RNC侧解开NbapCommon.17.RaxDeviceGroup_TemperatureExceptionallyHigh
TxDeviceGroup_TemperatureExceptionallyHigh 温度过高告警 告警原因:对应板件温度过高。
影响:会导致小区退服,或个别信道不正常
处理方法:如有风扇告警,先处理风扇告警,同时检查
18.FcuDeviceGroup_FanFailure 风扇告警
FcuDeviceGroup_FanFailure equipment_malfunction AuxPlugInUnit=2,FcuDeviceGroup=1 告警原因:风扇单元故障
影响:在机房空调系统正常的情况下无影响。
处理方法:可尝试对风扇单元进行重启,重启后如再次出现则需要督导上站处理。19.Ethernet Switch Port Fault 以太网口错误
Maj Ethernet Switch Port Fault link_failure Subrack=1,Slot=2,PlugInUnit=1,ExchangeTerminalIp=1,EthernetSwitch=1,EthernetSwitchPort=6 告警原因:第2槽位 ETMFX11板对应端口线没插 影响:在没开通FE的情况下无影响
处理方法:目前,port2和port6用来开FE,其它端口如果出告警,可以lock掉该端口。
20.UplinkBaseBandPool_UlHwLessThanUlCapacity 上行容量告警
Maj Plug-In Unit General Problem replaceable_unit_problem Subrack=1,Slot=9,PlugInUnit=1 Min UplinkBaseBandPool_UlHwLessThanUlCapacity configuration_or_customizing_error Subrack=1,UplinkBaseBandPool=1 告警原因:下行容量低于license容量 影响:无
处理方法:一般为2块RAX板中有一块读不到,换到故障RAX板即可解决
20.DownlinkBaseBandPool_DlHwLessThanDlCapacity : 下行容量告警
Maj OpticalInterfaceLink_OpticalInterfaceLinkFailure equipment_malfunction OpticalInterfaceLink=1-UL Maj OpticalInterfaceLink_OpticalInterfaceLinkFailure equipment_malfunction OpticalInterfaceLink=2-UL Maj OpticalInterfaceLink_OpticalInterfaceLinkFailure equipment_malfunction OpticalInterfaceLink=3-UL Min DownlinkBaseBandPool_DlHwLessThanDlCapacity configuration_or_customizing_error Subrack=1,DownlinkBaseBandPool=1 Min UplinkBaseBandPool_UlHwLessThanUlCapacity configuration_or_customizing_error Subrack=1,UplinkBaseBandPool=1 告警原因:下行容量低于license。影响:无影响
解决方法:该站RRU接通后,该告警会自动消除。
21.FcuDeviceGroup_EnclosureDoorOpen 门禁告警
Maj FcuDeviceGroup_EnclosureDoorOpen enclosure_door_open_m3100 AuxPlugInUnit=2,FcuDeviceGroup=1 告警原因:机框门没关 影响:无
解决方法:到现场关闭机框门,此告警为3518特有告警。
22.Loss of Tracking 丢失同步
Loss of Tracking replaceable_unit_problem Synchronization=1 Min Loss of Synch Reference Redundancy replaceable_unit_problem Synchronization=1 告警原因:丢失同步
影响:如果2调同步传输同事出现该告警,会导致该站退服。
处理方法:对丢失同步的基站进行resetLossOfTracking 操作可消除该告警,但如是传输误码导致的告警,消除后则
可能再次出现。
第二篇:爱立信常见基站故障告警处理
基站常见故障处理
CF EC10(Main fail(External Power Source Fail)):外部电源故障
处理步骤:
1. 检查出现故障小区的PSU是否工作正常:检查指示灯是否正常; 2. 检查电源链路,包括电缆、熔丝空开等;
3. 检查IDB中配置的电源系统是否和实际使用的电源系统一致; 4. 检查交流电源是否连接正确; 5. 更换PSU。
HW and IDB inconsistency(硬件和IDB数据不一致):
处理步骤:
1. 检查硬件的频段、配置数量是否和IDB的配置数据相一致。2. 如发现数据不同,需要重新传建IDB或者在IDB中进行修改。
Climate sensor fault, System voltage sensor fault,converter fault告警
处理步骤:
1. 检查出现告警小区的PSU、ECU是否工作正常。2. 如PSU出现问题,则更换。(参照例三)3. 如ECU出现问题,则更换。
4. 将出现告警的ECU电源关闭,更换ECU。5. 更换后,将其电源开启。
TRX 1A/13(RF loop test fault): RF 环路测试故障
处理步骤:
A/D 1,检查TX电缆与TRU是否正确连接。
2,对TRU进行复位或者断电后重新加电,看是否能够恢复。
3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。
4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。
TRX 1A/21(Internal configuration failed): 内部配置失败
处理步骤:
1,检查CDU电源是否正常。2,检查IDB中CDU配置是否正确。
3,检查TRU是否安装正确,与Y-link线连接是否正确。4,检查IDB中TRU配置是否正确。5,检查CDU-BUS线包括背板连线。6,将CDU进行断电/加电操作。7,重启DXU,CDU,TRU。8,更换TRU。9,更换CDU。10,更换CDU-BUS线。
TRX 1A 11(DSP CPU Communication Fault):DSP CPU通信故障
处理步骤为: 1,对该TRU进行复位;
2,若复位后无法消除该故障,或者复位后再次出现,更换该TRU。
TX 1B 4(TX Antenna VSWR Limits Exceeded):TX驻波比超限
处理步骤如下:
1. 在OMT检查IDB里面的VSWR Limits定义的值的大小: 对于 GSM900:VSWR Class 1建议为2.2,VSWR Class 1建议为1.8; GSM1800:VSWR Class 1建议为2.2,VSWR Class 1建议为2.0; 并检查故障的位置为哪个小区或者哪个天线出现告警。
2,检查TRU与CDU/CU之间的TX电缆是否完好,连接是否正确。3,用Site Master仪表测试天线的驻波比,该值应该小于1.5。如果该值大于1.5,用Site Master仪表里面的DTF定位故障点的位置(建议从CDU连接口的跳线开始测试,测试前对仪表进行校验)。
4,检查TRU和CDU/CU之间的Pfwd和Prefl电缆是否连接正确。5,将CDU或者FU的电源开关一下,检查故障是否消失。6,将TRU进行复位,检查故障是否消失。
TX 1B 0(CDU/Combiner not usable):CDU/合路器不能使用
出现此类障碍,必须更换CDU/合路器。
TX 1B 1(CDU/Combiner VSWR Limits Exceeded):CDU/合路器驻波比超过门限值
处理过程为:
1,检查TRU与CDU/CU之间的TX电缆是否完好,连接是否正确, 检查TRU和CDU/CU之间的Pfwd和Prefl电缆是否连接正确。
2,用OMT读出是哪个CDU或者CU出现故障,将该CDU或者CU的电源开关一下,检查故障是否消失。
3,重启与故障CDU或者CU相连的TRU。4,更换该故障的CDU或者CU; 5,更换于故障CDU或CU相连的TRU。
TX 1B 14(TX Saturation):
此告警处理过程如下: 1,对该TRU进行复位; 2,若复位后无法消除该故障,或者复位后再次出现,更换该TRU。
1B/13:TX output power limits exceeded(TX 输出功率超过门限值)
处理方法为:
1,检查TX cable是否存在故障,或者是否正确连接, 检查TRU和CDU/CU之间的Pfwd和Prefl电缆是否连接正确。
2,对TRU进行复位。3,更换TRU。
TX 1B/20:CU/CDU input power fault(CU/CDU 输入功率超过门限值)
处理方法:
1,检查TX cable是否存在故障,或者是否正确连接, 检查TRU和CDU/CU之间的Pfwd和Prefl电缆是否连接正确。
2,将CDU-F/CU关电后重新加电。3,对TRU进行复位。4,更换CDU-F/CU。5,更换TRU
TX 1B/26:CU/CDU fine tuning fault(CU/CDU 微调故障)
处理方法:
1,检查相邻的CU/CDU是否加电,且工作正常。2,检查CU/CDU的terminator是否连接。3,将CU/CDU关电后重新加电。4, 对TRU进行复位。5,更换CU/CDU。TX 1B/27:TX maximum power restricted(TX最大功率超限)
处理方法为:
1,如果是伴随着CF2A8,请参考TX 1B4的处理方法。2,如果伴随TRX2A11的告警,处理如下: A,检查TRU的空面板是否全部安装。
B,检查设备的进风口和出风口是否有阻挡物。C,对TRU进行复位。
CF 2A/43 Internal configuration failed(内部配置失败)
此告警经常为一个或者多个TRU或者ECU出现内部配置故障。如果是TRU,参考TRX 1A21的故障处理。
否则安装下面方法处理: 1,检查所有的光纤环路;
2,检查电源系统和IDB中定义的参数是否吻合,包括PSU的数量等。
3,复位ECU;
4,更换ECU。
CF 2A/33 RX diversity lost(接收分集丢失)
处理方法大概如下:
1,检查出现故障小区的天馈系统连接是否正确,包括天线的方向及机柜内部RX连线和机柜之间的跳线;
2,用OMT软件对每个载频的TRX的分集接收进行监测:TRXmonitorDiversity supervisor,查看每个载频的SSI值,该值为RXA和RXB信号的一个相对减值,正常在-3到+3之间,理想值为零,如测出该小区的所有载频SSI的值均在12以上,则问题出在所有TRU的RX公用电路:天馈线系统,CDU及其外部连线。需要进一步进行检查。
CF 2A/8 VSWR limits exceeded(驻波比超限)该故障最大可能是天馈系统出现故障,可以参考TX 1B/4的告警进行处理。
RX 2A/1 RX path lost on A receiver side(A侧接收之路丢失)
该告警主要是TRU的RXA信号丢失,需要检查TRU的A路接收,包括天馈系统及机柜之间和机柜内部的RX线缆、CDU等。该告警同时也会引起CF 2A/33的告警。
RX 2A/2 RX path lost on B receiver side(B侧接收之路丢失)
参考RX 2A/1的告警处理方式。
CF 2A/41 Lost communication to TRU(与TRU通信丢失)
处理方法为:
1,用OMT软件检查配置数据中TRU的数量是否和实际安装的TRU数量一致,如果不一致,用OMT的modify功能将相应多余的载频从IDB中删除。2,检查TRU与DXU的bus线,包括机柜之间的bus线。3,更换TRU。4,更换DXU。5,更换TRU背板。6,更换DXU/ECU背板。
CF 2A/39 RX cable disconnected(接收电缆断开)
处理方法为:
1,在基站用OMT检查断开的接收电缆位置;
2,检查相应的接收电缆是否连接已经是否连接正确。
TRX 2A/22 CDU bus communication fault(CDU-bus通信故障)
处理方法为: 1,检查CDU是否工作正常,包括CU、FU等单元已经CDU bus线是否连接以及是否连接正确。
2,检查出现故障小区的TRU是否正常,可以将其与其他正常单元进行更换的方式进行检查;
3,检查CDU-Bus是否故障,必要时候进行更换。
CDU supervision/communication lost(CDU监测/通信丢失):
处理步骤为:
1,检查IDB中配置的CDU数量是否和实际安装的数量一致; 2,检查CDU总线包括背板的连接; 3,将CDU、FU、DU、CU等断/加电; 4,复位DXU;
5,更换CDU/FU/DU/CU。
RU data corrupt(数据库崩溃):
处理步骤:
1,用OMT检查RU MAP,查看哪个替换单元出现该告警信息;
2,检查与该RU的连接线是否正确,包括CDU-BUS,IOM bus,opto bus,和local bus;
3,如果通信正常,将该RU加/断电,并复位DXU; 4,替换该RU,并复位DXU。
Lost communication to TRU(与载频失去联系):
处理步骤:
1,检查IDB中定义的TRU数量是否和实际安装的数量一致,否则修改IDB; 2,检查DXU和背板/TRU之间的Y-link线是否连接正确。
3,检查机柜之间的外部bus线/Y-link线是否连接正确,接头针脚接触是否完好;
4,检查所有终端头是否安装;
5,检查载频背板开关是否设置在正确位置。
Lost communication to ECU(与ECU失去联系):
处理步骤:
1,检机柜之间的外部bus线/Y-link线是否连接正确,接头针脚接触是否完好;
2,检查所有终端头是否安装;
3,检查DXU/ECU背板的开关是否设置正确; 4,复位与DXU失去联系的ECU; 5,复位DXU; 6,更换ECU。
第三篇:诺西 WCDMA基站常见告警及处理建议
诺西 WCDMA基站常见告警及处理建议 紧急告警 7650 BASE STATION FAULTY
基站故障告警
告警附加信息:
1、BTS Blocked 基站被锁
处理建议:解锁基站
2、BTS internal SW management problem 基站内部软件包管理问题
处理建议:1.重启基站; 2.更新基站软件包 ;3.更换故障模块
3、Baseband Bus failure
基站基带连线故障
处理建议:1.检查系统模块与射频模块的连线; 2.重启基站; 3.升级软件包后观察基站15分钟左右,看基站工作状态;4.更换故障模块
4、Failure in optical RP3 interface
系统模块与射频模块之间按的接口故障
处理建议:此故障多发生于拉远小区,处理步骤:1.检查拉远小区的模块是否有电;2.检查系统模块与射频模块间的光路是否正常;3.更换损坏的光纤或者光电模块;4.重启基站;5.更换故障模块
5、No connection to Flexi transport submodule 处理建议:1.重启基站 2.更换故障传输板
6、System Module failure
系统模块故障
基站传输板连接中断
处理建议:重启系统模块,如果不能恢复,则更换系统模块
7、Temperature alarm
温度告警
处理建议:1.检查环境温度是否过高或过低;2.查看设备风扇是否工作正常; 2.重启产生告警的模块 ;3.更换产生告警的模块 重要告警 7651 BASE STATION OPERATION DEGRADED
基站性能下降告警
告警附加信息:
1、BTS RNC/I-HSPA interface signalling link failure BTS与RNC间的AAL2信令中断处理建议:引发此告警的最常见原因是传输闪断,检查传输状况
2、BTS internal SW management problem 基站内部软件包管理问题 处理建议:1.重启基站; 2.更新基站软件包; 3.更换故障模块
3、BTS reference clock missing 基站参考时钟丢失
处理建议:基站上一般设置第1&2条传输为时钟源,如果1&2条传输均断,则触发此告警。检查并恢复1&2条传输
4、Commissioning parameter mismatch 处理建议:重新集成基站数据
5、Incompatible SW version detected
软件包不匹配
基站参数配置错误
处理建议:此告警多发生于新模块集成的时侯,给新模块下发软件包即可消除 次要告警 7652 BASE STATION NOTIFICATION
基站提示告警
告警附加信息:
1、Configuration error;Unknown HW resource 未知的硬件错误
处理建议:1.重启基站;2.通过重复升级基站软件包;3.更换系统模块
2、autonomous reset as recovery action
3、Antenna Line Device failure
基站自动重置以启动复原功能
天线链路设备故障
处理建议:1.检查天馈是否安装正确; 2.重启出现告警的RF模块; 3.更换RF模块
4、BTS time not corrected
基站时间不正确
处理建议:1.检查基站NTP设置; 2.检查BTS至OSS的DCN路由是否通
5、Fan failure 风扇故障
处理建议:1.重启基站 2.更换故障风扇
6、BTS requires restart because license status has changed BTS因license状态改变要求重启 处理建议:重启基站 紧急告警 7653 CELL FAULTY 小区故障(退服)故障
告警附加信息:
1、Antenna Line Device failure
天线链路设备故障
处理建议:1.检查天馈是否安装正确 2.重启出现告警的RF模块 3.更换RF模块
2、BTS internal SW management problem 基站内部软件包管理问题
处理建议:1.重启基站 2.更新基站软件包 3.更换故障模块
3、Baseband Bus failure
基站基带连线故障
处理建议:1.检查系统模块与射频模块的连线 2.重启基站 3.更换故障模块
4、Failure in optical RP3 interface
系统模块与射频模块之间按的接口故障
处理建议:此故障多发生于拉远小区,处理步骤:1.检查拉远小区的模块是否有电;2.检查系统模块与射频模块间的光路是否正常;3.更换损坏的光纤或者光电模块;4.重启基站;5.更换故障模块
5、Incompatible SW version detected
软件包不匹配
处理建议:此告警多发生于新模块集成的时侯,给新模块下发软件包即可消除
6、RF Module failure 射频模块故障
处理建议:1.检查系统模块与射频模块的连线 2.重启基站 3.更换故障射频模块
7、Temperature alarm
温度告警
处理建议:1.检查环境温度是否过高或过低;2.查看设备风扇是否工作正常; 2.重启产生告警的模块 ;3.更换产生告警的模块
8、VSWR alarm 天馈驻波告警
处理建议:1.检查天馈的连接是否正确,天馈工艺,天馈是否有损坏;2.测试驻波3.处理后重启基站
9、Resource status indication, cell disabled 资源状态指示小区不可用 处理建议:1.解锁基站或小区;2.重启基站 重要告警 7654 CELL OPERATION DEGRADED
天线链路设备故障
小区性能下降告警
1、Antenna Line Device failure 处理建议:1.检查天馈是否安装正确 2.重启出现告警的RF模块 3.更换RF模块
2、Antenna Line failure
天线链路故障
处理建议:1.检查天馈是否安装正确 2.重启出现告警的RF模块 3.更换RF模块
3、BTS internal SW management problem 基站内部软件包管理问题
处理建议:1.重启基站 2.更新基站软件包 3.更换故障模块
4、Baseband Bus failure
基站基带连线故障
处理建议:1.检查系统模块与射频模块的连线 2.重启基站 3.更换故障模块
5、Incompatible SW version detected
软件包不匹配
处理建议:此告警多发生于新模块集成的时侯,给新模块下发软件包即可消除
6、RF Module failure 射频模块故障
处理建议:1.检查系统模块与射频模块的连线 2.重启基站 3.更换故障射频模块
7、Rx signal level failure
天线接收电平性能下降
处理建议:检查天馈系统(当某根天线的接收电平低于-112DB或者主集、分级天线之间的接收电平差值大于4DB会触发此告警)
8、Temperature alarm
温度告警
处理建议:1.检查环境温度是否过高或过低;2.查看设备风扇是否工作正常; 2.重启产生告警的模块 ;3.更换产生告警的模块
9、VSWR alarm 天馈驻波告警
处理建议:1.检查天馈的连接是否正确,天馈工艺,天馈是否有损坏;2.测试驻波3.处理后重启基站 次要告警 7655 CELL NOTIFICATION 小区提示性告警
小区HSUPA性能下降
1、HSUPA capacity decreased 处理建议:1.检查小区状态是否正常 2.锁/解锁小区 3.重启基站
2、Incompatible SW version detected
软件包不匹配
处理建议:此告警多发生于新模块集成的时侯,给新模块下发软件包即可消除
3、Failure in optical RP3 interface
系统模块与射频模块之间按的接口故障
处理建议:此故障多发生于拉远小区,处理步骤: 1.检查系统模块与射频模块间的光路是否正常;2.更换损坏的光纤或者光电模块;3.重启基站;4.更换故障模块 紧急告警 7660 BASE STATION LICENCE EXPIRED 基站licence过期
购买并更新过期的licence 次要告警 7661 BASE STATION LICENCE NOTIFICATION 基站licence告警
硬件不支持
1、“HW capacity too low for feature
2、“Licence missing
licence丢失
重要告警 7665 BASE STATION TRANSMISSION ALARM 基站传输告警 告警附加信息:
61151 “AIS on unit 1, interface X” 第X条传输告警
处理建议:第X条传输业务未分配,将业务分配后告警即可取消 61104 “EBER on unit 1, interface X” 第X条传输存在误码
处理建议:检查基站的传输情况
61171 “IMA link out of delay synchronization on unit 1, interface X” 传输帧延迟 处理建议:检查基站传输质量
61028 “LOF on unit 1, interface X” 第X条传输告警 处理建议:重做传输头
61029 “LOS on unit 1,(ethernet)interface X”
第X条传输断
处理建议:1.检查传输的收发是否接反 2.检查传输头子是否做好 61170 “Loss of IMA frame on unit $U, interface $IF” 处理建议:检查基站传输质量
61152 “RDI on unit 1, interface X” NONE 第X条传输告警 处理建议:重做传输头
LOS on unit 1, ethernet interface X或BFD down FE告警 处理建议:1.检查网线及头子2.检查IP配置 Synchronisation lost 基站同步丢失
传输帧丢失
处理建议:1.基站侧时钟配置错误;2.2M信号丢失导致基站时钟同步丢失。目前基站配置,多取第一条E1做时钟参考,如果第一条E1不好,就会导致基站同步丢失。61500 Five failed logins to FTM due to wrong user name or password 本端登录基站用户名或密码输入错误超过5次
不影响基站运行,无需处理
3117 FAILURE IN SAAL UNI SIGNALLING LINK ACTIVATION AAL2信令层激活失败
处理建议:检查基站传输,一般都是基站第二条传输有问题,此类告警需要与传输工程师联系,排查;
7740 BEATING WCDMA BTS ALARM 基站告警频出 当某种告警反复出现/取消超过20次就会触发此告警。
处理建议:检查基站的其他告警,按照其处理办法解决 7750 FAILURE IN WCDMA WBTS O&M CONNECTION 连接中断
BTS与RNC间的维护管理处理建议:1.检查基站是否退服 2.基站DCN配置是否正确 7761 RNW O&M SCENARIO FAILURE
基站AAL2链路激活失败
处理建议:伴随告警,一般伴随基站退服、基站重启产生。根据基站产生的其他告警处理。
7762 RNW DATABASE OPERATION FAILURE 处理建议:对无法读取到数据的基站进行重启 7771 WCDMA CELL OUT OF USE 小区不工作
处理建议:此告警为伴随告警,一般会伴随7650&7653等告警产生,请按照7650&7653的处理方法进行处理 7772 HSDPA CONFIGURATION FAILED
HSDPA配置失败
RNW数据库读取或写入失败
处理建议:1.检查小区状态是否正常 2.检查小区HSDPA配置是否已经开启 3.检查基站COCO配置 4.检查基站数据配置 4.锁/解锁小区 5.重启基站
7775 INCONSISTENCY IN WCEL CONFIGURATION PARAMETERS
小区配置参数冲突(RNC-BTS之间)
处理建议:检查RNC与BTS的相关参数是否设置一致 7776 HSDPA FAILURE IN WCEL 小区HSDPA不可用
处理建议:此告警为伴随告警,一般会伴随小区退服、基站退服产生,请按照处理小区&基站退服的方法处理
7778 WCDMA BTS DEDICATED MEASUREMENT FAILURE 基站测量失败
处理建议:1.检查基站是否正常工作,如果基站或小区已退服,则按照基站&小区退服处理方法处理 2.重新关联基站COCO 3.重启基站 7779 RECOVERY ACTIONS ONGOING
基站自动恢复进程正在进行
处理建议:此告警为伴随告警,当小区从退服状态恢复到工作时会触发此告警 7780 HSUPA FAILURE IN WCEL
小区HSUPA不可用
处理建议:此告警为伴随告警,一般会伴随小区退服、基站退服产生,请按照处理小区&基站退服的方法处理
7781 NETWORK ELEMENT CONFIGURATION ERROR 处理建议:删除基站数据,并重创正确的基站数据 7782 HSUPA CONFIGURATION FAILED
HSUPA配置失败
基站数据配置错误
处理建议;1.检查小区状态是否正常 2.检查小区HSUPA配置是否已经开启 3.检查基站COCO配置 4.检查基站数据配置 4.锁/解锁小区 5.重启基站
7783 IP BASED D-NBAP LINK FAILURE
基于D-NBAP链路的IP丢失
处理建议:此告警产生与基于IP传输的基站
7784 RECOVERY ACTION FAILURE NONE 基站自动恢复进程失败 处理建议:1.锁/解锁小区 2.重新关联基站COCO 3.重启基站
3267 AAL TYPE 2 CAC REJECTION LEVEL EXCEEDED FOR AAL TYPE 2 PATH 处理建议:IUB拥塞告警 建议对E1扩容
第四篇:爱立信基站典型故障处理案例[定稿]
爱立信基站典型故障处理案例
案例1:对基站进行IDB的配置总是无法完成,提示为时间超时。当对基站进行IDB数据的配置时,因为TRU与DXU软件版本不一致,或BSC下载软件的同时进行DXU数据配置而产生冲突,或第一次IDB配置电源电压类型错误,或短时间内频繁的对DXU进行IDB配置等原因,偶尔可能导致再进行IDB的数据配置时,出现提示为时间超时而无法完成的现象。导致DXU同机架内部的通信上存在异常现象,出现类似机架掉死的现象,更换DXU无效。
解决的办法是,将DXU(或新的DXU)放到同基站的其它机架上,或另外的基站上,仅对DXU加电,按照存在问题的机架配置进行IDB的重新配置,完成后再安装到存在问题的机架上,不必再重新配置,对DXU等各模块加电重起,即可解决问题。
案例2:RBS200基站工作不稳定,经常退服。基站各部件的稳定工作离不开稳定的时钟信号,而基站的时钟信号是从PCM传输中提取的,爱立信的基站不提供外部时钟输入的端口, RBS200基站是爱立信早期推出的GSM基站产品,这些基站设备是基于采用传统的PDH传输组网方式而设计的,并不非常适用于SDH传输组网方式,这就会导致RBS200基站在和某些厂家的SDH传输设备配合使用时,导致基站工作不稳定,频繁出现时钟同步的告警,经常退服,严重影响了基站的正常运行。
解决办法有两种:一种是将RBS200基站使用的SDH传输更换为PDH传输;另一种是将RBS200基站设备更换为RBS2000基站设备,因为RBS2000对同步要求较RBS200低,能够很好同SDH传输配合工作。
案例3:开始时,马厂湖基站有部分TS总是无法正常工作,且不固定在某个载频上,更换TRU、DXU无效,对基站的数据进行拆掉重新加载后仍无效,后来整个基站所有的TS均无法正常工作,基站硬件、传输、数据等均不存在问题。点检查了基站的所有硬件均不存在故障现象,对怀疑有问题的TRU、DXU进行了更换;对传输进行了环路测量,也未发现传输电路存在质量问题;检查小区、基站的定义数据也都正常。怀疑基站的数据存在掉死的现象,但没有确凿的证据。尝试用另外一种方法进行故障的定位。从BSC的ETC传输接口处,即ETRBLT板子2M接口处将马厂湖基站的传输DIP=97同另外一个类似配置的基站装载机厂的传输DIP=98直接进行互换,也就是说互相用对方基站的数据来开通基站。互换后发现,马厂湖基站的数据在装载机厂基站上仍然存在同样的问题,而装载机厂基站的数据在马厂湖基站上却能正常工作。这就可以说明,马厂湖基站的硬件、传输均不存在问题,基站数据确实存在掉死的现象。
在确认马厂湖基站的数据存在掉死的情况后,重新定义了新的TG数据,来替换原先存在掉死现象的TG数据,整个基站恢复正常运行。
对上述基站数据掉死的解决办法还有一种是进行BSC的重新启动,因为需要在晚上进行,因此可能会导致基站退服的时间较长。
案例4:中国银行基站第2小区对应的机架为2个CDU C,4个载频配置,总是在4个载频全部开起来后,又很快全部退服,现象为第1、2个TRU状态为TX not enabled,第3、4个TRU为Fault灯和Operational灯同时亮。每次对DXU进行复位,总是出现上述的同样现象,整个小区无法正常运行。
因为第3、4个TRU总是出现故障现象,将这两个TRU更换,仍然出现同样的故障现象;更换第3、4个TRU对应的第2个CDU C,仍然出现同样的故障现象。将第3、4个TRU放到第5、6个TRU的位置上,将第2个CDU放到第3个CDU的位置,这样载频的位置为第1、2、5、6,甩开TRU第3、4位置不使用,整个小区正常运行,不再出现上述故障现象。
根据以上处理过程进行分析,应该是第2个CDU C对应的CDU BUS总线或第3、4个TRU对应的背板存在问题,导致第2个CDU C不能正常工作,不仅导致第3、4个TRU不能正常工作,而且导致整个小区不能正常工作。
将第2个CDU C对应的CDU BUS总线拆下来,更换一新的CDU BUS总线后,故障解决,确认是第2个CDU C对应的CDU BUS总线存在问题。下图是CDU BUS的连接示意图:
还有一种解决办法,就是将CDU C更换为CDU C+,并且使用Y cable,按照如下图连接:
这样就可以不再使用第2个CDU C对应的有问题的CDU BUS总线,就不会出现整个小区开不起来的现象。
案例5:沂水城东基站A小区扩容一个机架,由6载频扩容为8载频。在打开跳频的情况下,A小区所有8个载频的时隙全部正常工作后很快陆续全部退服,同时出现1A级的XBus Fault告警,但告警很快又消失。对基站A小区复位或闭解CF,仍然是同样的故障现象。将A小区的跳频关掉后可以正常运行。
针对出现的XBus Fault告警,重点检查了新增扩的机架TRU和DXU背板跳点设置,CDU BUS的连接情况,均未发现异常,更换DXU也不能解决问题。考虑到当时是在上午忙时,此小区承担的话务量很高,有可能是因为A小区重起时接入用户太多导致负荷过高而不能以跳频方式正常运行,设置A小区参数CB=YES禁止待机时手机接入,设置A小区为Layer=3小区限制其它小区手机用户向A小区切换,这样的参数设置曾经解决过类似大容量小区在打开跳频的情况下忙时重起困难的问题,但仍不能解决沂水城东A小区的问题。
怀疑新增扩的2个TRU虽然状态显示正常,但仍然可能存在问题,导致XBbus工作异常。由于A小区的主架的6个TRU和副架的2个TRU间已多次互相倒换位置来排除TRU的问题,已经不能分清哪2个TRU是新增扩的。于是将A小区的所有8个载频全部替换,问题解决。总结:某个存在故障的TRU可以导致其背板连接的总线工作异常,在这个案例中,导致了XBus工作异常,小区不能打开跳频,但是此TRU的状态显示完全正常。解决办法是替换怀疑有问题的TRU,尤其是新增扩的TRU,不要采取在有问题的小区内互相倒换的方式,因为存在故障的TRU无论在那个位置均可以导致同样的故障现象。应该用其它小区或新带来得TRU替换。
还有一个例子也是存在故障的TRU导致其背板连接的总线工作异常的情况:某小区新扩一个机架,载频由6个扩容到7个,但是每次启站时总是很快出现驻波比过高的基站告警,所有载频全部退服,故障原因是新扩的TRU(在新扩的副架上)存在问题,虽然表面状态均很正常,但是把它插到机框内加电后,就会干扰背板总线的正常工作,导致出现整个小区驻波比过高的问题产生。
案例6:付庄基站为3个RBS2202机架级联、4/4/4配置,故障现象为B小区退服,复位后B小区恢复正常,但几小时后又再次退服,基站不存在任何告警。如此反复,B小区工作状态很不稳定。
因为是在基站运行中出现的故障,所以首先怀疑是B小区DXU出现故障,但是更换后仍无法解决。检查B小区的射频电缆、PCM传输电缆、CDU总线均无异常。通过OMT软件监测付庄基站3个机架DXU的PCM连接状态均正常。考虑到B小区是级联A小区的,即PCM传输电缆从A小区DXU的G.703-2端口连接到B小区DXU的G.703-1端口,这段传输通路是否存在问题?更换这段通路上的所有传输电缆,仍不能解决问题。再向前考虑一步,是不是A小区DXU的G.703-2端口存在问题,虽然没有故障状态显示?更换A小区的DXU,重新配置IDB数据后,问题解决。
总结:针对多机架级联的基站,第2、3小区退服的情况,要考虑前一级级联的小区所在的机架是否存在DXU故障、PCM传输电缆接错、IDB数据中未定义PCM级联等情况。
案例7:某个基站第2小区有3个时隙LMO状态为0800,复位和更换载频后无效。
检查基站的定义数据,发现第2小区对应的TG-139,在定义半永久连接关系时,将RBLT-1309与DCP 28连接是错误的,导致DCP 28相对应的4个TS时隙,无法正常工作。应该是RBLT-1308与DCP 28连接,正确修改后,故障解除。类似的故障现象可能还有如下的故障原因:(1)某个基站第2小区4个时隙LMO状态为0800复位和更换载频无效:用DTIDP指令检查DIP的定义数据,发现MODE=1是错误的。RBS200基站的DIP定义为MODE=1,即传输的第16时隙仅用于传信令,不用于传话音。而此基站为RBS2000基站,正确的定义是MODE=0,如果定义为MODE=1,会导致DCP 16,即传输的第16时隙不能正常使用,出现上述的故障现象,或者导致用户占用时出现单通现象。
(2)某个基站第3小区2个时隙LMO状态为0800,复位无效: 第3小区的2个时隙的故障原因是在定义基站数据时,MO CF的参数SIG=UNCONC错误,因为所有的TRX的SIG=CONC,导致TG分配的DCP不够用。将MO CF的参数该为SIG=CONC,故障消除。
案例8:某个新建基站传输状态正常,硬件也不存在问题,但基站开不起来 基站数据定义看起来不存在问题,其它检查也做了很多,但基站仍然不能开起来。重点检查基站DIP所连接的SNT的DEVICE数据定义,会发现RBLT的状态不对,为MBL闭掉的状态,试图解闭,可能还会发现未完全定义,再用EXDAI、EXDUI指令进行补充定义,解闭此SNT所带的RBLT,再重新LOAD基站数据后问题解决。对新建基站开不起来的情况,还有BSC侧MO=RXOCF的TEI值与基站OMT软件定义的不一致,导致基站无法同BSC建立联系。此种情况较多的出现在级联基站上,重新定义,使基站的TEI值同BSC侧定义的TEI值一致便可解决问题。
案例9:盲校基站存在瞬断现象,导致信道完好率虽然很接近但达不到100%,同时基站传输设备也出现传输瞬断的现象。
检查基站硬件设备,及传输设备均未发现异常,更换DXU也无法解决问题。在基站上进行故障处理时,发现老式的爱立信开关电源存在模块损坏的情况,但仍能正常工作。经过长时间现场观察,发现交流电压不稳定,忽高忽低,当电压过高时,开关电源的过压保护器便跳脱保护,爱立信开关电源所有的模块处在过压保护的状态,同时传输设备瞬间复位,导致基站瞬断。此时就发现了交流电压过高可能是导致盲校基站瞬断的原因。经过分析,老式的爱立信开关电源对交流电电压波动范围的适应性较差,当电压过高超出其限定值时,开关电源的所有模块出现瞬间的保护而导致其直流输出电压异常,从而导致传输设备因直流供电不能满足要求而瞬间复位,导致爱立信基站瞬间退服。
将老式的爱立信开关电源更换为能适应宽范围交流电压波动的新式开关电源,问题解决,盲校基站再也未出现瞬断的现象。这样的情况也存在于其它部分型号的、对交流电压波动适应性差的老式开关电源上。
案例10:柳行头基站为九期新建全向2载频基站,传输环路状态正常,不存在滑码、误码等传输质量差的情况,基站硬件状态正常,不存在任何告警,但将传输头子接到DXU的G.703-1接口后,BSC侧传输状态显示WO正常状态,但是DXU黑灯,所有的指示灯均不亮。从BSC侧观察是CF无法Load成功,导致此基站开不起来。
首先全面检查基站硬件、传输设备、传输电缆等均没有发现问题,检查柳行头基站数据、小区数据定义也没有发现问题,更换DXU也不能解决问题。
从BSC的ETC传输接口处将柳行头基站的传输同另外一个相同配置且正在运行的松峰基站传输互换,不必改动任何数据,也就是说互相用对方基站的数据来开通。柳行头基站的数据在松峰基站上运行正常,而松峰基站的数据却无法在柳行头基站上运行,这就可以说明柳行头基站的数据不存在错误、掉死等异常情况,而从BSC到柳行头基站的传输通路上存在问题,也可能是基站硬件存在问题(这已排除)。
这样重点怀疑从BSC到柳行头基站的传输通路上存在问题,需要仔细检查,传输维护人员从BSC往基站方向一段一段进行检查,果然发现在北园传输机房处柳行头基站的传输跳线存在问题,120欧姆4根信号传输线中的一根与配线端子处在似接触非接触的状态,重新卡接后,柳行头基站CF软件load成功,基站顺利开通,问题解决。
需要注意的是,基站电路环路时是通的,并不能代表基站电路完全不存在问题,因为还存在类似上述传输信号线接触不好、远端告警等一些特殊的传输故障现象。
案例11:邮政局基站C小区扩容到主、副架共12个载频,但是最多只能开起来10个载频,总有2个载频无论如何也开不起来,并且这2个开不起来的载频位置不固定,状态表现为仅Tx not enable灯亮。基站不存在告警。更换相应的载频无效。仔细观察开不起来的2个载频的故障现象,发现总是某一个CU上的2个载频同时出现开不起来的现象,虽然这个CU也不是固定的。将12个载频中的某两个位于同一个CU上的载频TRX闭掉,其它10个载频均能正常工作。
根据以上现象,考虑到爱立信基站载频相互间发射部分TX和接收部分RX存在“借用现象”,即载频A的RX(可能载频A的TX存在问题)和载频B的TX可以组成一个完整的正常工作的“载频”,而载频A的状态可能为正常运行状态,而载频B的状态为仅Tx not enable灯亮。
进一步从BSC上观察邮政局基站C小区各MO的工作状态,发现最后2个载频的TX-11&&-12工作状态开始时总是NOOP,过一段时间之后状态变为FAIL,但是考虑到最后2个载频的TX发射部分可以借用另外2个载频的TX发射部分,即存在TX的“借用现象”,因此状态仍有可能是正常运行的。导致TX状态为FAIL的原因有发射通路上的CDU存在问题,连接的天线驻波比过大,TX定义的连接小区错误,TRU的发射部分存在故障等原因。经过排查,重点怀疑是最后2个载频,即TRX-11&&-12对应连接的CU存在问题,虽然此CU的运行状态正常,无故障灯指示。更换此CU后,邮政局C小区的12个载频全部开起来,问题解决。这种类型的故障处理,不要被基站各硬件的运行状态显示所迷惑,可能状态是正常的,但是也有可能存在问题,就像上面所讲的CU的故障现象。
案例12:TX无法正常工作,基站告警为CDU output power limits exceeds 九期工程中,在开通西梁王基站(S2,2,2)时,发现虽然基站本测过程中,各MO 状态正常,均无告警,但是在开站时,当TX打开后, B小区CDU的Fault 红灯亮,,小区不能工作。我们通过OMT查寻告警,监测到SO CF 2A:9 :CDU output power limits exceeds。首先我们怀疑天馈系统有问题,用驻波比测试仪测得DTF值1.08,SWR值1.19,均为正常值。随后更换了CDU及TRU后故障仍未排除。最后我们根据TX的原理,输出功率由前向及反向功率的比较得出的(Reference RBS2202),于是检查对应的Pref,Pfwd馈线,发现标签贴反,导致反向功率总大于前向功率,更改后故障消除。
案例13:基站存在SO CF 2A: Timing bus fault告警,TRU无法工作。建工大厦基站(S6,6,6,)在扩为(S8,6,6)时,A小区扩容的副柜TRU状态不对,TRU的Fault在自检后长亮。此时B,C小区已正常。用B,C小区的机柜带A小区的副柜无问题,从而证明A小区的副柜本身无问题。通过OMT查寻告警,监测到SO CF 2A: Timing bus fault。更换C5 BUS线后故障仍未排除,于是判定故障点应在A小区机柜本身之内。根据OMT读出告警,判断故障为机柜内 BUS问题,更换后状态正常,A小区正常工作。
案例14:PSU的排障方法
下面是满配置的PSU与ECU的光纤连接示意图: 在基站出现同PSU相关的告警后,到基站上观察PSU的状态,可能有如下两种情况:第一种是PSU亮红灯或不亮灯,第二种是PSU面板状态正常但可能存在故障。针对第一种情况,首先检查PSU的-48V直流(PSU-48)或230交流(PSU 230)输入是否正常,可能存在输入开关跳脱或熔丝熔断的情况,如果排除上述情况,那么很可能是亮红灯或不亮灯的PSU存在故障,进行更换确认。对更换后的新PSU,应该先加-48V直流或230交流输入(下面的接头),再连接直流输出接头(上面的接头),否则容易导致新加的PSU因为直流电流倒灌的原因而再次损坏。针对第二种情况,使用逐个排除的方法来找出存在故障但面板显示正常的PSU。满配置的PSU数量一共是4个,与ECU通过光纤串联在一起,形成一个环路。首先甩开左边第1个PSU,将剩下的3个PSU同ECU通过光纤串形连接,再观察基站的PSU相关告警是否消除,如果消除,则说明左边第1个PSU存在故障,进行更换;如果故障仍未消除,可将左边第2个PSU单独甩开,将剩下的3个PSU同ECU通过光纤串形连接,需注意的是从左边第1个PSU直接连接到第3个PSU的光纤需要换成长一点的光纤,再观察基站的PSU相关告警是否消除,以此类推,逐个排查PSU。除了上述方法,类似的,还可采用每个PSU单独同ECU串形连接,再观察基站告警是否消除的方法,逐一进行排查。还有一点需要说明的是,基站对PSU的识别并不是完全根据PSU的安装位置,例如最左边的PSU被识别为PSU-0,向右依次为PSU-
1、PSU-
2、PSU-3,实际上并不是这样的。基站识别PSU是通过光纤环路来识别的,不在这个环上的PSU将不被识别,同时针对这个不在环上的PSU基站也不会产生告警。光纤环路连接最左边的PSU被识别为PSU-0,然后依据光纤环路上的连接,向右依次识别为PSU-
1、PSU-2等,例如PSU-0,它的实际安装位置可能是从最左边数第3个PSU。
有一个故障现象是某个PSU的架顶-48V输入接口因短路损坏严重,不能再使用,并且基站存在相应告警。消除告警的办法是在PSU与ECU的光纤环路中,甩开这个损坏严重的架顶-48V输入接口对应的PSU,再从IDB数据中删除多余的PSU(损坏的接口对应的)即可消除告警。
第五篇:LTE基站告警处理指导手册-大唐
大唐LTE站点告警处理指导手册
一、小区退服
告警解释:故障小区业务全阻,不能提供任何服务 可能原因:
1、射频单元不在位;
2、辅光口故障;
3、人为去激活小区;
4、GPS故障;
5、传输故障;
6、基带板故障。 处理步骤:
1、查找故障站点;
2、查看承建故障小区的射频单元是否在位,物理设备-射频单元拓扑,如下图,一般情况小区1~3分别建立在射频单元拓扑0~2上。
射频单元不在位告警处理方法:(1)远程确认现场供电是否正常;
(2)近端更换光模块观察告警是否恢复;(3)近端更换光纤观察告警是否清除;(4)近端更换RRU观察告警是否清除。请参考“射频单元不在位告警”处理方法
故障告警依然没有恢复,请联系大唐工程师。如果射频单元存在,则转步骤3处理;
3、查看承载小区射频单元接入BBU的光口信息,如下图,射频单元0接入基站板卡槽位号为4,射频单元光口1接入板卡光口号为0,射频单元光口2(辅光口)接入板卡光口号为1;
查看光模块光口信号,位置物理设备-机架-机框-板卡-光模块,如果对应光模块的光口信号丢失状态为丢信号,请参考“BBU Ir光链路光信号丢失告警”处理方法;如果没有丢信号,则转步骤4处理;
4、请查看操作记录,确认人为去激活小区原因;如果不是人为去激活,则转步骤5处理;
5、查看基站GPS工作状态是否正常,位置物理设备-时钟信息-当前时钟,如果当前时钟不是锁定状态,请参考“GPS告警”处理方法,如果当前时钟是锁定状态,转步骤6处理;
6、查看传输链路信息是否正常,如果链路公共信息是故障,请参考“S1链路断开告警”处理方法。
故障告警依然没有恢复,请联系大唐工程师。
二、基站退服
告警解释:基站所有小区业务全阻,不能提供任何服务 可能原因:
1、传输故障
2、时钟故障
3、基带板卡退服
即所有小区退服后,上报基站退服告警。 处理方法:
1、查找故障站点;
2、查看基站传输链路是否故障如下图,传输管理-SCTP链路,如果SCTP链路建立状态不是与对端建立成功,运行状态为故障,请参考“S1链路断开告警”处理方法; 如果传输链路运行正常,转步骤3处理;
3、查看时钟是否故障
如下图,时钟可用状态为不可用,时钟运行状态为Holdover超时状态,请参考“时钟holdover超时”告警处理方法;
如果时钟可用状态为可用,时钟运行状态锁定状态,如下图,则转步骤4处理;
4、查询基带处理板是否故障或不在位,如下图(仅供参考)。
a、如果基带板不在位(上图序号5指示位置没有该板卡),请参考“单板不在位”告警处理,如果存在基带板转b处理;
b、查看板卡运行状态,如上图(序号6所指示位置),如果运行状态故障,尝试复
位单板,右键单击板卡0.0.4弹出快捷菜单,选择板卡复位,复位板卡故障不能恢复,判断为板卡硬件故障;
基站退服告警远端预处理完毕。
三、小区降质
告警解释:故障小区业务服务质量下降 可能原因:
1、射频资源不可用
2、射频通道故障
3、智能天线通道故障
4、光链路误码 处理步骤:
1、查找故障站点;
2、查看小区的网络规划,布配的射频单元个数与实际接入的射频单元个数是否匹配。
如图1射频单元规划0-9共10个,图2查看射频单元拓扑,实际接入9个。则存在规划射频单元未接入,推断是该小区已经规划射频单元不可用导致小区降质,请参考“射频单元不在位”告警处理方法;
如果布配的射频单元个数与实际接入的射频单元个数匹配,则转步骤3处理;
3、查看建立小区的射频单元是否存在射频通道故障(该问题多出现在室分站点2通道射频单元),如下图查看射频单元发送、接收方向天线的状态(该图仅供参考)是否故障状态,如果故障状态则射频通道故障导致小区降质,对故障通道更换跳线并复位RRU来解决;
如果建立小区的射频单元通道发送方向、接收方向天线的状态均为正常状态,则转步骤4处理;
4、射频单元智能天线通道故障(使用的智能天线,8个通道),如下图查看射频单元通道发送、接收方向天线的状态(该图仅供参考)是否故障状态,如果是故障状态则是因为通道故障导致小区降质,对故障通道接口进行检查,看是否有松动或者进水等情况,之后进行跳线更换并复位RRU。
5、以上排查完毕,告警依然存在,可以查看是否存在光链路误码告警,存在侧按照误码告警处理。
小区降质告警远端预处理完毕。
四、NEA和ENB断连
告警解释:基站脱离网管控制,网管不能对次站进行操作。可能原因:
1、传输故障;
2、基站断电。处理步骤:
1、查找故障基站;
2、查看故障基站字体为红色,设备可用状态为测试中,失败,如下图
可以和传输人员进行确认,是否是传输故障导致;也需要近端上站确认,是否由于停电导致。
五、射频单元不在位告警
告警解释:
1、RRU未布配
2、RRU未接入(RRU没电、RRU没光)如图:LTM
远端修复: 查看此条告警的告警子原因值来确定问题的详细原因。
如果告警子原因为射频单元掉电:
1.远程确认现场供电是否正常:
Y=>现场供电正常,转近端维护。
N=>现场供电异常,等待机房供电恢复,转2:
2.查看告警是否恢复:
Y=>告警已恢复,告警处理结束。
N=>告警未恢复,联系大唐移动。
3.如果告警子原因为“其它”,检查配置参数是否正确
N=>修改RRU规划信息。
Y=>转近端处理建议。
近端修复: 1.更换光模块观察告警是否恢复:
Y=>告警已恢复,告警处理结束。
N=>告警未恢复,转2;
2.更换光纤观察告警是否清除:
Y=>告警已恢复,故障排除。
N=>告警未恢复,转3;
3.更换RRU观察告警是否清除:
Y=>告警已恢复,故障排除。
N=>告警未恢复,联系大唐移动
六、单板不在位告警
告警解释:基站布配板卡不能正常工作,若该单板上布配了本地小区,将导致小区退服或者本地小区无法建立。 可能原因:
1、布配了该板卡,实际开站时,未插入该板卡,或者后期板卡被拆除;
2、有人复位版卡,复位过程中上报单板不在位告警;
3、板卡故障,尝试远程复位板卡,如果不能恢复,近端更换新板卡; 处理步骤:
1、查找故障站点;
2、查看板卡规划是否规划该板卡,如下图规划5块板卡,0.0.4槽位为BPOG基带板;
3、确认已经规划板卡,则查看板卡运行状态(下图仅为示例);
如果板卡故障状态,复位板卡,如果远端复位板卡无效,则板卡硬件故障。
单板不在位告警预处理完毕。
七、S1链路断开告警
告警解释:故障站点基站退服,不能提供业务服务 可能原因:
1、检查配置参数(基站侧传输参数、小区参数等)配置是否正确;
2、由于传输链路出现问题,导致该传输链路无法使用,进而致使S1链路断开告警; 处理步骤:
1、查找故障站点;
2、校对传输参数,如下图对端网元为MME,检查对端IP地址是否正确,不正确请修正;
检查基站IP地址是否设置正确,如下图,不正确请修正;
检查小区跟踪ID、移动国家码、移动网络码是否正确,如下图,不正确请修正;
如果参数都正确,则传输故障(注:如果多个站点同一时刻断连,传输问题较大)。
S1链路故障告警预处理完毕。
八、时钟holdover超时
告警解释:基站时钟源故障,会导致基站退服,不能提供服务 可能原因:
1、检查时钟天线安装位置是否开阔无遮挡物,是否处于信号覆盖区;
2、近端用万用表检查GPS馈线线缆是否正常(短路或开路状态);
3、GPS硬件故障,更换GPS蘑菇头; 处理步骤:
1、查找故障站点;
2、查看时钟状态,如下图,时钟可用状态为不可用,且锁星数为0;
结论:时钟源故障,参考可能原因1、2、3处理。
九、BBU Ir光链路光信号丢失告警
告警解释:光链路信号异常,可能无法建立小区 可能原因:
射频单元和BBU之间的光链路故障; 处理步骤:
1、查找故障站点
2、查看故障光模块信息,信号丢失状态为丢信号。
结论:射频单元和BBU之间的光链路故障,排查光纤、光模块故障。
十、处理器故障
告警解释:大多数为载波板处理器故障,基带资源不可用,导致小区退服,本地小区建立不起来。
远端修复:
复位板卡,查看告警是否恢复:如图(4G网管)
Y=>告警已恢复,告警处理结束。
N=>告警未恢复,直接更换板卡。
2.如果出现反复上报告警的情况,转近端处理。
近端修复: 1.更换故障板卡,查看告警是否恢复:
Y=>告警已恢复,告警处理结束。
N=>告警未恢复,联系大唐移动。
十一、设备进入不稳定状态
远端修复: 参考上一条告警1021 射频单元不在位告警的近端处理建议,处理完成后需要手动清除该告警。
若该告警存在反复上报,则联系大唐移动。
十二、射频单元驻波比严重告警
告警解释:有驻波 远端修复: 1.查询对应射频单元“天线驻波比信息”(对应MML命令:LST RRUPTVSWR),查看通道的驻波比信息是否超过门限值:如图:(4G网管)
Y=>驻波比异常,说明通道硬件或链接异常,转近端处理。
N=>驻波比无异常,可以认为告警已清除。
近端修复: 1.上站在RRU显示的故障射频端口堵上50欧姆负载,查看告警是否恢复:
Y=>告警已恢复,说明RRU正常,联系工程人员排查天线问题;
N=>告警未恢复,转2;
2.更换RRU,查看告警是否恢复:
Y=>告警已恢复,告警处理结束。
N=>告警未恢复,联系大唐移动。
注:对射频端口操作时,需要关闭射频通道或者RRU下电,建议RRU下电后操作。
十三、GPS故障告警
查看告警信息显示如下图:
告警解释:时钟进入异常运行状态,小区退服;Holdover超时告警,需要进行故障处理,如不处理会出现小区退服;
可能原因:GPS蘑菇头、GPS馈线、GPS接收机、时钟锁相环模块等出现问题。 处理步骤:
7、远程操作:登陆站点查看相应故障站点的GPS信息。具体操作如下图:
此图显示的为正常状态信息,如出现与此图显示信息不一致的信息说明GPS相关部位出现故障。
8、如出现Holdover超时告警,远程复位时钟所在板卡操作如下:
9、如上述操作后告警信息未消除,联系相关人员利用仪器测量外部供电电压,近端检
查GPS的蘑菇头安装是否开阔,是否处于信号覆盖区。,检查GPS馈线线缆是否正常(开路或短路状态),检查GPS的浪涌保护器是否连接正常。
10、如上述操作告警依然未消除,建议更换时钟所在位置的板卡。
11、如出现时钟进入异常运行状态告警,远程复位主控板卡,操作如下:
7、如上述操作告警未消除,更换时钟所在模块的板卡。
8、基站故障根据指导书进行相应处理,依然没有恢复,请联系大唐工程师。
十四、光口速率不匹配告警
查看告警信息显示如下图:
告警解释: 可能原因:
7、光模块配置或定制错误; 处理步骤:
12、更换合适速率的光模块。
2、基站故障根据指导书进行相应处理,依然没有恢复,请联系大唐工程师。
十五、射频单元Ir光链路接收误码高
查看告警信息显示如下图:
告警解释:射频单元的IR光链路接收有误码,当误码高时可影响小区的质量或者导致RRU无法接入,导致小区退服。 可能原因:
8、光模块进入杂质导致产生误码;
9、BBU侧或者RRU侧的光纤接头进入灰尘;
10、BBU与下级射频单元间的光纤线路问题; 处理步骤:
13、针对存在告警所在小区的RRU进行复位操作,查看故障告警是否消除,操作如下图;
2、如复位操作未使告警消除,更换BBU侧光模块,查看告警是否消除。
3、如上述操作告警未消除,清洗BBU侧光纤端面,查看告警是否消除。
4、如上述操作告警未清除,更换RRU光模块查看告警状态。
5、如上述操作告警未消除,清洗RRU侧光纤端面,查看告警是否消除。
6、如上述操作告警未消除,更换BBU与RRU间的光纤。
6、基站故障根据指导书进行相应处理,依然没有恢复,请联系大唐工程师。
十六、射频单元本振失锁告警
查看告警信息显示如下图:
告警解释: 可能原因:
11、时钟同步问题; 处理步骤:
14、远程操作:复位射频单元。具体操作如下图:
2、如上述操作故障未排除,建议更换射频单元。
6、基站故障根据指导书进行相应处理,依然没有恢复,请联系大唐工程师。
十七、射频单元下行输出过功率告警
查看告警信息显示如下图:
告警解释:射频单元的下行输出过功率,可能影响小区的状态及影响RRU的接入状态。 可能原因:
12、光模块问题;
13、BBU与RRU连接的接口板问题;
14、BBU与射频单元间的光纤问题; 处理步骤:
15、查询光模块是否在位以及收发光功率是否正常,如正常复位RRU查看告警是否消除,操作如下图;
2、如上述措施未使告警消除,复位BBU与RRU连接的接口板(此处例举的为BPOH板卡,现场复位哪块板卡因现场为准),查看告警是否消除,操作如下图;
3、如上述操作告警未消除,重新安装或更换光纤及其光模块;
4、基站故障根据指导书进行相应处理,依然没有恢复,请联系大唐工程师。
十八、射频单元下行输出欠功率告警
查看告警信息显示如下图:
告警解释:射频单元的下行输出过功率,可能影响小区的状态及影响RRU的接入状态。 可能原因:
15、光模块问题;
16、BBU与RRU连接的接口板问题;
17、BBU与射频单元间的光纤问题; 处理步骤:
16、查询光模块是否在位以及收发光功率是否正常,操作如下图,如正常复位RRU查看告警是否消除;
17、如上述措施未使告警消除,复位BBU与RRU连接的接口板(此处例举的为BPOH板卡,现场复位哪块板卡因现场为准),查看告警是否消除;
3、如上述操作告警未消除,重新安装或更换光纤及其光模块;
4、基站故障根据指导书进行相应处理,依然没有恢复,请联系大唐工程师。
十九、射频单元下联光链路收光信号丢失告警
查看告警信息显示如下图:
告警解释:射频单元下联光链路收光弱导致光信号丢失,如程度严重可导致RRU断接,导致小区退服。 可能原因:
18、光纤实际长度与光模块所支持的光纤长度不匹配;
19、BBU侧的IR光口的光纤接头进入灰尘; 20、光模块故障;
21、BBU与下级射频单元间的光纤线路问题; 处理步骤:
18、针对存在告警所在小区的RRU进行复位操作,查看故障告警是否消除;操作如下图:19、2、如复位操作未使告警消除,查看光纤实际长度与光模块所支持的光纤长度是否匹配,如不匹配更换光纤或光模块。
3、如果光纤实际长度与光模块所支持的光纤长度匹配,检察BBU侧的IR端口,拔出光模块上的光纤接头,用无纤纸擦拭以清洁光纤接头,然后将光纤接头插好,查看告警是否清除。
4、如未清除,更换光模块查看状态。
5、更换光模块后如未解决,检查光纤线路是否发生挤压或弯折,必要时更换BBU与下级射频单元间的光纤线路。
6、基站故障根据指导书进行相应处理,依然没有恢复,请联系大唐工程师。