新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問(wèn)題描述
中國(guó)北方某局點(diǎn)OSN1500多塊單板上報(bào)TEMP_OVER告警,結(jié)合告警參數(shù)和設(shè)備工作環(huán)境的問(wèn)題,斷定該告警是單板溫度過(guò)低而引起的,下面討論一下NG-SDH設(shè)備的溫度檢測(cè)機(jī)理以及遇到的一些問(wèn)題。
現(xiàn)網(wǎng)版本:5.36.18.50
告警信息
TEMP_OVER
處理過(guò)程
查看當(dāng)前告警中TEMP_OVER告警參數(shù)如下:
2929679 12 TEMP_OVER MJ start 2011-12-01 04:52:16 None 0x01 0x00 0x01 0x02 0xff
3000350 80 TEMP_OVER MJ start 2011-12-24 04:59:15 None 0x01 0x00 0x01 0x02 0xff
結(jié)合當(dāng)前OSN1500產(chǎn)品手冊(cè)(V100R008C02)中,對(duì)于SDH類單板,由參數(shù)4表示單板工作溫度越限的類型,對(duì)于交叉類單板,由參數(shù)1表示單板工作溫度越限的類型,其中0x01表示單板工作溫度越上限,0x02表示單板工作溫度越下限。那么對(duì)于三合一板應(yīng)該看參數(shù)1,工作溫度上限越限,顯然和實(shí)際情況相反,查詢的當(dāng)前單板的溫度cfg-get-bdtemp:80,單板當(dāng)前問(wèn)題為-2°C。
BOARD-TEMP
BID TEMP-NOW
80 -20
Total records :1
所以產(chǎn)品手冊(cè)中工作溫度越限類型看參數(shù)1是錯(cuò)誤的,經(jīng)過(guò)研發(fā)確認(rèn),對(duì)于交叉類TEMP_OVER告警參數(shù)只需要看參數(shù)4,參數(shù)1為固定值,OSN3500(V100R008)和OSN7500(V100R008)對(duì)于參數(shù)的解釋也是有誤的,其他版本比如R11的產(chǎn)品文檔在告警參數(shù)解釋上有變動(dòng),只需要關(guān)注參數(shù)1。
2、NG-SDH設(shè)備溫度上報(bào)的機(jī)制,單板內(nèi)部有溫度芯片,可以實(shí)時(shí)檢測(cè)單板的溫度,其他單板和主控板是通過(guò)背板通信的方式,將實(shí)時(shí)溫度上報(bào)給主機(jī),主機(jī)結(jié)合當(dāng)前網(wǎng)元的所有單板上報(bào)溫度中的最大值,記錄到溫度性能事件里面,所以只有主控板才能查詢到單板溫度的性能事件(bdtempmax,bdtempmin,bdtempcur),其他單板查詢出來(lái)的是激光器的溫度,該溫度比單板問(wèn)題高。
3、同一單板的不同版本對(duì)于溫度查詢支持情況是不同的,例如SSN2PQ1 VER.C(含溫度芯片)和SSN2PQ1S VER.C(不含溫度芯片),前者屬于早期的版本,后者是降成本的產(chǎn)物,所以前者支持溫度查詢和溫度告警的上報(bào),后者不支持該功能。具體情況可以通過(guò)cfg-get-bdtemp:bid,根據(jù)返回的結(jié)果來(lái)判斷該單板是否含溫度芯片。
4、溫度告警是單板內(nèi)溫度芯片查詢單板實(shí)時(shí)溫度,和溫度告警門限值進(jìn)行比較,如果越限就上報(bào)TEMP_OVER告警。當(dāng)然告警門限值可以通過(guò)命令行修改:cfg-set-bdtempth:Bid, temphighgate, templowgate;門限值是有范圍限制的,比如上門限在60-80,一些數(shù)據(jù)單板(SSN1EAS1/SSN1EAS2/SSN1EMS4/SSN1EGS4)是80,其他單板是70,缺省值是65。一般不建議將溫度門限設(shè)置超過(guò)70。
建議與總結(jié)
一般情況下TEMP_OVER是因?yàn)闇囟冗^(guò)高而上報(bào)的告警,但是也有溫度過(guò)低上報(bào)該告警的情況,為了消除此告警,請(qǐng)盡量保證設(shè)備工作環(huán)境的溫度處于正常條件(0~45度之間)。