晚上好,我是老楊。最近和一老粉聊起他自己部門帶人管理類的問題:
他覺得自己部門新來的人連排障都做不清楚,希望我能給他指點一下,網絡排障的關鍵點到底是什么。
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
老楊覺得,如果你要深究,其實網絡排障本身可以是一個不小的項目工程。而要讓這個項目順利進行,網工需要掌握兩種基本的技能。
首先,是對網絡技術和協議要有清楚的理解和認知,它是診斷與排除網絡故障的基礎。
想要了解排障所需理論基礎?老楊推薦閱讀:《網絡排錯沒思路?這份最全總結,別說你還沒看過》
第二,是將所掌握的知識以有條理的方式應用于診斷和排除網絡故障的過程中。
故障診斷與排除是一種結構化的方法,正確的計劃在故障診斷與排除過程中往往起決定性的作用。
在故障排除過程中,一個偶然的行為可能使故障得以順利解決,但是它不能替代結構化的故障診斷與排除方法。
今天這篇文章,老楊想和你分享匯總些思科、華為設備的報錯消息及其解決方法,以便幫助你更好的提升網絡排障的效率。
01 思科設備報錯消息(1)系統錯誤消息格式
% - - - :Message Text
:它指出錯誤消息涉及的設備名。該值可以是協議、硬件設備或者系統軟件模塊。 :它僅與通道接口處理器(CIP)卡有關。詳細的信息可以參見Cisco文檔的相關章節。 :它是一個范圍在0到7之間的數字。數字的值越小,嚴重程度越高。 :唯一標識錯誤消息的單值代碼。該代碼通常可以暗示錯誤的類型。 Message Text :它是錯誤消息的簡短描述,其中包括涉及的路由器硬件和軟件信息。
下面是錯誤消息的示例,你可以查閱CCO ISO文檔的系統錯誤消息一節,以查找這些錯誤消息的說明。
%DUAL-3-SIA:Route 171.155.148.192/26 stuck-in-active state in IP-EIGP 211. up%LANCE-3-OWNERR: Unit 0, buffer error
需要注意的是,并不是所有的消息都涉及到故障或者問題的狀況。某些消息顯示的是狀態方面的信息。
例如,以下消息僅表明ISDN BRI 0接口與特定的遠端數據連接:
%ISDN-6-CONNECT: BRI0 is now to
?
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
(2) Report
某些與路由器內部錯誤相關的錯誤消息包含了信息。在向Cisco TAC報告錯誤時,應在錯誤描述中加入這些信息。
(3)錯誤消息和事件信息的日志
根據錯誤消息的重要性和有效性,Cisco錯誤消息可以被記錄到以下位置:
& #61550; ;; 控制臺 & #61550; ;; 虛擬終端 & #61550; ;; Syslog服務器 & #61550; ;; 內部緩沖區
logging on命令使日志消息的輸出到上述位置,對于Syslog服務器,必須使用下述全局配置命令指明服務器的IP地址: logging ip-address
通過反復使用這一命令,可以建立一個服務器的列表,在管理大型網絡時,通常需要設置冗余服務器。
logging 命令用于將日志信息發送到內部緩沖區,緩沖區的大小必須在4096字節以上,缺省值根據系統平臺的不同而不同。
用戶需要選擇適合環境的緩沖區大小,如果緩沖區太小,新的消息將會覆蓋舊的消息,這有可能會導致問題
但是,如果緩沖區大小過大將會浪費系統緩存,no logging 命令,將禁止消息被寫入內部緩存。
用戶可以使用show logging命令顯示內部緩沖區的內容,如果用戶需要某一時間段的信息,首先使用NTP或者手工設置時鐘,具體操作為: YH-Router#clock set 11:37:00 2000 YH-Router#sh clock 11:37:03.596 PST Fri Dec 11 2000
日志消息的時間戳和調試信息可以使用以下全局配置命令:
YH-Router (config)#service log YH-Router (config)#service debug
monitor命令將在當前終端上顯示調試時的日志信息,該命令不是一個配置命令。相反,它可以通過telnet到路由器時在命令行方式下使用。
在大多數情況下,用戶可能需要顯示某一級別的日志信息。因此,日志信息被分為八個不同的級別,按照重要程度由高到低排列如下: & #61550; ;; & #61550; ;; Alerts & #61550; ;; & #61550; ;; Errors & #61550; ;; & #61550; ;; & #61550; ;; & #61550; ;;
例如,需要在控制臺上顯示嚴重程度等于或者大于警告(Warning)的所有日志信息,可以使用下述全局配置命令: logging console warning
類似的,將某種類型的日志信息發送到當前的終端時,使用:logging monitor level
或者將信息發送到Syslog服務器時使用:logging trap level
與 monitor命令不同,logging monitor命令是路由器配置的一部分。前一種命令不允許在不同的安全級別下執行。
?
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
需要注意的是,將日志記錄到不同的位置時,系統開銷變化很大,將日志記錄到控制臺的開銷比較大,然而將日志記錄到虛擬終端時開銷較小。
使用Syslog服務器時開銷更小。系統開銷最小的日志寫入方式是寫入內部緩沖區。
(3)核心轉儲(Core Dump)
為了查找路由器崩潰的原因,我們可以使用許多命令來獲取有效的信息,核心轉儲是系統內存映象的拷貝,它可以被寫入到TFTP服務器中。
從這個二進制文件中,我們可以獲得與路由器崩潰或者嚴重誤操作相關的信息,通過這些信息可以排除可能的故障。
下面的配置命令將核心轉儲寫入到命令中IP地址對應的TFTP服務器上: dump ip-address
write core命令通常用于路由器發生嚴重的誤操作但是沒有完全崩潰時,保存核心映像。
只有運行IOS v 9.0或更高版本的服務器才可以使用核心轉儲。但是,需要注意的是,在使用核心轉儲時,最好獲取有經驗的工程師或者Cisco TAC的支持。
02 華為交換機接口報錯指南
情況: 接口下配置IP地址不成功
(1)故障分析
接口下配置IP地址過程中出現錯誤,導致IP地址配置不成功。
(2)操作步驟
根據下表檢查錯誤提示信息,并對照采取故障排除方法。
錯誤提示信息一:Error: The IP address is invalid.
錯誤提示信息解釋:無效的IP地址,IP地址或子網掩碼錯誤。
故障排除方法:請檢查后重新配置,IP地址是否屬于常用的A、B、C三類IP地址中的一種,子網掩碼是否正確。
錯誤提示信息二:Error: The address with another address.
錯誤提示信息解釋:IP地址沖突,本設備的其他接口已使用了相同網段的IP地址。
故障排除方法:請使用其他網段IP地址進行配置。
錯誤提示信息三:Error: The primary address does not exist.
錯誤提示信息解釋:刪除的主地址不存在。
說明: 一個接口只能有一個主IP地址,當配置主IP地址時,如果接口上已經有主IP地址,則原主IP地址被刪除,新配置的地址成為主IP地址。
錯誤提示信息解釋:無需執行刪除操作。
錯誤提示信息四:Error: Please the primary address in the view first.
錯誤提示信息解釋:設備沒有配置主IP,所以無法配置從IP。
故障排除方法:先給設備配置主IP地址。
錯誤提示信息五:Error: The number of of the reached the upper limit (15).
錯誤提示信息解釋:在接口上配置的從IP地址超過最大數目,無法繼續配置從IP地址。
說明: 默認情況下,每個接口下最多可以配置15個IP地址。
錯誤提示信息六:Error: Please delete the sub address in the view first.
錯誤提示信息解釋:無法刪除主IP地址。
故障排除方法:請先刪除接口下所有的從IP地址,再刪除主IP地址。
錯誤提示信息七:Error: The address cannot be deleted because it is not the primary address of this .
錯誤提示信息解釋:無法刪除從IP地址,無法使用刪除主IP地址的命令刪除從IP地址。
故障排除方法:請執行刪除從IP地址的命令undo ip address ip-address { mask | mask-length } sub。
?
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
錯誤提示信息八:Error: The sub address does not exist.
錯誤提示信息解釋:刪除的從IP地址不存在。
故障排除方法:無需執行刪除操作。
錯誤提示信息九:Error: The address already exists.
錯誤提示信息解釋:接口下已經有相同的IP地址了,應該配置其他的IP地址。
故障排除方法:請使用其他的IP地址進行配置。
錯誤提示信息十:Error: The VLAN has a L3 . Please delete it first.
錯誤提示信息解釋:undo vlan的時候要先undo vlanif
故障排除方法:undo vlanif 10
*請認真填寫需求信息,我們會在24小時內與您取得聯系。