99热精品69堂国产-97超级碰在线精品视频-日韩欧美中文字幕在线视频-欧美日韩大尺码免费专区-最新国产三级在线不卡视频-在线观看成人免费视频-亚洲欧美国产精品完整版-色综久久天天综合绕视看-中文字幕免费在线看线人-久久国产精品99精品国产

歡迎來到優(yōu)發(fā)表網(wǎng)!

購物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

網(wǎng)絡(luò)故障范文

時間:2023-01-10 19:12:54

序論:在您撰寫網(wǎng)絡(luò)故障時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

網(wǎng)絡(luò)故障

第1篇

網(wǎng)絡(luò)故障;常見故障;分類診斷;物理類故障;邏輯類故障

在當(dāng)今這個計算機(jī)網(wǎng)絡(luò)技術(shù)日新月異,飛速發(fā)展的時代里,計算機(jī)網(wǎng)絡(luò)遍及世界各個角落,應(yīng)用在各行各業(yè),普及到千家萬戶,它給人們可謂帶來了諸多便利,但同時也帶來了很多的煩惱,筆者對常見的網(wǎng)絡(luò)故障進(jìn)行了分類和排查方法的介紹,相信對你有所幫助。根據(jù)常見的網(wǎng)絡(luò)故障歸類為摘要:物理類故障和邏輯類故障兩大類。

一、物理類故障

物理故障,一般是指線路或設(shè)備出現(xiàn)物理類新問題或說成硬件類新問題。

(一)線路故障

在日常網(wǎng)絡(luò)維護(hù)中,線路故障的發(fā)生率是相當(dāng)高的,約占發(fā)生故障的70%。線路故障通常包括線路損壞及線路受到嚴(yán)重電磁干擾。

排查方法摘要:假如是短距離的范圍內(nèi),判定網(wǎng)線好壞簡單的方法是將該網(wǎng)絡(luò)線一端插入一臺確定能夠正常連入局域網(wǎng)的主機(jī)的RJ45插座內(nèi),另一端插入確定正常的HUB端口,然后從主機(jī)的一端Ping線路另一端的主機(jī)或路由器,根據(jù)通斷來判定即可。假如線路稍長,或者網(wǎng)線不方便調(diào)動,就用網(wǎng)線測試器測量網(wǎng)線的好壞。假如線路很長,比如由郵電部門等供給商提供的,就需通知線路提供商檢查線路,看是否線路中間被切斷。

對于是否存在嚴(yán)重電磁干擾的排查,我們可以用屏蔽較強(qiáng)的屏蔽線在該段網(wǎng)路上進(jìn)行通信測試,假如通信正常,則表明存在電磁干擾,注重遠(yuǎn)離如高壓電線等電磁場較強(qiáng)的物件。假如同樣不正常,則應(yīng)排除線路故障而考慮其他原因。

(二)端口故障

端口故障通常包括插頭松動和端口本身的物理故障。

排查方法摘要:此類故障通常會影響到和其直接相連的其他設(shè)備的信號燈。因為信號燈比較直觀,所以可以通過信號燈的狀態(tài)大致判定出故障的發(fā)生范圍和可能原因。也可以嘗試使用其它端口看能否連接正常。

(三)集線器或路由器故障

集線器或路由器故障在此是指物理損壞,無法工作,導(dǎo)致網(wǎng)絡(luò)不通。

排查方法摘要:通常最簡易的方法是替換排除法,用通信正常的網(wǎng)線和主機(jī)來連接集線器(或路由器),如能正常通信,集線器或路由器正常;否則再轉(zhuǎn)換集線器端口排查是端口故障還是集線器(或路由器)的故障;很多時候,集線器(或路由器)的指示燈也能提示其是否有故障,正常情況下對應(yīng)端口的燈應(yīng)為綠燈。如若始終不能正常通信,則可認(rèn)定是集線器或路由器故障。

(四)主機(jī)物理故障

網(wǎng)卡故障,筆者把其也歸為主機(jī)物理故障,因為網(wǎng)卡多裝在主機(jī)內(nèi),靠主機(jī)完成配置和通信,即可以看作網(wǎng)絡(luò)終端。此類故障通常包括網(wǎng)卡松動,網(wǎng)卡物理故障,主機(jī)的網(wǎng)卡插槽故障和主機(jī)本身故障。

排查方法摘要:主機(jī)本身故障在這里就不在贅述了,在這里只介紹主機(jī)和網(wǎng)卡無法匹配工作的情況。對于網(wǎng)卡松動、主機(jī)的網(wǎng)卡插槽故障最好的解決辦法是更換網(wǎng)卡插槽。對于網(wǎng)卡物理故障的情況,如若上述更換插槽始終不能解決新問題的話,就拿到其他正常工作的主機(jī)上測試網(wǎng)卡,如若仍無法工作,可以認(rèn)定是網(wǎng)卡物理損壞,更換網(wǎng)卡即可。

二、邏輯類故障

邏輯故障中的最常見情況是配置錯誤,也就是指因為網(wǎng)絡(luò)設(shè)備的配置錯誤而導(dǎo)致的網(wǎng)絡(luò)異?;蚬收?。

(一)路由器邏輯故障

路由器邏輯故障通常包括路由器端口參數(shù)設(shè)定有誤,路由器路由配置錯誤、路由器CPU利用率過高和路由器內(nèi)存余量太小等。

排查方法摘要:路由器端口參數(shù)設(shè)定有誤,會導(dǎo)致找不到遠(yuǎn)端地址。用Ping命令或用Traceroute命令(路由跟蹤程序摘要:在UNIX系統(tǒng)中,我們稱之為Traceroute;MSWindows中為Tracert),查看在遠(yuǎn)端地址哪個節(jié)點出現(xiàn)新問題,對該節(jié)點參數(shù)進(jìn)行檢查和修復(fù)。

路由器路由配置錯誤,會使路由循環(huán)或找不到遠(yuǎn)端地址。比如,兩個路由器直接連接,這時應(yīng)該讓一臺路由器的出口連接到另一路由器的入口,而這臺路由器的入口連接另一路由器的出口才行,這時制作的網(wǎng)線就應(yīng)該滿足這一特性,否則也會導(dǎo)致網(wǎng)絡(luò)錯誤。該故障可以用Traceroute工具,可以發(fā)現(xiàn)在Traceroute的結(jié)果中某一段之后,兩個IP地址循環(huán)出現(xiàn)。這時,一般就是線路遠(yuǎn)端把端口路由又指向了線路的近端,導(dǎo)致IP包在該線路上往返反復(fù)傳遞。解決路由循環(huán)的方法就是重新配置路由器端口的靜態(tài)路由或動態(tài)路由,把路由設(shè)置為正確配置,就能恢復(fù)線路了。

路由器CPU利用率過高和路由器內(nèi)存余量太小,導(dǎo)致網(wǎng)絡(luò)服務(wù)的質(zhì)量變差。比如路由器內(nèi)存余量越小丟包率就會越高等。檢測這種故障,利用MIB變量瀏覽器較直觀,它收集路由器的路由表、端口流量數(shù)據(jù)、計費數(shù)據(jù)、路由器CPU的溫度、負(fù)載以及路由器的內(nèi)存余量等數(shù)據(jù),通常情況下網(wǎng)絡(luò)管理系統(tǒng)有專門的管理進(jìn)程,不斷地檢測路由器的關(guān)鍵數(shù)據(jù),并及時給出報警。解決這種故障,只有對路由器進(jìn)行升級、擴(kuò)大內(nèi)存等,或者重新規(guī)劃網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。

(二)一些重要進(jìn)程或端口關(guān)閉

一些有關(guān)網(wǎng)絡(luò)連接數(shù)據(jù)參數(shù)得重要進(jìn)程或端口受系統(tǒng)或病毒影響而導(dǎo)致意外關(guān)閉。比如,路由器的SNMP進(jìn)程意外關(guān)閉,這時網(wǎng)絡(luò)管理系統(tǒng)將不能從路由器中采集到任何數(shù)據(jù),因此網(wǎng)絡(luò)管理系統(tǒng)失去了對該路由器的控制。或者線路中斷,沒有流量。

排查方法摘要:用Ping線路近端的端口看是否能Ping通,Ping不通時檢查該端口是否處于down的狀態(tài),若是說明該端口已經(jīng)給關(guān)閉了,因而導(dǎo)致故障。這時只需重新啟動該端口,就可以恢復(fù)線路的連通。

(三)主機(jī)邏輯故障

主機(jī)邏輯故障所造成網(wǎng)絡(luò)故障率是較高的,通常包括網(wǎng)卡的驅(qū)動程序安裝不當(dāng)、網(wǎng)卡設(shè)備有沖突、主機(jī)的網(wǎng)絡(luò)地址參數(shù)設(shè)置不當(dāng)、主機(jī)網(wǎng)絡(luò)協(xié)議或服務(wù)安裝不當(dāng)和主機(jī)平安性故障等。

1.網(wǎng)卡的驅(qū)動程序安裝不當(dāng)。網(wǎng)卡的驅(qū)動程序安裝不當(dāng),包括網(wǎng)卡驅(qū)動未安裝或安裝了錯誤的驅(qū)動出現(xiàn)不兼容,都會導(dǎo)致網(wǎng)卡無法正常工作。

排查方法摘要:在設(shè)備管理器窗口中,檢查網(wǎng)卡選項,看是否驅(qū)動安裝正常,若網(wǎng)卡型號前標(biāo)示出現(xiàn)“!”或“X”,表明此時網(wǎng)卡無法正常工作。解決方法很簡單,只要找到正確的驅(qū)動程序重新安裝即可。

2.網(wǎng)卡設(shè)備有沖突。網(wǎng)卡設(shè)備和主機(jī)其它設(shè)備有沖突,會導(dǎo)致網(wǎng)卡無法工作。

排查方法摘要:磁盤大多附有測試和設(shè)置網(wǎng)卡參數(shù)的程序,分別查驗網(wǎng)卡設(shè)置的接頭類型、IRQ、I/O端口地址等參數(shù)。若有沖突,只要重新設(shè)置(有些必須調(diào)整跳線),或者更換網(wǎng)卡插槽,讓主機(jī)認(rèn)為是新設(shè)備重新分配系統(tǒng)資源參數(shù),一般都能使網(wǎng)絡(luò)恢復(fù)正常。

3.主機(jī)的網(wǎng)絡(luò)地址參數(shù)設(shè)置不當(dāng)。主機(jī)的網(wǎng)絡(luò)地址參數(shù)設(shè)置不當(dāng)是常見的主機(jī)邏輯故障。比如,主機(jī)配置的IP地址和其他主機(jī)沖突,或IP地址根本就不在于網(wǎng)范圍內(nèi),這將導(dǎo)致該主機(jī)不能連通。

排查方法摘要:查看網(wǎng)絡(luò)鄰居屬性中的連接屬性窗口,查看TCP/IP選項參數(shù)是否符合要求,包括IP地址、子網(wǎng)掩碼、網(wǎng)關(guān)和DNS參數(shù),進(jìn)行修復(fù)。

4.主機(jī)網(wǎng)絡(luò)協(xié)議或服務(wù)安裝不當(dāng)。主機(jī)網(wǎng)絡(luò)協(xié)議或服務(wù)安裝不當(dāng)也會出現(xiàn)網(wǎng)絡(luò)無法連通。主機(jī)安裝的協(xié)議必須和網(wǎng)絡(luò)上的其它主機(jī)相一致,否則就會出現(xiàn)協(xié)議不匹配,無法正常通信,還有一些服務(wù)如“文件和打印機(jī)共享服務(wù)”,不安裝會使自身無法共享資源給其他用戶,“網(wǎng)絡(luò)客戶端服務(wù)”,不安裝會使自身無法訪問網(wǎng)絡(luò)其他用戶提供的共享資源。再比如E-mail服務(wù)器設(shè)置不當(dāng)導(dǎo)致不能收發(fā)E-mail,或者域名服務(wù)器設(shè)置不當(dāng)將導(dǎo)致不能解析域名等。

排查方法摘要:在網(wǎng)上鄰居屬性(Windows98系統(tǒng))或在本地連接屬性窗口查看所安裝的協(xié)議是否和其他主機(jī)是相一致的,如TCP/IP協(xié)議,NetBEUI協(xié)議和IPX/SPX兼容協(xié)議等。其次查看主機(jī)所提供的服務(wù)的相應(yīng)服務(wù)程序是否已安裝,假如未安裝或未選中,請注重安裝和選中之。注重有時需要重新啟動電腦,服務(wù)方可正常工作。

5.主機(jī)平安性故障。主機(jī)故障的另一種可能是主機(jī)平安故障。通常包括主機(jī)資源被盜、主機(jī)被黑客控制、主機(jī)系統(tǒng)不穩(wěn)定等。

排查方法摘要:主機(jī)資源被盜,主機(jī)沒有控制其上的finger,RPC,rlogin等服務(wù)。攻擊者可以通過這些進(jìn)程的正常服務(wù)或漏洞攻擊該主機(jī),甚至得到管理員權(quán)限,進(jìn)而對磁盤所有內(nèi)容有任意復(fù)制和修改的權(quán)限。還需注重的是,不要輕易的共享本機(jī)硬盤,因為這將導(dǎo)致惡意攻擊者非法利用該主機(jī)的資源。

主機(jī)被黑客控制,會導(dǎo)致主機(jī)不受操縱者控制。通常是由于主機(jī)被安置了后門程序所致。發(fā)現(xiàn)此類故障一般比較困難,一般可以通過監(jiān)視主機(jī)的流量、掃描主機(jī)端口和服務(wù)、安裝防火墻和加補(bǔ)系統(tǒng)補(bǔ)丁來防止可能的漏洞。

主機(jī)系統(tǒng)不穩(wěn)定,往往也是由于黑客的惡意攻擊,或者主機(jī)感染病毒造成。通過殺毒軟件進(jìn)行查殺病毒,排除病毒的可能?;蛑匦掳惭b操作系統(tǒng),并安裝最新的操作系統(tǒng)的補(bǔ)丁程序和防火墻、防黑客軟件和服務(wù)來防止可能的漏洞的產(chǎn)生所造成的惡性攻擊。

三、結(jié)語

計算機(jī)網(wǎng)絡(luò)技術(shù)發(fā)展迅速,網(wǎng)絡(luò)故障也十分復(fù)雜,上述概括了常見的幾類故障及其排查方法。針對具體的診斷技術(shù),總體來說是遵循先軟后硬的原則,但是具體情況要具體分析,這些經(jīng)驗就需要您長期的積累了。假如你是網(wǎng)絡(luò)管理人員,在網(wǎng)絡(luò)維護(hù)中的還需要注重以下幾個方面摘要:

第一,建立完整的組網(wǎng)文檔,以供維護(hù)時查詢。如系統(tǒng)需求分析報告、網(wǎng)絡(luò)設(shè)計總體思路和方案、網(wǎng)路拓?fù)浣Y(jié)構(gòu)的規(guī)劃、網(wǎng)絡(luò)設(shè)備和網(wǎng)線的選擇、網(wǎng)絡(luò)的布線、網(wǎng)絡(luò)的IP分配,網(wǎng)絡(luò)設(shè)備分布等等。

第2篇

本文簡述了作者在維護(hù)網(wǎng)絡(luò)過程中,遇到的網(wǎng)絡(luò)故障及處理方法,希望對大家的網(wǎng)絡(luò)維護(hù)工作起到促進(jìn)作用。

計算機(jī)網(wǎng)絡(luò)的組成

計算機(jī)網(wǎng)絡(luò)就是利用通訊線路和通信設(shè)備,用一定的連接方法,將分布在不同地點的具有獨立功能的多臺計算機(jī)系統(tǒng)相互聯(lián)結(jié)起來,在網(wǎng)絡(luò)軟件的支持下進(jìn)行數(shù)據(jù)通信,實現(xiàn)資源共享的功能。除了計算機(jī)外,用于連接網(wǎng)絡(luò)的硬件設(shè)備有光纜、光收發(fā)器、雙絞線、路由器、交換機(jī)、網(wǎng)絡(luò)適配器(網(wǎng)卡)等。一般造成網(wǎng)絡(luò)不通的大部分原因都是這些設(shè)備出了故障。下面我們將對它們出現(xiàn)的故障進(jìn)行簡要的分析。

光纜和光纖

光纜的故障主要是光纜折斷,由于光纜內(nèi)部有用于抗拉伸力量的鋼絲,所以光纜自然折斷的可能性不大,但由于道路施工等多種原因,光纜被鏟車挖斷或汽車掛斷的事情還是時有發(fā)生。例如,去年四月,我臺的外網(wǎng)光纜被施工的汽車掛斷,幾周后,內(nèi)網(wǎng)光纜又被其他車輛掛斷。另外,由于傳輸光信號的光纖十分細(xì)微,在檢修ODF柜時要特別小心,防止折斷尾纖。工程中對光纖和光纜的彎曲度都有嚴(yán)格的要求,實用光纖最小彎曲半徑一般為20~50mm,光纜最小彎曲半徑為200~500mm,等于或大于光纖最小彎曲半徑,光輻射引起的附加損耗可以忽略,若小于最小彎曲半徑,附加損耗則急劇增加。

測量光纜、光纖跳線是否中斷的簡便設(shè)備是光功率計。如果察看到光收發(fā)器上的RX指示燈滅掉,或用光功率計測量接在光收發(fā)器上RX口上的光纖跳線沒有光功率,即可斷定光纜或尾纖折斷,通知網(wǎng)絡(luò)公司進(jìn)行搶修。

尾纖或者光纖跳線出現(xiàn)故障的另一個現(xiàn)象是由于長時間使用,它們的纖芯端面可能會比較臟,對光信號會產(chǎn)生折射或散射作用,造成網(wǎng)絡(luò)傳輸速度下降或丟包現(xiàn)象。處理該故障的方法是用醫(yī)酒精輕輕擦拭光纖纖芯的端面,稍等一下,待酒精蒸發(fā)完畢后恢復(fù)連接就可以了。

光收發(fā)器

光收發(fā)器的作用是將在光纜中傳輸?shù)墓庑盘栟D(zhuǎn)變?yōu)檫m于在電纜中傳輸?shù)碾娦盘?。我們在維護(hù)網(wǎng)絡(luò)工作中遇到的光收發(fā)器的故障主要是其電源故障和過熱故障。

電源故障主要是其內(nèi)部變壓器的線圈燒毀或者整流電容爆裂。線圈燒毀造成變壓器次級電路無法得到電源,而整流電容爆裂造成后面的電路得不到直流供電。如果我們發(fā)現(xiàn)正在使用的光收發(fā)器的電源指示燈熄滅了,則肯定是其電源部分出了故障。

光收發(fā)器的維護(hù)還要注意其工作溫度問題。光收發(fā)器多位于樓房的單元門口網(wǎng)絡(luò)設(shè)備箱內(nèi),通風(fēng)不暢,有的網(wǎng)絡(luò)設(shè)備箱甚至直接被太陽曝曬,造成光收發(fā)器工作過熱而死機(jī)。表現(xiàn)為用手觸摸光收發(fā)器有發(fā)燙的感覺,其TX、RX指示燈閃爍緩慢,在連接的計算機(jī)上上網(wǎng)時,無法正常瀏覽網(wǎng)頁,有嚴(yán)重的丟包現(xiàn)象。這樣,當(dāng)光收發(fā)器的溫度下降以后,該故障會自動解除。

網(wǎng)線

網(wǎng)線分為直連線和交叉線?,F(xiàn)在國際上通用制作網(wǎng)線的標(biāo)準(zhǔn)為T568A和T568B兩種。T568A的標(biāo)準(zhǔn)線序為:綠白、綠、橙白、藍(lán)、藍(lán)白、橙、棕白、棕,T568B的標(biāo)準(zhǔn)線序為:橙白、橙、綠白、藍(lán)、藍(lán)白、綠、棕白、棕,兩端的RJ-45頭中的線序一致的雙絞線稱為直通線;而一端為T568A,另一端為T568B的網(wǎng)線稱為交叉線。雖然雙絞線有4對8條芯線,但實際上在網(wǎng)絡(luò)中只用到了其中的4條,即水晶頭的第一、二、三和六腳,它們分別起著收、發(fā)信號的作用。網(wǎng)線的故障主要表現(xiàn)在以下兩個方面:第一,雖然很多網(wǎng)絡(luò)設(shè)備都有自適應(yīng)功能,但有些特殊設(shè)備對網(wǎng)線的連接有著特殊要求,例如要求連接兩個設(shè)備的網(wǎng)線為交叉線,而我們習(xí)慣上大多都做成了直通線。第二,水晶頭制作得不好。水晶頭在制作以前,網(wǎng)線需剝?nèi)ゼs1.5cm,不熟練的同志制作時,不是剝?nèi)サ锰L了就是太短了,致使壓下去的水晶頭卡不住網(wǎng)線或網(wǎng)線不能完全插到水晶頭底部與插針良好接觸。事實上,網(wǎng)絡(luò)硬件不通的大多原因在于網(wǎng)線的不通。遇到這樣的故障,處理的方法是:1、按照網(wǎng)絡(luò)設(shè)備的要求,規(guī)范制作網(wǎng)線。2、用網(wǎng)線測試儀測試一下網(wǎng)線,若發(fā)現(xiàn)不通,重新制作一下水晶頭就可以了。

交換機(jī)

交換機(jī)的作用是為連接在同一個網(wǎng)絡(luò)中的計算機(jī)提供信息交換的途徑。家庭用的一般都是沒有管理功能的交換機(jī),其中以桌面交換機(jī)居多。例如我臺職工平房宿舍和公寓樓,居住人數(shù)不多,使用的多是8換機(jī)。維護(hù)過程中,發(fā)現(xiàn)光纖和網(wǎng)線測試沒有問題,光收發(fā)器工作亦正常,但整排平房用戶依然不能上網(wǎng),后來發(fā)現(xiàn)把8換機(jī)的電源關(guān)閉一下,重新開啟,然后網(wǎng)絡(luò)恢復(fù)正常。分析原因,可能是該交換機(jī)內(nèi)部有少量的內(nèi)存,估計是否是交換機(jī)遇到網(wǎng)絡(luò)風(fēng)暴死機(jī)所致。此種故障在我臺不同的8換機(jī)發(fā)現(xiàn)了有多次,均用此方法處理,網(wǎng)絡(luò)故障均得以很快解決,其詳細(xì)原因待查。

光纖耦合器

光纖耦合器,俗稱法蘭盤,在網(wǎng)絡(luò)中的作用是定位上一級尾纖或光纖跳線的纖芯與下一級尾纖或光纖跳線的纖芯準(zhǔn)確對接,使傳輸?shù)墓庑盘柊凑赵O(shè)計的路徑繼續(xù)向下一級傳輸。我們在維護(hù)網(wǎng)絡(luò)的過程中,經(jīng)常遇到光纖耦合器的故障是耦合器中間的塑料套圈發(fā)生了變形。

我臺乙機(jī)房距離臺區(qū)大約有十公里,乙機(jī)房與臺區(qū)通過光纜進(jìn)行通信。在維護(hù)乙機(jī)房網(wǎng)絡(luò)的過程中,發(fā)現(xiàn)了一個奇怪的現(xiàn)象:乙機(jī)房的內(nèi)網(wǎng)計算機(jī)能夠正常瀏覽網(wǎng)頁,但是無論如何使用FTP服務(wù)傳送不了數(shù)據(jù)。沒有辦法,我們從中心交換機(jī)到光收發(fā)器、光收發(fā)器到ODF柜、ODF柜到乙機(jī)房光纜終端盒、乙機(jī)房光纜終端盒再到內(nèi)網(wǎng)計算機(jī),一級一級展開查找故障,最終發(fā)現(xiàn)是ODF柜上到乙機(jī)房的兩芯光纖中的一芯的光纖耦合器中間的塑料套圈發(fā)生了變形,影響了光信號的正常傳輸,更換光纖耦合器后故障解除。分析原因可能是塑料套圈變形導(dǎo)致了耦合器定位前后兩條光纖跳線纖芯對接不準(zhǔn),造成光纖傳輸數(shù)據(jù)率降低,從而出現(xiàn)了網(wǎng)絡(luò)不能實現(xiàn)FTP業(yè)務(wù)但能正常瀏覽網(wǎng)頁的怪異現(xiàn)象。

網(wǎng)卡

網(wǎng)卡簡稱網(wǎng)絡(luò)接口卡(Network Interface Card,NIC),是計算機(jī)局域網(wǎng)中重要的連接設(shè)備之一,計算機(jī)通過網(wǎng)卡接入網(wǎng)絡(luò)。在計算機(jī)網(wǎng)絡(luò)中,網(wǎng)卡一方面負(fù)責(zé)接收網(wǎng)絡(luò)上發(fā)送給本機(jī)的數(shù)據(jù)包,解包后,將數(shù)據(jù)傳輸給本地計算機(jī),另一方面將本地計算機(jī)上的數(shù)據(jù)打包后送出網(wǎng)絡(luò)。我們在網(wǎng)絡(luò)維護(hù)工作中遇到的網(wǎng)卡問題是網(wǎng)卡的自適應(yīng)功能。

我們在維護(hù)職工宿舍網(wǎng)絡(luò)時,發(fā)現(xiàn)有位同事的計算機(jī)不能上網(wǎng),而連接在同一交換機(jī)上的其他同事的計算機(jī)均能正常上網(wǎng),測量交換機(jī)至故障計算機(jī)的網(wǎng)線正常,因而懷疑連接該網(wǎng)線的交換機(jī)的端口有問題,隨后將該網(wǎng)線插在交換機(jī)的另一端口上,仍然不能上網(wǎng)。后來,修改網(wǎng)卡的屬性,將其“鏈路速率和全雙工模式”由“自適應(yīng)”修改為“10兆/全雙工模式”,故障計算機(jī)上網(wǎng)正常。分析可能是一般的計算機(jī)的網(wǎng)卡均支持自適應(yīng)功能,而該計算機(jī)的網(wǎng)卡不支持自適應(yīng)功能,而我臺的外網(wǎng)開口帶寬速率恰是10Msps。

第3篇

(1)故障管理概述

故障是指軟、硬件的缺陷;錯誤則是軟硬件的不正確輸出;失效是指所有和某故障有關(guān)的錯誤造成的網(wǎng)絡(luò)的非正常運行。網(wǎng)絡(luò)故障按生命周期可分為永久故障、暫時故障和瞬間故障三類;按故障對網(wǎng)絡(luò)造成的空間失效范圍的大小,可將失效分為四類:任務(wù)失效、基本網(wǎng)絡(luò)部件失效、結(jié)點失效和子網(wǎng)失效。故障管理的主要任務(wù)是及時發(fā)現(xiàn)并排除網(wǎng)絡(luò)故障。一般說來,故障管理包括以下幾個內(nèi)容:故障監(jiān)測和捕獲故障產(chǎn)生相關(guān)的事件和報警;定位分析故障、記錄故障日志;如有可能排除故障等。

(2)故障管理的類型

故障類型指的是具有某種特征的故障的分類。通常我們可以根據(jù)故障發(fā)生來源的不同,將它們劃分為兩大類,即硬故障(harderrors)和軟故障(softerrors)。

硬故障是指網(wǎng)絡(luò)的硬件設(shè)備在工作過程中產(chǎn)生的各種錯誤。這些錯誤與該設(shè)備的作用有密切關(guān)系,網(wǎng)絡(luò)系統(tǒng)的復(fù)雜性也正是由于設(shè)備的多樣性而體現(xiàn)出來的。根據(jù)這網(wǎng)絡(luò)設(shè)備的作用,我們也可以將故障簡單分為以下三類:

①連接設(shè)備故障

這種故障的現(xiàn)象主要是網(wǎng)絡(luò)的物理連接出現(xiàn)問題,也可以稱為通路故障。造成故障的原因可能是電纜線斷開、收發(fā)器斷開或不能正常工作以及其它連接設(shè)備間的接口出問題等等。根據(jù)這類故障的來源不同,我們又可以將該類型的故障細(xì)分為線路故障、網(wǎng)絡(luò)接口故障、收發(fā)器故障、路由器故障等等,該類故障是故障管理的最主要對象。

②共享設(shè)備故障

這種故障的表現(xiàn)是用于資源共享的設(shè)備出現(xiàn)問題,不能提供或享受所需的服務(wù)。同樣,該類型的故障也可以細(xì)分為服務(wù)器故障(打印機(jī)故障、文件服務(wù)器故障等)、工作站故障等等。

③其它設(shè)備故障。包括電源故障、監(jiān)控器故障、測試儀故障、分析儀故障等等。

軟故障是指網(wǎng)絡(luò)系統(tǒng)軟件運行出錯。軟故障的發(fā)現(xiàn)和處理是在管理過程中逐漸被人們所認(rèn)識的,因為軟件屬于一種無形的東西,問題的表現(xiàn)不如硬件那么直觀。從這個意義上看,軟故障的識別和診斷更加困難。故障管理中所處理的軟故障主要針對與網(wǎng)絡(luò)通訊和服務(wù)有關(guān)的系統(tǒng)軟件,它可以直接根據(jù)網(wǎng)絡(luò)軟件來劃分,包括通訊協(xié)議軟件故障、網(wǎng)絡(luò)文件系統(tǒng)(FNS)故障、文件傳輸軟件故障、域名服務(wù)系統(tǒng)(DNS)等等,其中通訊協(xié)議軟件故障是系統(tǒng)研究的重點。這種錯誤通常是在協(xié)議軟件運行時遇到某個異常條件(如緩沖隊列滿)或協(xié)議軟件本身未提供可靠機(jī)制而導(dǎo)致傳輸失敗,報文丟失。

故障類型并不是一成不變的,隨著網(wǎng)絡(luò)在復(fù)雜性和規(guī)模上提高,網(wǎng)絡(luò)故障管理的要求也在不斷增加。新的技術(shù)、設(shè)備的應(yīng)用使故障的類型、故障原因、故障源等各方面都發(fā)生了變化,這就要求故障管理系統(tǒng)必須增加新的內(nèi)容。

(3)故障管理的功能

故障管理的根本目標(biāo)在于排除網(wǎng)絡(luò)中出現(xiàn)的各種故障,達(dá)到這一目標(biāo)要求系統(tǒng)至少必須具備檢測、隔離和糾正故障的能力。

故障檢測(detection)是指對系統(tǒng)的性能和狀態(tài)進(jìn)行檢查和測試,根據(jù)結(jié)果和一定的識別規(guī)則判斷系統(tǒng)是否故障。故障檢測要求管理系統(tǒng)監(jiān)視網(wǎng)絡(luò)的工作,考查網(wǎng)絡(luò)的狀態(tài)及其變化,一旦發(fā)現(xiàn)系統(tǒng)出現(xiàn)故障馬上進(jìn)行報警。

故障隔離(isolation)是指確定故障發(fā)生的位置,通俗地說就是指出誰發(fā)生了故障,如哪個子網(wǎng)、哪個設(shè)備或者設(shè)備的哪個部件,對于軟故障則指明哪個系統(tǒng)出了問題。由于網(wǎng)絡(luò)是一個復(fù)雜的系統(tǒng),故障類型、原因、故障源多種多樣,而且不同故障的表現(xiàn)可能完全相同,這就導(dǎo)致了故障隔離的復(fù)雜性。隔離系統(tǒng)應(yīng)當(dāng)盡可能地縮小故障源的范圍。

故障糾正(correction)是指糾正所發(fā)生的錯誤,恢復(fù)系統(tǒng)的正常工作。故障糾正建立在前兩者的基礎(chǔ)之上,目前所采取的手段除了進(jìn)行硬件維修、系統(tǒng)重啟、一定程度的恢復(fù)外,還包括一些非技術(shù)性的活動,如人員的使用和技術(shù)培訓(xùn)以及設(shè)備生產(chǎn)廠商的支持等。

(4)影響故障管理的因素

與網(wǎng)絡(luò)管理一樣,故障管理也必須考慮三方面的因素:過程、設(shè)備和工具、人員。成功的故障管理策略是這三者的完整結(jié)合,而不僅僅是其中的某一個方面。

過程主要指為實現(xiàn)故障管理功能而進(jìn)行的操作,下一節(jié)介紹的內(nèi)容就屬于故障管理的過程。了解管理的一般過程是開發(fā)一個實用的故障管理系統(tǒng)的基礎(chǔ)。

設(shè)備和工具指的是進(jìn)行故障管理的軟硬件工具,包括故障檢測設(shè)備、維修設(shè)備、實用的故障管理系統(tǒng)等。設(shè)備和工具在故障管理中起著非常重要的作用,它可以幫助管理員和工程師實施管理功能,排除故障,保障網(wǎng)絡(luò)系統(tǒng)正常運轉(zhuǎn)。

下面介紹的就是幾種專用的物理設(shè)備:

①時間域反射測量儀(TDR)。通過顯示物理介質(zhì)傳輸信號的波形表明設(shè)備或鏈路是否故障。

②網(wǎng)絡(luò)監(jiān)視器。監(jiān)視網(wǎng)絡(luò)上各結(jié)點的狀態(tài),得到網(wǎng)絡(luò)的各種統(tǒng)計數(shù)字,以確定是否故障。

③網(wǎng)絡(luò)分析儀。實時分析結(jié)點的收發(fā)報文,幫助管理者跟蹤和隔離故障。管理人員在故障管理中的任務(wù)主要是維護(hù)管理系統(tǒng)和工具的運行,并在它們的幫助下完成故障排除和系統(tǒng)恢復(fù)工作。

2.智能化網(wǎng)絡(luò)管理的概述

為了能夠更有效地對各種大型復(fù)雜的網(wǎng)絡(luò)進(jìn)行管理,許多研究人員將人工智能技術(shù)應(yīng)用到網(wǎng)絡(luò)管理領(lǐng)域。雖然全面的智能化的網(wǎng)絡(luò)管理距離實際應(yīng)用還有相當(dāng)長的一段路要走,但是在網(wǎng)絡(luò)管理的特定領(lǐng)域?qū)嵤┲悄芑?,尤其是基于專家系統(tǒng)技術(shù)的網(wǎng)絡(luò)管理是可行的。

用于故障管理的專家系統(tǒng)由知識庫、推理機(jī)、知識獲取模塊和解釋接口四大主要部分組成。專家系統(tǒng)以其實時性、協(xié)作管理、層次性等特點,特別適合用在網(wǎng)絡(luò)的故障管理領(lǐng)域。但同時專家系統(tǒng)也面臨一些難題:

(1)動態(tài)的網(wǎng)絡(luò)變化可能需要經(jīng)常更新知識庫。

(2)由于網(wǎng)絡(luò)故障可能會相關(guān)到其它許多事件,很難確定與某一癥狀相關(guān)的時間的開始和結(jié)束,解釋和綜合消息復(fù)雜。

(3)可能需要大量的指令用以標(biāo)識實際的網(wǎng)絡(luò)狀態(tài),并且專家系統(tǒng)需要和它們接口。

(4)專家系統(tǒng)的知識獲取一直以來是瓶頸所在,要想成功地獲取網(wǎng)絡(luò)故障知識,需要經(jīng)驗豐富的網(wǎng)絡(luò)專家。

在實現(xiàn)智能化網(wǎng)絡(luò)管理系統(tǒng)時,還必須把握系統(tǒng)復(fù)雜性與系統(tǒng)性能的關(guān)系。不僅要利用將較為成熟的人工智能技術(shù),而且要考慮實現(xiàn)上的復(fù)雜度和引入人工智能技術(shù)對系統(tǒng)性能和穩(wěn)定性的影響。

3.事件知識庫的研究

在專家系統(tǒng)中,知識的表示有邏輯表示法、語義網(wǎng)絡(luò)表示法、規(guī)則表示法、特性表示法、框架表示法和過程表示法。產(chǎn)生式表示法,即規(guī)則表示法,是最常見的一種表示法。其特點是模塊性、一致性和自然。知識庫是知識的集合,嚴(yán)格意義上的知識庫包括概念、事實和規(guī)則只部分,缺一不可。

為了提高故障管理的智能水平,可以建立事件知識庫(EKB,EventKnowledgeBase,用于存儲所有己知事件的類型、產(chǎn)生事件的原因和所造成的影響,以及應(yīng)該采取什么樣的措施等一些細(xì)節(jié)的靜態(tài)描述。這個EKB并不是真正意義上的知識庫,它的數(shù)據(jù)僅僅包含了屬性值與元組,而屬性值表示概念,元組表示事實。但研究EKB可以為今后建立完善的知識庫奠定基礎(chǔ)。

在EKB中存儲了己經(jīng)確定事件。最初,被確定的事件僅限于一些標(biāo)準(zhǔn)事件和措施。隨著網(wǎng)絡(luò)的運行和系統(tǒng)的反饋,EKB的內(nèi)容將不斷增加。

理想狀態(tài)是能夠確定所有的事件。

下面是EKB涉及到的只種基本的數(shù)據(jù)庫表:

(1)事件類型表:該表中主要存儲了事件的靜態(tài)定義。

EKB中保存了己確定的事件可能涉及的相關(guān)知識,如事件類別(如:性能、系統(tǒng)、網(wǎng)絡(luò)、應(yīng)用事件或其它)、嚴(yán)重程度(如:嚴(yán)重、主要、次要、警告等)、產(chǎn)生事件的設(shè)備標(biāo)識、指明設(shè)備的類型、事件造成什么影響(如:影響網(wǎng)速、單個用戶不能訪問等)、故障排除參考策略、上次更新的時期/時間、關(guān)于這個事件的備注信息、事件的詳細(xì)描述等。

(2)實時事件表:描述了正在運行的網(wǎng)絡(luò)中的實時事件。

實時事件表中提供可能用的一些字段,用于記錄網(wǎng)絡(luò)運行中發(fā)生的事件,如:設(shè)備的ID(從IP地址或查詢設(shè)備表可以獲得)、實時事件的狀態(tài)(如:新增、確認(rèn)、清除等)、根據(jù)故障票ID獲得的相應(yīng)的故障票信息等。

(3)設(shè)備信息表:存儲了網(wǎng)絡(luò)中設(shè)備的實際參數(shù)。

設(shè)備信息表主要記錄了每個設(shè)備的相關(guān)參數(shù)。例如,設(shè)備ID號、IP地址、設(shè)備名稱、廠商、類型、重要性級別等。

EKB中存儲的相關(guān)事件的知識主要來源于專家。開發(fā)人員將獲得的知識應(yīng)用到與故障管理相關(guān)的系統(tǒng)中,根據(jù)不同系統(tǒng)的需要分配相應(yīng)的知識,以提高系統(tǒng)性能。雖然EKB并不是嚴(yán)格意義上的知識庫,但在開發(fā)過程中,可以通過不斷地增加和修正EKB的內(nèi)容,在一定程度上提高系統(tǒng)的智能水平。

4.結(jié)論

文中分析了網(wǎng)絡(luò)故障的類型,提出將事件知識庫用于計算機(jī)網(wǎng)絡(luò)故障的智能管理。實驗表明,計算機(jī)網(wǎng)絡(luò)故障的智能管理提供了基于知識的決策手段,比傳統(tǒng)的管理方式具有更高的決策水平,為專家系統(tǒng)技術(shù)在故障的檢測和隔離方面更加廣泛的應(yīng)用,奠定了一定基礎(chǔ)。

第4篇

關(guān)鍵詞:網(wǎng)絡(luò)互聯(lián)網(wǎng)路由器故障診斷

一.引言

世紀(jì)之交,全球因特網(wǎng)高速發(fā)展。抓住機(jī)遇,迎接挑戰(zhàn),我國的網(wǎng)絡(luò)建設(shè)方興未艾。政府上網(wǎng)工程拉開序幕,網(wǎng)絡(luò)建設(shè)的新已經(jīng)到來。網(wǎng)絡(luò)診斷是管好、用好網(wǎng)絡(luò),使網(wǎng)絡(luò)發(fā)揮最大作用的重要技術(shù)工作之一。本文首先簡單介紹網(wǎng)絡(luò)及路由器的基本概念,簡述分層診斷技術(shù),結(jié)合討論路由器各種接口的診斷,綜述互聯(lián)網(wǎng)絡(luò)連通性故障的排除。

二.網(wǎng)絡(luò)與路由器概述

網(wǎng)絡(luò)診斷是一門綜合性技術(shù),涉及網(wǎng)絡(luò)技術(shù)的方方面面。為方便下面的討論,首先簡單回顧一下網(wǎng)絡(luò)和路由器的基本概念。

1.計算機(jī)網(wǎng)絡(luò)是由計算機(jī)集合加通信設(shè)施組成的系統(tǒng),即利用各種通信手段,把地理上分散的計算機(jī)連在一起,達(dá)到相互通信而且共享軟件、硬件和數(shù)據(jù)等資源的系統(tǒng)。計算機(jī)網(wǎng)絡(luò)按其計算機(jī)分布范圍通常被分為局域網(wǎng)和廣域網(wǎng)。局域網(wǎng)覆蓋地理范圍較小,一般在數(shù)米到數(shù)十公里之間。廣域網(wǎng)覆蓋地理范圍較大,如校園、城市之間、乃至全球。計算機(jī)網(wǎng)絡(luò)的發(fā)展,導(dǎo)致網(wǎng)絡(luò)之間各種形式的連接。采用統(tǒng)一協(xié)議實現(xiàn)不同網(wǎng)絡(luò)的互連,使互聯(lián)網(wǎng)絡(luò)很容易得到擴(kuò)展。因特網(wǎng)就是用這種方式完成網(wǎng)絡(luò)之間聯(lián)結(jié)的網(wǎng)絡(luò)。因特網(wǎng)采用TCP/IP協(xié)議作為通信協(xié)議,將世界范圍內(nèi)計算機(jī)網(wǎng)絡(luò)連接在一起,成為當(dāng)今世界最大的和最流行的國際性網(wǎng)絡(luò)。

2.為了完成計算機(jī)間的通信,把每部計算機(jī)互連的功能劃分成定義明確的層次,規(guī)定了同層進(jìn)程通信的協(xié)議及相鄰層之間的接口和服務(wù),將這些層、同層進(jìn)程通信的協(xié)議及相鄰層之間的接口統(tǒng)稱為網(wǎng)絡(luò)體系結(jié)構(gòu)。國際標(biāo)準(zhǔn)化組織(ISO)提出的開放系統(tǒng)互連參考模型(OSI)是當(dāng)代計算機(jī)網(wǎng)絡(luò)技術(shù)體系的核心。該模型將網(wǎng)絡(luò)功能劃分為7個層次:物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層、會話層、表示層和應(yīng)用層。

3.TCP/IP即傳輸控制協(xié)議和網(wǎng)間互聯(lián)協(xié)議是一組網(wǎng)絡(luò)協(xié)議。TCP/IP起源于美國ARPANET網(wǎng),發(fā)展至今已成為因特網(wǎng)使用的標(biāo)準(zhǔn)通信協(xié)議。使用TCP/IP能夠使采用不同操作系統(tǒng)的計算機(jī)以有序的方式交換數(shù)據(jù)。

4.路由器是一種網(wǎng)絡(luò)設(shè)備,是用于網(wǎng)絡(luò)連接、執(zhí)行路由選擇任務(wù)的專用計算機(jī)。路由器工作于網(wǎng)絡(luò)層,對信包轉(zhuǎn)發(fā),并具有過濾功能。路由器能夠?qū)⑹褂貌煌夹g(shù)的兩個網(wǎng)絡(luò)互連起來,能夠在多種類型的網(wǎng)絡(luò)之間(局域網(wǎng)或廣域網(wǎng))建立網(wǎng)絡(luò)連接。它將處在七層模型中的網(wǎng)絡(luò)層的信息,根據(jù)最快、最直接的路由原理從一個網(wǎng)絡(luò)的網(wǎng)絡(luò)層傳輸?shù)搅硪粋€網(wǎng)絡(luò)的網(wǎng)絡(luò)層,以達(dá)到最佳路由選擇。同時在內(nèi)部使用高檔微處理器,用高速的內(nèi)部總線連接適合各種網(wǎng)絡(luò)協(xié)議的接口卡。并具有多種網(wǎng)管功能,能監(jiān)視與路由器相連接的一些網(wǎng)絡(luò)設(shè)備和它們的配置運行情況。

5.CISCO路由器是目前網(wǎng)絡(luò)建設(shè)中使用最多的一種路由器,有多種檔次、多種系列,目前常用的當(dāng)屬2500系列,本文以2500系列為例討論。2500系列路由器是固定接口的多協(xié)議路由器,支持CISCOIOS全部功能。根據(jù)特定的協(xié)議環(huán)境分為以下四種類型:固定配置的路由器(2501)、帶HUB口的路由器(2507)、摸塊化的路由器(2514)和訪問服務(wù)器(2511)。它們結(jié)構(gòu)簡單、操作方便、易于配置和管理,是一種用于小規(guī)模局域網(wǎng)和廣域網(wǎng)網(wǎng)絡(luò)層中繼的路由設(shè)備。

6.CISCOIOS是CISCO所特有的互連網(wǎng)操作系統(tǒng),所有的CISCO產(chǎn)品都運行IOS,IOS將它們無縫連接在一起協(xié)同工作。給用戶提供一個可支持任意硬件界面、任意鏈路層、網(wǎng)絡(luò)層協(xié)議的可擴(kuò)展的開放型網(wǎng)絡(luò)。IOS支持眾多的協(xié)議,包括各種網(wǎng)絡(luò)通信協(xié)議和路由協(xié)議等。CISCOIOS已成為工業(yè)界網(wǎng)際網(wǎng)互聯(lián)的事實標(biāo)準(zhǔn)。CISCOIOS提供幾種不同的操作模式,每一種模式提供一組相關(guān)的命令集、不同的操作權(quán)限和操作功能。基于安全目的,CISCO用戶界面中有兩級訪問權(quán)限:用戶級和特權(quán)級。第一級訪問允許查看路由狀態(tài),叫做用戶EXEC模式,又稱為查看模式;第二級訪問允許查看路由器配置、修改配置和運行調(diào)試命令,叫做特權(quán)EXEC模式,又稱為配置模式。在特權(quán)級中,按不同的配置內(nèi)容,可進(jìn)入不同的配置模式,如全球配置模式、接口配置模式、線配置模式等。

三.網(wǎng)絡(luò)故障診斷概述

網(wǎng)絡(luò)故障診斷應(yīng)該實現(xiàn)三方面的目的:確定網(wǎng)絡(luò)的故障點,恢復(fù)網(wǎng)絡(luò)的正常運行;發(fā)現(xiàn)網(wǎng)絡(luò)規(guī)劃和配置中欠佳之處,改善和優(yōu)化網(wǎng)絡(luò)的性能;觀察網(wǎng)絡(luò)的運行狀況,及時預(yù)測網(wǎng)絡(luò)通信質(zhì)量。

網(wǎng)絡(luò)故障診斷以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運行的知識為基礎(chǔ)。從故障現(xiàn)象出發(fā),以網(wǎng)絡(luò)診斷工具為手段獲取診斷信息,確定網(wǎng)絡(luò)故障點,查找問題的根源,排除故障,恢復(fù)網(wǎng)絡(luò)正常運行。

網(wǎng)絡(luò)故障通常有以下幾種可能:物理層中物理設(shè)備相互連接失敗或者硬件及線路本身的問題;數(shù)據(jù)鏈路層的網(wǎng)絡(luò)設(shè)備的接口配置問題;網(wǎng)絡(luò)層網(wǎng)絡(luò)協(xié)議配置或操作錯誤;傳輸層的設(shè)備性能或通信擁塞問題;上三層CISCOIOS或網(wǎng)絡(luò)應(yīng)用程序錯誤。診斷網(wǎng)絡(luò)故障的過程應(yīng)該沿著OSI七層模型從物理層開始向上進(jìn)行。首先檢查物理層,然后檢查數(shù)據(jù)鏈路層,以此類推,設(shè)法確定通信失敗的故障點,直到系統(tǒng)通信正常為止。

網(wǎng)絡(luò)診斷可以使用包括局域網(wǎng)或廣域網(wǎng)分析儀在內(nèi)的多種工具:路由器診斷命令;網(wǎng)絡(luò)管理工具和其它故障診斷工具。CISCO提供的工具足以勝任排除絕大多數(shù)網(wǎng)絡(luò)故障。查看路由表,是解決網(wǎng)絡(luò)故障開始的好地方。ICMP的ping、trace命令和Cisco的show命令、debug命令是獲取故障診斷有用信息的網(wǎng)絡(luò)工具。我們通常使用一個或多個命令收集相應(yīng)的信息,在給定情況下,確定使用什么命令獲取所需要的信息。譬如,通過IP協(xié)議來測定設(shè)備是否可達(dá)到的常用方法是使用ping命令。ping從源點向目標(biāo)發(fā)出ICMP信息包,如果成功的話,返回的ping信息包就證實從源點到目標(biāo)之間所有物理層、數(shù)據(jù)鏈路層和網(wǎng)羅層的功能都運行正常。如何在互聯(lián)網(wǎng)絡(luò)運行后了解它的信息,了解網(wǎng)絡(luò)是否正常運行,監(jiān)視和了解網(wǎng)絡(luò)在正常條件下運行細(xì)節(jié),了解出現(xiàn)故障的情況。監(jiān)視那些內(nèi)容呢?利用showinterface命令可以非常容易地獲得待檢查的每個接口的信息。另外showbuffer命令提供定期顯示緩沖區(qū)大小、用途及使用狀況等。Showproc命令和showprocmem命令可用于跟蹤處理器和內(nèi)存的使用情況,可以定期收集這些數(shù)據(jù),在故障出現(xiàn)時,用于診斷參考。

網(wǎng)絡(luò)故障以某種癥狀表現(xiàn)出來,故障癥狀包括一般性的(象用戶不能接入某個服務(wù)器)和較特殊的(如路由器不在路由表中)。對每一個癥狀使用特定的故障診斷工具和方法都能查找出一個或多個故障原因。一般故障排除模式如下:第一步,當(dāng)分析網(wǎng)絡(luò)故障時,首先要清楚故障現(xiàn)象。應(yīng)該詳細(xì)說明故障的癥侯和潛在的原因。為此,要確定故障的具體現(xiàn)象,然后確定造成這種故障現(xiàn)象的原因的類型。例如,主機(jī)不響應(yīng)客戶請求服務(wù)??赡艿墓收显蚴侵鳈C(jī)配置問題、接口卡故障或路由器配置命令丟失等。第二步,收集需要的用于幫助隔離可能故障原因的信息。向用戶、網(wǎng)絡(luò)管理員、管理者和其他關(guān)鍵人物提一些和故障有關(guān)的問題。廣泛的從網(wǎng)絡(luò)管理系統(tǒng)、協(xié)議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。第三步,根據(jù)收集到的情況考慮可能的故障原因??梢愿鶕?jù)有關(guān)情況排除某些故障原因。例如,根據(jù)某些資料可以排除硬件故障,把注意力放軟件原因上。對于任何機(jī)會都應(yīng)該設(shè)法減少可能的故障原因,以至于盡快的策劃出有效的故障診斷計劃。第四步,根據(jù)最后的可能的故障原因,建立一個診斷計劃。開始僅用一個最可能的故障原因進(jìn)行診斷活動,這樣可以容易恢復(fù)到故障的原始狀態(tài)。如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態(tài)就困難的多了。第五步,執(zhí)行診斷計劃,認(rèn)真做好每一步測試和觀察,直到故障癥狀消失。第六步,每改變一個參數(shù)都要確認(rèn)其結(jié)果。分析結(jié)果確定問題是否解決,如果沒有解決,繼續(xù)下去,直到解決。

四.網(wǎng)絡(luò)故障分層診斷技術(shù)

1.物理層及其診斷

物理層是OSI分層結(jié)構(gòu)體系中最基礎(chǔ)的一層,它建立在通信媒體的基礎(chǔ)上,實現(xiàn)系統(tǒng)和通信媒體的物理接口,為數(shù)據(jù)鏈路實體之間進(jìn)行透明傳輸,為建立、保持和拆除計算機(jī)和網(wǎng)絡(luò)之間的物理連接提供服務(wù)。

物理層的故障主要表現(xiàn)在設(shè)備的物理連接方式是否恰當(dāng);連接電纜是否正確;MODEM、CSU/DSU等設(shè)備的配置及操作是否正確。

確定路由器端口物理連接是否完好的最佳方法是使用showinterface命令,檢查每個端口的狀態(tài),解釋屏幕輸出信息,查看端口狀態(tài)、協(xié)議建立狀態(tài)和EIA狀態(tài)。

2.?dāng)?shù)據(jù)鏈路層及其診斷

數(shù)據(jù)鏈路層的主要任務(wù)是使網(wǎng)絡(luò)層無須了解物理層的特征而獲得可靠的傳輸。數(shù)據(jù)鏈路層為通過鏈路層的數(shù)據(jù)進(jìn)行打包和解包、差錯檢測和一定的校正能力,并協(xié)調(diào)共享介質(zhì)。在數(shù)據(jù)鏈路層交換數(shù)據(jù)之前,協(xié)議關(guān)注的是形成幀和同步設(shè)備。

查找和排除數(shù)據(jù)鏈路層的故障,需要查看路由器的配置,檢查連接端口的共享同一數(shù)據(jù)鏈路層的封裝情況。每對接口要和與其通信的其他設(shè)備有相同的封裝。通過查看路由器的配置檢查其封裝,或者使用show命令查看相應(yīng)接口的封裝情況。

3.網(wǎng)絡(luò)層及其診斷

網(wǎng)絡(luò)層提供建立、保持和釋放網(wǎng)絡(luò)層連接的手段,包括路由選擇、流量控制、傳輸確認(rèn)、中斷、差錯及故障恢復(fù)等。

排除網(wǎng)絡(luò)層故障的基本方法是:沿著從源到目標(biāo)的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現(xiàn),應(yīng)該通過檢查來確定是否已經(jīng)輸入適當(dāng)?shù)撵o態(tài)路由、默認(rèn)路由或者動態(tài)路由。然后手工配置一些丟失的路由,或者排除一些動態(tài)路由選擇過程的故障,包括RIP或者IGRP路由協(xié)議出現(xiàn)的故障。例如,對于IGRP路由選擇信息只在同一自治系統(tǒng)號(AS)的系統(tǒng)之間交換數(shù)據(jù),查看路由器配置的自治系統(tǒng)號的匹配情況。

五.路由器接口故障排除

1.串口故障排除

串口出現(xiàn)連通性問題時,為了排除串口故障,一般是從showinterfaceserial命令開始,分析它的屏幕輸出報告內(nèi)容,找出問題之所在。串口報告的開始提供了該接口狀態(tài)和線路協(xié)議狀態(tài)。接口和線路協(xié)議的可能組合有以下幾種:1)串口運行、線路協(xié)議運行,這是完全的工作條件。該串口和線路協(xié)議已經(jīng)初始化,并正在交換協(xié)議的存活信息。2)串口運行、線路協(xié)議關(guān)閉,這個顯示說明路由器與提供載波檢測信號的設(shè)備連接,表明載波信號出現(xiàn)在本地和遠(yuǎn)程的調(diào)制解調(diào)器之間,但沒有正確交換連接兩端的協(xié)議存活信息??赡艿墓收习l(fā)生在路由器配置問題、調(diào)制解調(diào)器操作問題、租用線路干擾或遠(yuǎn)程路由器故障,數(shù)字式調(diào)制解調(diào)器的時鐘問題,通過鏈路連接的兩個串口不在同一子網(wǎng)上,都會出現(xiàn)這個報告。3)串口和線路協(xié)議都關(guān)閉,可能是電信部門的線路故障、電纜故障或者是調(diào)制解調(diào)器故障。4)串口管理性關(guān)閉和線路協(xié)議關(guān)閉,這種情況是在接口配置中輸入了shutdown命令。通過輸入noshutdown命令,打開管理性關(guān)閉。

接口和線路協(xié)議都運行的狀況下,雖然串口鏈路的基本通信建立起來了,但仍然可能由于信息包丟失和信息包錯誤時會出現(xiàn)許多潛在的故障問題。正常通信時接口輸入或輸出信息包不應(yīng)該丟失,或者丟失的量非常小,而且不會增加。如果信息包丟失有規(guī)律性增加,表明通過該接口傳輸?shù)耐ㄐ帕砍^接口所能處理的通信量。解決的辦法是增加線路容量。查找其他原因發(fā)生的信息包丟失,查看showinterfaceserial命令的輸出報告中的輸入輸出保持隊列的狀態(tài)。當(dāng)發(fā)現(xiàn)保持隊列中信息包數(shù)量達(dá)到了信息的最大允許值,可以增加保持隊列設(shè)置的大小。

2.以太接口故障排除

以太接口的典型故障問題是:帶寬的過分利用;碰撞沖突次數(shù)頻繁;使用不兼容的幀類型。使用showinterfaceethernet命令可以查看該接口的吞吐量、碰橦沖突、信息包丟失、和幀類型的有關(guān)內(nèi)容等。

1)通過查看接口的吞吐量可以檢測網(wǎng)絡(luò)的利用。如果網(wǎng)絡(luò)廣播信息包的百分比很高,網(wǎng)絡(luò)性能開始下降。光纖網(wǎng)轉(zhuǎn)換到以太網(wǎng)段的信息包可能會淹沒以太口?;ヂ?lián)網(wǎng)發(fā)生這種情況可以采用優(yōu)化接口的措施,即在以太接口使用noiproute-cache命令,禁用快速轉(zhuǎn)換,并且調(diào)整緩沖區(qū)和保持隊列。

2)兩個接口試圖同時傳輸信息包到以太電纜上時,將發(fā)生碰橦。以太網(wǎng)要求沖突次數(shù)很少,不同的網(wǎng)絡(luò)要求是不同的,一般情況發(fā)現(xiàn)沖突每秒有3、5次就應(yīng)該查找沖突的原因了。碰橦沖突產(chǎn)生擁塞,碰橦沖突的原因通常是由于敷設(shè)的電纜過長、過分利用、或者“聾”節(jié)點。以太網(wǎng)絡(luò)在物理設(shè)計和敷設(shè)電纜系統(tǒng)管理方面應(yīng)有所考慮,超規(guī)范敷設(shè)電纜可能引起更多的沖突發(fā)生。

3)如果接口和線路協(xié)議報告運行狀態(tài),并且節(jié)點的物理連接都完好,可是不能通信。引起問題的原因也可能是兩個節(jié)點使用了不兼容的幀類型。解決問題的辦法是重新配置使用相同幀類型。如果要求使用不同幀類型的同一網(wǎng)絡(luò)的兩個設(shè)備互相通信,可以在路由器接口使用子接口,并為每個子接口指定不同的封裝類型。

3.異步通信口故障排除

互連網(wǎng)絡(luò)的運行中,異步通信口的任務(wù)是為用戶提供可靠服務(wù),但又是故障多發(fā)部位。主要的問題是,在通過異步鏈路傳輸基于LAN通信量時,將丟失的信息包的量降止最少。

異步通信口故障一般的外部因素是:撥號鏈路性能低劣;電話網(wǎng)交換機(jī)的連接質(zhì)量問題;調(diào)制解調(diào)器的設(shè)置。檢查鏈路兩端使用的調(diào)制解調(diào)器:連接到遠(yuǎn)程PC機(jī)端口調(diào)制解調(diào)器的問題不太多,因為每次生成新的撥號時通常都初始化調(diào)制解調(diào)器,利用大多數(shù)通信程序都能在發(fā)出撥號命令之前發(fā)送適當(dāng)?shù)脑O(shè)置字符串;連接路由器端口的問題較多,這個調(diào)制解調(diào)器通常等待來自遠(yuǎn)程調(diào)制解調(diào)器的連接,連接之前,并不接收設(shè)置字符串。如果調(diào)制解調(diào)器丟失了它的設(shè)置,應(yīng)采用一種方法來初始化遠(yuǎn)程調(diào)制解調(diào)器。簡單的辦法是使用可通過前面板配置的調(diào)制解調(diào)器,另一種方法是將調(diào)制解調(diào)器接到路由器的異步接口,建立反向telnet,發(fā)送設(shè)置命令配置調(diào)制解調(diào)器。

showinterfaceasync命令、showline命令是診斷異步通信口故障使用最多的工具。showinterfaceasync命令輸出報告中,接口狀態(tài)報告關(guān)閉的唯一的情況是接口沒有設(shè)置封裝類型。線路協(xié)議狀態(tài)顯示與串口線路協(xié)議顯示相同。showline命令顯示接口接收和傳輸速度設(shè)置以及EIA狀態(tài)顯示。showline命令可以認(rèn)為是接口命令(showinterfaceasync)的擴(kuò)展。showline命令輸出的EIA信號及網(wǎng)絡(luò)狀態(tài):

noCTSnoDSRDTRRTS:調(diào)制解調(diào)器未與異步接口連接。

CTSnoDSRDTRRTS:調(diào)制解調(diào)器與異步接口連接正常,但未連接遠(yuǎn)程調(diào)制解調(diào)器。

CTSDSRDTRRTS:遠(yuǎn)程調(diào)制解調(diào)器撥號進(jìn)入并建立連接。

確定異步通信口故障一般可用下列步驟:檢查電纜線路質(zhì)量;檢查調(diào)制解調(diào)器的參數(shù)設(shè)置;檢查調(diào)制解調(diào)器的連接速度;檢查rxspeed和txspeed是否與調(diào)制解調(diào)器的配置匹配;通過showinterfaceasync命令和showline命令查看端口的通信狀況;從showline命令的報告檢查EIA狀態(tài)顯示;檢查接口封裝;檢查信息包丟失及緩沖區(qū)丟失情況。

第5篇

關(guān)鍵詞:網(wǎng)絡(luò)故障;故障檢測;故障定位;故障診斷;專家系統(tǒng);數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡(luò)

中圖分類號:TP393.06

隨著計算機(jī)、通信以及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展及應(yīng)用,網(wǎng)絡(luò)作為一種重要的工具,在軍事、政治、經(jīng)濟(jì)和科研等諸多領(lǐng)域起著越來越重要的作用,已經(jīng)成為社會生產(chǎn)和生活必不可少的一部分。與此同時,網(wǎng)絡(luò)的規(guī)模和復(fù)雜性不斷增大,一旦網(wǎng)絡(luò)發(fā)生故障,如果不能在有效時間內(nèi)對網(wǎng)絡(luò)故障進(jìn)行診斷與修復(fù),將會造成巨大的損失,甚至嚴(yán)重威脅社會的安全與穩(wěn)定,因此對網(wǎng)絡(luò)故障診斷技術(shù)進(jìn)行研究具有越來越重要的應(yīng)用價值和現(xiàn)實意義。

1 網(wǎng)絡(luò)故障診斷一般過程

通常來說,網(wǎng)絡(luò)故障診斷是以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運行的知識為基礎(chǔ),根據(jù)網(wǎng)絡(luò)出現(xiàn)的故障現(xiàn)象,并使用專門的網(wǎng)管理和檢測工具以獲取告警信息進(jìn)而對網(wǎng)絡(luò)中出現(xiàn)的故障進(jìn)行診斷、恢復(fù)以及預(yù)測的過程,一般可分為以下五個部分[1]:

(1)故障檢測,即網(wǎng)絡(luò)故障告警信息的獲取。網(wǎng)絡(luò)發(fā)生故障時,通過主動輪詢或異步收集方式,對網(wǎng)絡(luò)中的相關(guān)設(shè)備或服務(wù)的相關(guān)告警信息、設(shè)置和性能參數(shù),狀態(tài)信息等進(jìn)行收集和分析,及時發(fā)現(xiàn)網(wǎng)絡(luò)出現(xiàn)的故障及問題。

(2)故障定位,即定位故障源。對故障檢測階段收集的海量告警數(shù)據(jù)進(jìn)行分析和處理,在網(wǎng)絡(luò)中找出故障,為下一步的故障原因的診斷提供依據(jù)。

(3)故障原因的診斷,即查找故障產(chǎn)生的根源。根據(jù)故障定位的結(jié)果綜合運用各種規(guī)則進(jìn)行系統(tǒng)的推理,快速的找到故障產(chǎn)生的原因或者最可能的原因。

(4)故障修復(fù)。根據(jù)網(wǎng)絡(luò)故障診斷結(jié)果修復(fù)網(wǎng)絡(luò)故障,恢復(fù)網(wǎng)絡(luò)的正常運行。

(5)故障預(yù)測,即根據(jù)先驗知識和監(jiān)測數(shù)據(jù)預(yù)測網(wǎng)絡(luò)可能發(fā)生的故障。

其中故障檢測,故障定位,故障原因診斷是必不可少的三個步驟,下面將重點對上述三個步驟進(jìn)行詳細(xì)的介紹。

2 網(wǎng)絡(luò)故障檢測

通常計算機(jī)網(wǎng)絡(luò)通過以下兩種方式收集信息,通過分析收集到的信息來檢測故障[2]。

(1)Trap機(jī)制。在網(wǎng)絡(luò)中每一個被管設(shè)備中都要運行一個程序以便和管理站中的管理程序進(jìn)行通信。

(2)主動輪詢。網(wǎng)絡(luò)中發(fā)生故障的被管設(shè)備或服務(wù)主動向網(wǎng)絡(luò)管理系統(tǒng)發(fā)出告警信息,能夠及時發(fā)現(xiàn)網(wǎng)絡(luò)中的故障,網(wǎng)絡(luò)管理系統(tǒng)還需通過主動輪詢這種方式了解與網(wǎng)絡(luò)性能密切相關(guān)的信息,并對這些影響網(wǎng)絡(luò)性能信息設(shè)置閾值,來判斷網(wǎng)絡(luò)性能,超過設(shè)定閾值也會觸發(fā)事件。

3 網(wǎng)絡(luò)故障定位

網(wǎng)絡(luò)系統(tǒng)中,一般通過監(jiān)測被管設(shè)備或服務(wù)等各種方法獲取大量原始告警數(shù)據(jù)或歷史積累信息,這些數(shù)據(jù)往往由于通信系統(tǒng)的復(fù)雜性、網(wǎng)絡(luò)結(jié)構(gòu)異構(gòu)性、噪聲、外界因素、因果關(guān)系等原因而具有相當(dāng)大的不確定性和不精確性,導(dǎo)致故障癥狀和故障原因都存在非線性映射關(guān)系,需要利用關(guān)聯(lián)技術(shù)對數(shù)據(jù)進(jìn)行處理和分析才有效的進(jìn)行故障定位[3],目前常用的故障定位技術(shù)主要有下面幾種:

3.1 基于人工智能的故障定位技術(shù)

3.1.1 基于規(guī)則的推理技術(shù)

基于規(guī)則的推理(Rule-based Reason,RBR)是最簡單的關(guān)聯(lián)技術(shù),已被用于多種構(gòu)架。一般而言,基于規(guī)則的系統(tǒng)由三個組成部分組成,如圖1所示。

(1)推理引擎,主要提供解決問題所需要的策略。

(2)知識庫,提供和定義與問題相關(guān)的規(guī)則和專家知識。

(3)工作內(nèi)存,主要提供解決問題所需要的數(shù)據(jù)。

在基于規(guī)則的推理的網(wǎng)絡(luò)故障定位系統(tǒng)中,知識庫充當(dāng)一個專家的角色,利用從人類專家獲取專家積累的經(jīng)驗和知識,這些知識主要包括對網(wǎng)絡(luò)問題的定義以及當(dāng)某一特定問題發(fā)生時,網(wǎng)絡(luò)故障定位系統(tǒng)需要執(zhí)行的操作。工作內(nèi)存主要是利用具體的網(wǎng)絡(luò)協(xié)議對網(wǎng)絡(luò)中的被管設(shè)備或服務(wù)進(jìn)行監(jiān)測,得到有關(guān)被管設(shè)備或服務(wù)的各種信息。在對網(wǎng)絡(luò)故障進(jìn)行定位時,推理引擎與知識庫共同合作,將監(jiān)測得到的網(wǎng)絡(luò)中被管設(shè)備或服務(wù)的狀態(tài)信息與知識庫中定義好的條件部分進(jìn)行比對,根據(jù)條件滿足與否,來進(jìn)行網(wǎng)絡(luò)故障的定位。

基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng),由于無需對專家系統(tǒng)的具體結(jié)構(gòu)和操作細(xì)節(jié)進(jìn)行深入了解,從而具有結(jié)構(gòu)簡單等諸多優(yōu)點,并且實現(xiàn)起來比較簡單,非常適用于小型系統(tǒng)。但是基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng)在匹配規(guī)則時,需要網(wǎng)絡(luò)狀態(tài)與知識庫中的規(guī)則條件精確匹配,否則將推出整個推理過程,無法定位故障,并且規(guī)則存在不易維護(hù)性和指數(shù)增長性,所有這些缺點決定了基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng)不適用大型系統(tǒng)。

3.1.2 基于模型的推理技術(shù)

基于模型的推理(Model-based Reason,MBR)是建立在面向?qū)ο笊系幕A(chǔ)之上,利用現(xiàn)有的專家經(jīng)驗和知識,將具體的目標(biāo)系統(tǒng)中的實體都模型化診斷對象,并且明確地表現(xiàn)出現(xiàn)實目標(biāo)系統(tǒng)中對象之間存在的各種關(guān)聯(lián)關(guān)系,再根據(jù)系統(tǒng)模型對具體的目標(biāo)系統(tǒng)的行為進(jìn)行推測。由于通常情況下,具體的目標(biāo)系統(tǒng)與理想的系統(tǒng)模型之間存在差異性,因此基于模型的推理的專家系統(tǒng)需要對推測的行為和目標(biāo)系統(tǒng)的實際行為進(jìn)行不一致診斷,以確定具體目標(biāo)系統(tǒng)中的故障根源。

為了更好地說明基于模型的推理專家系統(tǒng)的工作流程,文獻(xiàn)[4]使用一個物理模型和對應(yīng)的對等模型分別如圖2、3所示的網(wǎng)絡(luò)系統(tǒng)。網(wǎng)絡(luò)系統(tǒng)按一定的周期,有規(guī)律的向圖2中的被管設(shè)備發(fā)送ping命令以監(jiān)測網(wǎng)絡(luò)系統(tǒng)中的被管設(shè)備是否運行正常。管理系統(tǒng)和被管設(shè)備之間通過一個模型對象實現(xiàn)彼此之間的相互通信,具體來說,如圖2所示,系統(tǒng)中的集線器模型向被管設(shè)備集線器發(fā)送ping命令,路由器模型則向被管設(shè)備路由器發(fā)送ping命令。當(dāng)目標(biāo)網(wǎng)絡(luò)發(fā)生故障時,如果故障發(fā)生在集線器1,則集線器1模型可以將其發(fā)現(xiàn)并且識別出來,如果集線器1模型連續(xù)3次向被管設(shè)備集線器1發(fā)送ping命令,在3次響應(yīng)超時以后,集線器模型1根據(jù)現(xiàn)有的網(wǎng)絡(luò)現(xiàn)象推測被管設(shè)備集線器1有可能發(fā)生故障,或者說目標(biāo)系統(tǒng)中的故障位于集線器1。集線器1模型則會在確定故障并正式發(fā)送告警信息之前,集線器1模型將分析自身與圖2中其他被管設(shè)備的模型之間的關(guān)系以此來確定其是否應(yīng)該詢問網(wǎng)絡(luò)中路由器模型,如網(wǎng)絡(luò)中的路由器模型返回的是相應(yīng)的被管路由器設(shè)備工作處于正常狀態(tài),則集線器1觸發(fā)警報。

3.1.3 基于范例的推理技術(shù)

基于范例的推理(Case-based Reason,CBR)故障定位技術(shù)與前面的基于規(guī)則推理技術(shù)和基于模型推理技術(shù)相比具有很大的差異性,主要因為基于范例的推理技術(shù)的思想源于人類現(xiàn)實生活,主要根據(jù)過去積累的實際經(jīng)驗或經(jīng)歷,利用類比的推理方法對現(xiàn)有的新問題做出相似的解答,然后根據(jù)新問題與舊問題之間的差異對解答進(jìn)行修改從而得到新問題的完全解答?;诜独评淼木W(wǎng)絡(luò)故障定位技術(shù)主要由四個部分組成,檢索 (Retrieve)、復(fù)用(Reuse)、修正(Revise)、保存(Retain),簡稱4R過程。

基于范例推理的故障定位技術(shù)與基于規(guī)則推理的故障定位技術(shù)相比,由于在基于范例推理的故障定位技術(shù)中檢索只是基于對案例的部分匹配,而基于規(guī)則推理的故障定位技術(shù)則是完全匹配,因此基于范例推理的故障定位技術(shù)對網(wǎng)絡(luò)配置變化的適應(yīng)度更好,更適用于問題的總體解決方案。

3.2 模型遍歷技術(shù)

模型遍歷技術(shù)(Model traversing techniques)是一種構(gòu)建網(wǎng)絡(luò)故障傳播模型的方法,該方法在構(gòu)建故障傳播模型時,主要根據(jù)網(wǎng)絡(luò)在運行時各種被管對象之間的相互關(guān)系,并且按照從引起事件的被管對象開始的順序進(jìn)行構(gòu)建。該方法主要適用于網(wǎng)絡(luò)中被管對象之間的相互關(guān)系類似于圖形,并且一般情況下較容易獲取的情況,并且在系統(tǒng)配置變化較頻繁時該方法的魯棒性很好。模型遍歷技術(shù)主要具有兩大特點,事件驅(qū)動和事件關(guān)聯(lián),所謂事件驅(qū)動是指在一個故障癥狀報告到來之前,系統(tǒng)一直處于等待故障癥狀狀態(tài);事件關(guān)聯(lián)則是確定兩個故障癥狀是否來源同一個事件源。

一般情況下,模型遍歷技術(shù)需要在其事件報告中明確標(biāo)識網(wǎng)絡(luò)系統(tǒng)中故障的征兆類型、征兆目標(biāo)等相關(guān)信息,如果網(wǎng)絡(luò)系統(tǒng)中出現(xiàn)故障征兆,且不妨用si來表示該故障征兆,當(dāng)si的目標(biāo)和si來源相同,則說明si是一個次要征兆也就說明某些告警信息可以被忽略。模型遍歷技術(shù)的整個處理可分為以下3步:

(1)首先,對網(wǎng)絡(luò)中的每個事件,依據(jù)網(wǎng)絡(luò)在運行時各種被管對象之間的相互關(guān)系對其構(gòu)建一個和事件源相關(guān)的對象圖。

(2)當(dāng)給定的兩個事件的對象圖相交時,此時說明兩個圖至少包含同一個對象,則認(rèn)為這兩個對象圖的事件源是關(guān)聯(lián)的。

(3)當(dāng)給定三個故障癥狀si,sj,sk,其中si,sj相互關(guān)聯(lián),sj,sk相互關(guān)聯(lián),則根據(jù)故障癥狀的傳遞性可知si是一個次要的故障癥狀。

4 網(wǎng)絡(luò)故障原因診斷

(1)基于信號處理方法。該方法主要是依據(jù)信號模型,直接對網(wǎng)絡(luò)系統(tǒng)中的可測信號進(jìn)行分析與處理,并通過提取可測信號的頻率等特征值,對網(wǎng)絡(luò)中存在的故障原因進(jìn)行診斷。

(2)基于解析模型的方法。基于解析模型的方法主要依據(jù)數(shù)學(xué)模型和數(shù)學(xué)方法來進(jìn)行故障原因的診斷,在診斷時需要建立對象的精確數(shù)學(xué)模型。

(3)基于知識檢測的方法。與基于解析模型方法相比,此方法最大的特點在于其并不需要對象的精確數(shù)學(xué)模型就可以對網(wǎng)絡(luò)中的故障原因進(jìn)行診斷。

下面主要介紹幾種目前國內(nèi)外研究學(xué)者研究比較多的基于知識檢測的方法,基于專家系統(tǒng)故障原因診斷方法和基于模糊理論故障原因診斷方法以及基于BP神經(jīng)網(wǎng)絡(luò)故障原因檢測方法。

4.1 基于專家系統(tǒng)故障原因診斷方法

基于專家系統(tǒng)故障原因診斷系統(tǒng)主要是利用人類專家的經(jīng)驗和歷史積累診斷數(shù)據(jù),使用一定的方法將其轉(zhuǎn)化為系統(tǒng)能夠識別的規(guī)則存在專家系統(tǒng)的知識庫中。當(dāng)網(wǎng)絡(luò)中出現(xiàn)故障時,診斷系統(tǒng)利用專家系統(tǒng)知識庫中的規(guī)則,對發(fā)生故障網(wǎng)絡(luò)中的被管對象的各項性能參數(shù)進(jìn)行處理與分析以正確的確定網(wǎng)絡(luò)故障發(fā)生的具體原因[5]。組成由人機(jī)接口、推理機(jī)、知識庫等六部分組成:

目前,國內(nèi)外學(xué)者公認(rèn)的專家系統(tǒng)瓶頸是知識獲取問題,因為專家系統(tǒng)在診斷過程中主要依賴于從人類專家領(lǐng)域內(nèi)獲取的知識、經(jīng)驗和以往診斷數(shù)據(jù),而這些獲取起來途徑有限,操作起來具有一定的局限性和復(fù)雜性。另外,專家系統(tǒng)在實時性和學(xué)習(xí)能力等方面也存在一定的局限性,因此目前通常將專家系統(tǒng)同其他方法相結(jié)合以提高專家系統(tǒng)在這些方面存在的局限性和不足。

4.2 模糊故障診斷方法

很多時候,網(wǎng)絡(luò)中的故障與系統(tǒng)得到的網(wǎng)絡(luò)現(xiàn)象之間存在非線性的映射關(guān)系,這種非線性的映射關(guān)系很難用確定的數(shù)學(xué)公式或者模型來刻畫,相應(yīng)的在故障原因診斷時,很難給出故障的精確原因。相反,只能給出故障發(fā)生的可能原因。對于這種存在一定模糊性的問題,可以使用模糊邏輯來解決。

目前使用的比較多的是向量識別法,其診斷過程可分為以下3步:

首先,需要根據(jù)網(wǎng)絡(luò)中的故障與表征網(wǎng)絡(luò)故障的數(shù)據(jù),建立二者之間的關(guān)系,通常用關(guān)系矩陣R來表示。

其次,對需要診斷的目標(biāo)網(wǎng)絡(luò)系統(tǒng)(對象)進(jìn)行狀態(tài)檢測,提取相關(guān)的特征參數(shù)以構(gòu)建特征向量矩陣X。

最后,根據(jù)模糊理論和矩陣?yán)碚摚蠼馇懊鎯刹綐?gòu)建的關(guān)系矩陣方程Y=X?R,得到關(guān)系矩陣方程的解Y,再根據(jù)隸屬度等原則,對目標(biāo)網(wǎng)絡(luò)系統(tǒng)的故障向量Y進(jìn)行處理,得到故障的原因。

從上述診斷過程可知,在模糊故障診斷中,正確的進(jìn)行故障原因診斷的前提是建立關(guān)系矩陣R、隸屬函數(shù)、特征值向量X,而這些矩陣、函數(shù)、向量的建立是人為構(gòu)造而成,難免具有一定的主觀性,并且由于該模糊診斷方法對特征元素的選取也有一定的要求,所以兩者若處理不當(dāng),會導(dǎo)致該方法的診斷結(jié)果精度嚴(yán)重下降甚至完全錯誤。

4.3 BP神經(jīng)網(wǎng)絡(luò)診斷方法

由于人工神經(jīng)網(wǎng)絡(luò)的這些特性以及網(wǎng)絡(luò)中故障與征兆之間有可能存在的非線性映射關(guān)系,使得人工神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)故障診斷中大有用武之地。目前,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)大量應(yīng)用在網(wǎng)絡(luò)故障診斷領(lǐng)域。BP神經(jīng)網(wǎng)絡(luò)是常用的人工神經(jīng)網(wǎng)絡(luò)模型[6]。

BP神經(jīng)網(wǎng)絡(luò)故障診斷分為訓(xùn)練和診斷兩個階段:

(1)訓(xùn)練階段。BP神經(jīng)網(wǎng)絡(luò)對樣本進(jìn)行訓(xùn)練,以選定網(wǎng)絡(luò)結(jié)構(gòu)和規(guī)模,確定網(wǎng)絡(luò)總層數(shù)、各層神經(jīng)元數(shù)。借助BP學(xué)習(xí)算法,將原始網(wǎng)絡(luò)收集到的故障樣本的特征參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)輸入樣本集,以與之對應(yīng)的網(wǎng)絡(luò)故障原因編碼為BP神經(jīng)網(wǎng)絡(luò)的輸出,以此對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。

(2)故障診斷階段。主要對待檢測對象的故障樣本進(jìn)行特征提取和歸一化處理,然后輸入到BP神經(jīng)網(wǎng)絡(luò)進(jìn)行診斷輸出診斷結(jié)果,整個過程分為以下4個步驟:1)故障樣本集預(yù)處理。2)BP網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計。3)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)。4)故障診斷。

5 結(jié)束語

本文對網(wǎng)絡(luò)故障的概念以及基本過程進(jìn)行了概述,重點對當(dāng)前網(wǎng)絡(luò)故障中的故障檢測、故障定位、故障診斷的關(guān)鍵技術(shù)及方法進(jìn)行了研究和總結(jié)歸納,對開展網(wǎng)絡(luò)故障診斷技術(shù)研究具有一定的指導(dǎo)意義。

參考文獻(xiàn):

[1]王成等.網(wǎng)絡(luò)故障診斷技術(shù)研究[J].科技信息,2011(11).

[2]陳琳.一種網(wǎng)絡(luò)環(huán)境中的故障診斷模型[J].北京航空航天大學(xué)學(xué)報,2004(11).

[3]張燕.網(wǎng)絡(luò)故障診斷關(guān)鍵技術(shù)[J].電腦知識與技術(shù),2009(31).

[4]李千目.戰(zhàn)略互聯(lián)網(wǎng)智能診斷技術(shù)研究[D].南京理工大學(xué),2005.

[5]吳曉知,李興明.網(wǎng)絡(luò)故障管理專家系統(tǒng)中知識庫的構(gòu)造[J].微計算機(jī)信息,2008(06).

[6]戚涌,劉鳳玉.基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)智能診斷系統(tǒng)[J].微電子學(xué)與計算機(jī),2004(10).

第6篇

【關(guān)鍵詞】網(wǎng)絡(luò)故障,網(wǎng)絡(luò)維護(hù),物理故障,邏輯故障,分類

中圖分類號:TN711 文獻(xiàn)標(biāo)識碼:A 文章編號:

一、前言

隨著網(wǎng)絡(luò)應(yīng)用的普及,人們對網(wǎng)絡(luò)的正常穩(wěn)定運行提出了越來越高的要求。如果運行中的網(wǎng)絡(luò)出現(xiàn)了故障,都會給使用者造成不同程度的影響,輕則使一些用戶不能正常使用網(wǎng)絡(luò),嚴(yán)重的會導(dǎo)致整個網(wǎng)絡(luò)癱瘓,不能使用。常見的網(wǎng)絡(luò)故障分為兩大類:物理故障和邏輯故障。遇到故障時,通常來說按先物理故障再邏輯故障的順序進(jìn)行檢查。網(wǎng)絡(luò)出現(xiàn)故障后應(yīng)及時的進(jìn)行維護(hù),以最快的速度恢復(fù)網(wǎng)絡(luò)的正常運行。

二、網(wǎng)絡(luò)故障的分類

網(wǎng)絡(luò)故障有很多種,故障產(chǎn)生的原因、部位和造成的影響也是不同的。以網(wǎng)絡(luò)故障的性質(zhì)可分為物理故障和邏輯故障。物理故障一般指的是發(fā)生在線路、設(shè)備等硬件類故障問題,例如:端口故障,線路故障,交換機(jī)或路由器故障,主機(jī)物理故障等。而邏輯故障則包涵主機(jī)邏輯故障,一些重要進(jìn)程或端口關(guān)閉等故障。

三、網(wǎng)絡(luò)維護(hù)的步驟

1、識別故障并對故障進(jìn)行描述;

2、收集故障的相關(guān)信息并確定其定義和故障影響的范圍;

3、列舉出可能造成這些故障的原因,確定范圍找出故障;

4、設(shè)計診斷故障的方案,按照診斷方案解決故障;

5、對這個解決方案進(jìn)行備忘,盡量設(shè)計出預(yù)防措施

四、排除網(wǎng)絡(luò)故障的思路

當(dāng)我們遇到網(wǎng)絡(luò)故障的時候,我們要迅速的找到故障的位置,而且還要確定故障發(fā)生的原因。分時網(wǎng)絡(luò)故障的時候,先要弄清出故障的現(xiàn)象,仔細(xì)地了解故障的潛在原因。盡可能收集需要用于幫助隔離可能的故障的原因。其次,列舉出可能導(dǎo)致故障的原因并且根據(jù)相關(guān)情況一個一個的分析,盡量降低排除故障的工作的復(fù)雜度,比如根據(jù)某些信息排除硬件故障,從而把注意力放在一些有疑點的軟件上。最后,要認(rèn)真仔細(xì)地做好每一步的觀察測試工作,當(dāng)改變一個參數(shù)后都要確認(rèn)結(jié)果,確定問題有沒有解決掉,若故障沒有被解決,則要繼續(xù)下去直到故障消除。

五、常見網(wǎng)絡(luò)故障排除

造成網(wǎng)絡(luò)故障的原因突出顯示,但總體上來說就是軟件問題和硬件問題,準(zhǔn)確的說是網(wǎng)絡(luò)連通性故障、網(wǎng)絡(luò)協(xié)議故障和網(wǎng)絡(luò)配置故障。

在日常的網(wǎng)絡(luò)維護(hù)中,線路故障的發(fā)生率非常的高,大約占發(fā)生網(wǎng)絡(luò)故障的70%。線路相關(guān)的故障一般包括網(wǎng)線、水晶插頭的損壞或者是水晶頭與線的接觸不良導(dǎo)致的線路故障。電纜連接問題是經(jīng)常出現(xiàn)的,特別要注意受損的電纜、電纜類型不正確或線路受到嚴(yán)重電磁干擾等。

對于這類問題最簡單的解決方法就是通過目測的方法來判斷電纜的連接性。仔細(xì)檢查交換機(jī)、 HUB、收發(fā)器或網(wǎng)卡等網(wǎng)絡(luò)設(shè)備的狀態(tài)燈, 從狀態(tài)燈的點亮或閃爍情況就可以判斷電纜是不是連通的。對于電磁干擾這些故障的排查,屏蔽性比較強(qiáng)的屏蔽線可以被用在該段網(wǎng)路上進(jìn)行通信測試,假如通信是正常的,那就表明存在明顯的電磁干擾,要注意遠(yuǎn)離像高壓電線等電磁場較強(qiáng)的地方。

集線器、交換機(jī)和路由器故障是指它們由于物理損壞,無法工作,導(dǎo)致網(wǎng)絡(luò)不通。解決這個故障的方法就是用替換排除的方法, 用正常通信的網(wǎng)線連接主機(jī)集線器或路由器,連接后如若能正常通信的話, 那么集線器或路由器是完好的;連接后不能正常通信的話,接下來就轉(zhuǎn)換集線器端口然后進(jìn)行排查,看端口和集線器或路由器哪個出現(xiàn)了故障;大多數(shù)時候, 集線器或路由器的指示燈也能夠提示其是否有故障, 在正常情況下對應(yīng)端口的燈應(yīng)是綠燈。若一直不能正常通信, 則可以認(rèn)定它是集線器或路由器發(fā)生了故障。

對于網(wǎng)卡故障,由于網(wǎng)卡多裝在主機(jī)內(nèi), 要靠主機(jī)才能完成配置和通信, 也可以看作網(wǎng)絡(luò)終端。這類故障一般包括網(wǎng)卡松動, 主機(jī)的網(wǎng)卡插槽故障,網(wǎng)卡物理故障和主機(jī)本身的故障。對于網(wǎng)卡接觸的故障的解決辦法就是拔出網(wǎng)卡,將它的金屬部分用鐵砂紙擦掉其氧化層再插入使用。對由于網(wǎng)卡的松動和主機(jī)的網(wǎng)卡插槽有故障這種情況,解決的辦法就是更換新的網(wǎng)卡插槽。對網(wǎng)卡物理故障的情況, 如果以上更換插槽的辦法也解決不了問題的話,那就要拿到其他正常工作的主機(jī)上進(jìn)行網(wǎng)卡測試,如果仍然是無法工作的話,通??梢哉J(rèn)定是網(wǎng)卡物理損壞了,買個新的網(wǎng)卡后換掉就能解決問題了。

至于邏輯類的網(wǎng)絡(luò)故障,那是由于網(wǎng)絡(luò)設(shè)備配置不正確而導(dǎo)致的網(wǎng)絡(luò)故障,通常叫做邏輯。路由器邏輯故障一般包括路由器的端口參數(shù)設(shè)定不正確、路由器的路由配置錯誤、路由器的CPU利用率過高和路由器內(nèi)存余量太小等等。路由器有誤的端口參數(shù)設(shè)定就可能會導(dǎo)致找不到遠(yuǎn)端地址。這時候用Ping命令或者是Traceroute命令查看故障發(fā)生在遠(yuǎn)端地址的哪個環(huán)節(jié)點,找出問題后先檢查再修復(fù)該節(jié)點的參數(shù)。路由器路由配置錯誤會使路由不斷循環(huán),該故障可以用Traceroute工具解決,能夠發(fā)現(xiàn)在Traceroute的結(jié)果中在某一段之后, 兩個IP 地址會循環(huán)出現(xiàn)。這時,通常就是線路遠(yuǎn)端把端口路由又指向了線路近端, 導(dǎo)致IP包在該線路上不斷反復(fù)傳遞。解決路由循環(huán)故障的方法就得重新配置路由器端口的靜態(tài)路由或者動態(tài)路由,把路由設(shè)置改為正確的配置,就能恢復(fù)線路了。

主機(jī)的網(wǎng)絡(luò)地址參數(shù)設(shè)置不正確是日常生活中常見的主機(jī)邏輯故障問題。例如,主機(jī)配置的IP地址和其他的主機(jī)發(fā)生沖突,或IP地址原本就不在正確網(wǎng)段范圍以內(nèi),因此,這將會導(dǎo)致該主機(jī)不能連通。這個故障的診斷方法就是鼠標(biāo)右鍵查看網(wǎng)絡(luò)鄰居屬性中的連接屬性窗口,查看TCP/IP選項參數(shù)設(shè)置是否正確,這包括IP地址、網(wǎng)關(guān)、子網(wǎng)掩碼和DNS參數(shù),特別是要仔細(xì)查看有沒有重復(fù)的IP地址。

對于一些受系統(tǒng)或病毒影響而導(dǎo)致意外關(guān)閉的有關(guān)網(wǎng)絡(luò)連接數(shù)據(jù)參數(shù)的重要進(jìn)程或端口。像意外關(guān)閉的路由器的SNMP進(jìn)程,這時候網(wǎng)絡(luò)管理系統(tǒng)將從路由器中采集不到任何的數(shù)據(jù),因此,網(wǎng)絡(luò)管理系統(tǒng)失去了對該路由器的控制權(quán),又或者線路一直中斷,沒有流量無法聯(lián)網(wǎng)。對于這個故障,我們可以用Ping線路近端的端口看是否能進(jìn)行Ping通,如果Ping不通,就要檢查該端口是否處于down 的狀態(tài), 如果是由于該端口被關(guān)閉了所以導(dǎo)致的故障,只需要重新啟動該端口就可以恢復(fù)線路的連通了。

六、結(jié)束語

由于計算機(jī)網(wǎng)絡(luò)技術(shù)快速的發(fā)展,網(wǎng)絡(luò)故障也越來越復(fù)雜,本文就介紹了常見的幾類故障及其排查維護(hù)的方法。為了能在網(wǎng)絡(luò)出現(xiàn)故障后快速及時地對網(wǎng)絡(luò)進(jìn)行修復(fù)和維護(hù),以最快的速度恢復(fù)網(wǎng)絡(luò)的正常健康運行,就有必要建立完整的故障維護(hù)文檔,以供以后遇到類似的問題時及時查詢。養(yǎng)成做網(wǎng)絡(luò)維護(hù)日志的良好習(xí)慣并堅持下去,尤其是對那些發(fā)生概率低但是一些概率高的故障和危害相當(dāng)大的故障,對每臺電腦都要記錄好完整的維護(hù)文檔有利于以后故障的排查和解決,這也是積累經(jīng)驗的一種很好的方式。還有就是提高網(wǎng)絡(luò)安全防范意識,提高網(wǎng)絡(luò)運行的可靠性,并且為主機(jī)加裝最新的操作系統(tǒng)的補(bǔ)丁程序和防火墻、防黑客等程序而且還要經(jīng)常更新,防止漏洞的出現(xiàn)。嚴(yán)格的網(wǎng)絡(luò)管理是減少網(wǎng)絡(luò)故障的重要手段之一,完善的技術(shù)檔案在排除網(wǎng)絡(luò)故障的時候可以作為重要參考,有效的測試工具和監(jiān)視工具則是預(yù)防、解決網(wǎng)絡(luò)故障的強(qiáng)有力助手,從而做到以不變應(yīng)萬變,輕松地解決掉網(wǎng)絡(luò)故障問題。

參考文獻(xiàn):

第7篇

關(guān)鍵詞:網(wǎng)絡(luò)故障診斷;路由器;分層診斷技術(shù);網(wǎng)絡(luò)接口

中圖分類號:TP393文獻(xiàn)標(biāo)識碼:A

文章編號:1009-2374 (2010)25-0070-02

0引言

計算機(jī)網(wǎng)絡(luò)是指將地理位置不同的具有獨立功能的多臺計算機(jī)及其外部設(shè)備,通過通信線路連接起來,在網(wǎng)絡(luò)操作系統(tǒng),網(wǎng)絡(luò)管理軟件及網(wǎng)絡(luò)通信協(xié)議的管理和協(xié)調(diào)下,實現(xiàn)資源共享和信息傳遞的計算機(jī)系統(tǒng)。實現(xiàn)計算機(jī)網(wǎng)絡(luò)有四個基本要素:通信線路和通信設(shè)備;有獨立功能的計算機(jī);網(wǎng)絡(luò)軟件軟件支持;實現(xiàn)數(shù)據(jù)通信與資源共享。所以網(wǎng)絡(luò)故障無非就是這四個方面的故障。本文先介紹網(wǎng)絡(luò)和路由器的基本概念,而后通過介紹網(wǎng)絡(luò)分層診斷技術(shù)來詳細(xì)闡述排除網(wǎng)絡(luò)連通性故障的方法。

1網(wǎng)絡(luò)與路由器概述

網(wǎng)絡(luò)診斷是一門綜合性技術(shù),涉及網(wǎng)絡(luò)技術(shù)的方方面面。為方便下面的討論,首先回顧一下網(wǎng)絡(luò)和路由器的基本概念。

(1)計算機(jī)網(wǎng)絡(luò)按其覆蓋范圍通常被分為局域網(wǎng)和廣域網(wǎng)。局域網(wǎng)覆蓋地理范圍較小,一般在數(shù)米到數(shù)十公里之間。廣域網(wǎng)覆蓋地理范圍較大。按拓?fù)浞诸惪煞譃榭偩€型,星型,環(huán)形以及網(wǎng)狀網(wǎng)絡(luò)。

(2)為了完成計算機(jī)間的通信,把每部計算機(jī)互連的功能劃分成定義明確的層次,規(guī)定了同層進(jìn)程通信的協(xié)議及相鄰層之間的接口和服務(wù),將這些層、同層進(jìn)程通信的協(xié)議及相鄰層之間的接口統(tǒng)稱為網(wǎng)絡(luò)體系結(jié)構(gòu)。國際標(biāo)準(zhǔn)化組織(ISO)提出的開放系統(tǒng)互連參考模型(OSI)是當(dāng)代計算機(jī)網(wǎng)絡(luò)技術(shù)體系的核心。該模型將網(wǎng)絡(luò)劃分為7個層次:物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層、會話層、表示層和應(yīng)用層。

(3)Internet依靠TCP/IP協(xié)議,在全球范圍內(nèi)實現(xiàn)不同硬件結(jié)構(gòu)、不同操作系統(tǒng)、不同網(wǎng)絡(luò)系統(tǒng)的互聯(lián)。在Internet上,每一個節(jié)點都依靠唯一的IP地址互相區(qū)分和相互聯(lián)系。IP地址是一個32位二進(jìn)制數(shù)的地址,由4個8位字段組成,每個字段之間用點號隔開,用于標(biāo)識TCP/IP宿主機(jī)。

(4)路由器(Router)是用于連接多個邏輯上分開的網(wǎng)絡(luò),所謂邏輯網(wǎng)絡(luò)是代表一個單獨的網(wǎng)絡(luò)或者一個子網(wǎng)。當(dāng)數(shù)據(jù)從一個子網(wǎng)傳輸?shù)搅硪粋€子網(wǎng)時,可通過路由器來完成。因此,路由器具有判斷網(wǎng)絡(luò)地址和選擇路徑的功能,它能在多網(wǎng)絡(luò)互聯(lián)環(huán)境中,建立靈活的連接,可用完全不同的數(shù)據(jù)分組和介質(zhì)訪問方法連接各種子網(wǎng),路由器只接受源站或其他路由器的信息,屬網(wǎng)絡(luò)層的一種互聯(lián)設(shè)備。路由器技術(shù)始終處于核心地位。

2網(wǎng)絡(luò)故障診斷概述

網(wǎng)絡(luò)故障診斷有以下三方面的目的:確定網(wǎng)絡(luò)的故障點,恢復(fù)網(wǎng)絡(luò)的正常運行;找到網(wǎng)絡(luò)配置和規(guī)劃中的欠缺之處,改善和優(yōu)化網(wǎng)絡(luò)的性能;觀察網(wǎng)絡(luò)的運行狀況,及時預(yù)測網(wǎng)絡(luò)通信質(zhì)量。

網(wǎng)絡(luò)故障診斷以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運行的知識為基礎(chǔ)。從故障現(xiàn)象出發(fā),以網(wǎng)絡(luò)診斷工具為手段獲取診斷信息,確定網(wǎng)絡(luò)故障點,查找問題的根源,排除故障,恢復(fù)網(wǎng)絡(luò)正常運行。

網(wǎng)絡(luò)診斷可以使用包括局域網(wǎng)或廣域網(wǎng)分析儀在內(nèi)的多種工具:路由器診斷命令;網(wǎng)絡(luò)管理工具和其它故障診斷工具。CISCO提供的工具足以勝任排除絕大多數(shù)網(wǎng)絡(luò)故障。查看路由表,是解決網(wǎng)絡(luò)故障開始的好地方。ICMP的ping、trace命令和Cisco的show命令、debug命令是獲取故障診斷有用信息的網(wǎng)絡(luò)工具。

網(wǎng)絡(luò)故障的故障癥狀包括一般性和較特殊的。一般故障排除模式如下:第一步,當(dāng)分析網(wǎng)絡(luò)故障時,首先要清楚故障現(xiàn)象;第二步,收集需要的可能的故障原因信息,充分了解故障現(xiàn)象;第三步,根據(jù)收集到的情況考慮可能的故障原因,然后根據(jù)具體故障現(xiàn)象排除不符合的故障原因;第四步,根據(jù)最后的可能的故障原因,建立一個診斷計劃;第五步,執(zhí)行診斷計劃,認(rèn)真做好每一步測試和觀察,直到故障癥狀消失;第六步,每改變一個參數(shù)都要確認(rèn)其結(jié)果。

3網(wǎng)絡(luò)故障分層診斷技術(shù)

3.1物理層及其診斷

物理層是第一層,它雖然處于最底層,卻是整個開放系統(tǒng)的基礎(chǔ)。物理層為設(shè)備之間的數(shù)據(jù)通信提供傳輸媒體及互連設(shè)備,為數(shù)據(jù)傳輸提供可靠的環(huán)境。

物理層的故障主要表現(xiàn)在設(shè)備的物理連接方式是否正確;MODEM、CSU/DSU等設(shè)備的配置及操作是否正確。可以使用show interface命令來檢查路由器各端口物理連接是否正常,檢查端口狀態(tài),EIA狀態(tài)和協(xié)議建立狀態(tài)。

3.2數(shù)據(jù)鏈路層及其診斷

數(shù)據(jù)鏈路層是OSI參考模型的第二層,該層解決兩個相鄰結(jié)點之間的通信問題,實現(xiàn)兩個相鄰結(jié)點鏈路上無差錯的協(xié)議數(shù)據(jù)單元傳輸。數(shù)據(jù)鏈路層傳輸?shù)膮f(xié)議數(shù)據(jù)單元稱為數(shù)據(jù)幀。數(shù)據(jù)鏈路層不關(guān)心數(shù)據(jù)包中包含什么信息,而僅是將其傳遞到網(wǎng)絡(luò)中的下一結(jié)點。

3.3網(wǎng)絡(luò)層及其診斷

網(wǎng)絡(luò)層提供建立、保持和釋放網(wǎng)絡(luò)層連接的手段,包括路由選擇、流量控制、傳輸確認(rèn)、中斷、差錯及故障恢復(fù)等。

排除網(wǎng)絡(luò)層故障的基本方法是:沿著從源到目標(biāo)的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現(xiàn),應(yīng)該通過檢查來確定是否已經(jīng)輸入適當(dāng)?shù)撵o態(tài)路由、默認(rèn)路由或者動態(tài)路由。然后手工配置一些丟失的路由,或者排除一些動態(tài)路由選擇過程的故障,包括RIP或者IGRP路由協(xié)議出現(xiàn)的故障。

4路由器接口故障排除

4.1串口故障排除

串口出現(xiàn)連通性問題時,為了排除串口故障,一般是從show interface serial命令開始,分析它的屏幕輸出報告內(nèi)容,找出問題之所在。串口報告的開始提供了該接口狀態(tài)和線路協(xié)議狀態(tài)。接口和線路協(xié)議的可能組合有以下幾種:串口運行、線路協(xié)議運行,這是完全的工作條件。該串口和線路協(xié)議已經(jīng)初始化,并正在交換協(xié)議的存活信息;串口運行、線路協(xié)議關(guān)閉,這個顯示說明路由器與提供載波檢測信號的設(shè)備連接,表明載波信號出現(xiàn)在本地和遠(yuǎn)程的調(diào)制解調(diào)器之間,但沒有正確交換連接兩端的協(xié)議存活信息;串口和線路協(xié)議都關(guān)閉,可能是電信部門的線路故障、電纜故障或者是調(diào)制解調(diào)器故障;串口管理性關(guān)閉和線路協(xié)議關(guān)閉,這種情況是在接口配置中輸入了shutdown命令。通過輸入no shutdown命令,打開管理性關(guān)閉。

正常通信時接口輸入或輸出信息包不應(yīng)該丟失,或者丟失的量非常小,而且不會增加。如果信息包丟失有規(guī)律性增加,表明通過該接口傳輸?shù)耐ㄐ帕砍^接口所能處理的通信量。解決的辦法是增加線路容量。

4.2以太接口故障排除

以太接口的典型故障問題是:帶寬的過分利用;碰撞沖突次數(shù)頻繁;使用不兼容的類型。使用show interface ethernet命令可以查看該接口的吞吐量、碰H沖突、信息包丟失、和類型的有關(guān)內(nèi)容等。

(1)通過查看接口的吞吐量可以檢測網(wǎng)絡(luò)的利用。如果網(wǎng)絡(luò)廣播信息包的百分比很高,網(wǎng)絡(luò)性能開始下降。光纖網(wǎng)轉(zhuǎn)換到以太網(wǎng)段的信息包可能會淹沒以太口?;ヂ?lián)網(wǎng)發(fā)生這種情況可以采用優(yōu)化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速轉(zhuǎn)換,并且調(diào)整緩沖區(qū)和保持隊列。

(2)兩個接口試圖同時傳輸信息包到以太電纜上時,將發(fā)生碰H。以太網(wǎng)要求沖突次數(shù)很少,不同的網(wǎng)絡(luò)要求是不同的,一般情況發(fā)現(xiàn)沖突每秒有三五次就應(yīng)該查找沖突的原因了。

(3)如果節(jié)點的物理連接正常,接口和線路協(xié)議報告運行狀態(tài)也正常,可是還是不能通信。原因可能是兩個節(jié)點使用了不兼容的幀類型。可以嘗試重新配置使用相同幀類型。

4.3異步通信口故障排除

互聯(lián)網(wǎng)絡(luò)的運行中,異步通信口的任務(wù)是為用戶提供可靠服務(wù),但又是故障多發(fā)部位。

異步通信口故障一般的外部因素是:撥號鏈路性能低劣;電話網(wǎng)交換機(jī)的連接質(zhì)量問題;調(diào)制解調(diào)器的設(shè)置。如果調(diào)制解調(diào)器丟失了它的設(shè)置,應(yīng)采用一種方法來初始化遠(yuǎn)程調(diào)制解調(diào)器。簡單的辦法是使用可通過前面板配置的調(diào)制解調(diào)器,另一種方法是將調(diào)制解調(diào)器接到路由器的異步接口,建立反向telnet,發(fā)送設(shè)置命令配置調(diào)制解調(diào)器。

show interface async 命令、show line命令是診斷異步通信口故障使用最多的工具。show interface async 命令輸出報告中,接口狀態(tài)報告關(guān)閉的唯一的情況是接口沒有設(shè)置封裝類型。線路協(xié)議狀態(tài)顯示與串口線路協(xié)議顯示相同。show line命令顯示接口接收和傳輸速度設(shè)置以及EIA狀態(tài)顯示。show line命令可以認(rèn)為是接口命令(show interface async)的擴(kuò)展。show line命令輸出的EIA信號及網(wǎng)絡(luò)狀態(tài):

noCTS noDSR DTR RTS:調(diào)制解調(diào)器未與異步接口連接。

CTS noDSR DTR RTS:調(diào)制解調(diào)器與異步接口連接正常,但未連接遠(yuǎn)程調(diào)制解調(diào)器。

CTS DSR DTR RTS:遠(yuǎn)程調(diào)制解調(diào)器撥號進(jìn)入并建立連接。

確定異步通信口故障一般可用下列步驟:檢查電纜線路質(zhì)量;檢查調(diào)制解調(diào)器的參數(shù)設(shè)置;檢查調(diào)制解調(diào)器的連接速度;檢查rxspeed 和txspeed是否與調(diào)制解調(diào)器的配置匹配;通過show interface async 命令和 show line命令查看端口的通信狀況;從show line命令的報告檢查EIA狀態(tài)顯示;檢查接口封裝;檢查信息包丟失及緩沖區(qū)丟失情況。

5結(jié)語

網(wǎng)絡(luò)發(fā)生故障是不可避免的。網(wǎng)絡(luò)建成運行后,網(wǎng)絡(luò)故障診斷是網(wǎng)絡(luò)管理的重要技術(shù)工作。搞好網(wǎng)絡(luò)的運行管理和故障診斷工作,提高故障診斷水平需要注意以下幾方面的問題:認(rèn)真學(xué)習(xí)有關(guān)網(wǎng)絡(luò)技術(shù)理論;清楚網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計,包括網(wǎng)絡(luò)拓樸、設(shè)備連接、系統(tǒng)參數(shù)設(shè)置及軟件使用;了解網(wǎng)絡(luò)正常運行狀況、注意收集網(wǎng)絡(luò)正常運行時的各種狀態(tài)和報告輸出參數(shù);熟悉常用的診斷工具,準(zhǔn)確的描述故障現(xiàn)象。

參考文獻(xiàn)

[1] 李江,戴金萍,彭婷.淺談醫(yī)院網(wǎng)絡(luò)常見故障的分類診斷[J].中國管理信息化,2010,(7).

[2] 莊保新.網(wǎng)絡(luò)中的常見故障診斷及分析[J].硅谷,2010,(8).

[3] 代樹強(qiáng).計算機(jī)網(wǎng)絡(luò)日常維護(hù)方略[J].硅谷,2010,(1).