當前位置:工程項目OA系統(tǒng) > 泛普服務體系 > 泛普博客
網管員基礎知識:網絡故障排除參考大全
網管員基礎知識A.1.1 故障現(xiàn)象:網絡性能降低的同時伴有FCS差錯
CSMA/CD算法在沖突發(fā)生時會引起校驗和無效(即FCS差錯),在發(fā)生次數(shù)不多的情況下屬于正?,F(xiàn)象,因此FCS差錯與沖突同時發(fā)生、且發(fā)生次數(shù)在合理的范圍內時就無需擔憂。對于本故障現(xiàn)象,可以利用協(xié)議分析儀來檢測某段時間內沖突發(fā)生的次數(shù)與FCS差錯的次數(shù)并分析它們之間的特性曲線,如果在這兩者之間找不到對應關系的話,則可能是如下原因之一:
原因一:網絡中存在噪聲和干擾。
在網絡設備沒有接地或接地不正確的時候就會產生噪聲干擾,可以用電纜掃描儀或萬用表來檢測網絡中的噪聲電平。一個10Base2/10Base5網絡中只能有一個接地連線,如果還存在另一個連線接地(如網卡差錯或電纜損壞)的話,則由于兩個地之間存在壓降而引起電纜中的電流泄漏。
原因二:電纜路由上有電磁干擾。
復印機、電梯、手機以及尋呼機帶來的電磁干擾都可能會引起FCS差錯,可以用萬用表來檢測干擾情況并使用電纜測試儀來檢測噪聲情況。在檢測電磁干擾時,可以檢查電纜路由上是否存在電梯、電機、變電器、燈帶以及帶有高時鐘頻率或X射線儀器的計算機系統(tǒng)。
原因三:網卡有故障。
在檢查是否由網卡故障引起FCS差錯時,可以檢查按網絡節(jié)點排序的所有無效數(shù)據(jù)包(大多數(shù)協(xié)議分析儀都能自動生成這類標準的統(tǒng)計報告),如果發(fā)現(xiàn)某個節(jié)點比較可疑的話,則可以檢測該節(jié)點的活動率(以數(shù)據(jù)包/秒為統(tǒng)計單位)與該節(jié)點所處網段的FCS差錯發(fā)生次數(shù)。如果發(fā)現(xiàn)兩者之間存在某種對應關系,那就有機會找到故障源。需要記住的是,由于網卡故障經常是間歇性的出現(xiàn)(如網卡達到一定溫度時才出現(xiàn)),因此需要經過較長時間的監(jiān)測才有可能得到準確和重復出現(xiàn)的故障結果。
原因四:接頭(如NIC、墻插、MAU、中繼器、集線器等)松動或損壞。
定位這類故障源的方法就是仔細檢查網絡路徑上的所有連接情況。
網管員基礎知識A.1.2 故障現(xiàn)象:網絡性能降低的同時伴有滯后沖突
以太網中沖突次數(shù)的增加常常與線纜有問題(如線纜段過長)、網卡損壞、級聯(lián)的中繼器數(shù)量過多、終端電阻損壞或缺少等原因有關,如果能確定沖突屬于滯后沖突還是正常沖突,將有助于我們縮小故障源的范圍,滯后沖突的可能原因如下:
原因一:線纜長度超過了特定網絡拓樸所能允許的最大長度。
此時只需使用線纜測試儀測量一下線纜的長度即可。
原因二:網絡中級聯(lián)的中繼器數(shù)量過多。
可以用網橋代替其中的一個中繼器,或者改變網絡的配置。
原因三:網卡或MAU損壞。
利用協(xié)議分析儀收集發(fā)送無效數(shù)據(jù)包最多的站點的運行統(tǒng)計數(shù)據(jù),并收集沖突發(fā)生次數(shù)與活動站點的統(tǒng)計數(shù)據(jù)以檢查兩者之間是否存在對應關系,如果這些方法無法找到故障源的話,就必須使用網絡分段法來排除網絡故障了。
網管員基礎知識A.1.3 故障現(xiàn)象:網絡性能降低的同時伴有早期沖突
原因一:終端電阻損壞或缺失。
10Base2和10Base5以太網必須帶有50Ω的終端電阻,檢查網絡中所有需要終端電阻的地方是否均安裝了正確的終端電阻,其阻抗可以用萬用表來測量(阻抗值應介于48Ω~52Ω之間)。
原因二:T型接頭松動或損壞。
檢查網絡中的所有接頭,以確定是否有松動或損壞現(xiàn)象。
原因三:網絡中的節(jié)點數(shù)過多。
檢查每個網段中的MAU數(shù)量,一個10Baes2網段中最多不能超過30個MAU,而一個10Base5網段中最多也只能數(shù)據(jù)U譏2 /10Base5Mbit/s有100個MAU.
原因四:線纜被扭折。
可以使用線纜掃描儀來定位并替換被扭折的線纜。
原因五:電纜與IEEE 802.3不兼容。
IEEE 802.3的10Base5電纜每隔2.5米就以一種顏色加以標記,為了減少連接點處的反射干擾,接頭的插入點應選擇在這些顏色的標記處。此外要記住,并不是所有的BNC接頭都使用50Ω的電纜,盡管以太網能在75Ω的電纜上傳輸幾十米之遠,但是長度的增加遲早會引發(fā)網絡故障,因而在檢測網絡故障時要檢查所用電纜的規(guī)范。
網管員基礎知識A.1.4 故障現(xiàn)象:網絡速度慢、響應時間長(沖突與FCS差錯均處于正常范圍)
原因一:傳輸路徑上的網橋或路由器的緩存溢出。
檢查路由器或網橋的統(tǒng)計數(shù)據(jù)(如CPU使用率、端口使用率等),利用協(xié)議分析儀檢測哪個站點產生的經由網橋或路由器轉發(fā)的流量最大?是否有超時現(xiàn)象出現(xiàn)?一般可以用ping命令來測試通過網橋或路由器的響應時間,以查明網絡互連設備是否是引起故障的部分原因,如果是的話,就需要重新配置網絡(如將部分服務器或客戶機移到其他網段)以減輕重載互連設備的流量。
原因二:光纖鏈路的傳輸問題。
在光纖鏈路衰耗過大或發(fā)射光功率過低的情況下,如果光纖鏈路的傳輸距離過長可能會引起性能劣化(即使沒有出現(xiàn)任何FCS校驗差錯)。此時可以用ping命令來檢測有問題的光纖鏈路的響應時間,并檢查光纖耦合器及線路衰耗的設置情況。
原因三:存在本地網段路由。
本地路由是網絡速度減慢的常見原因,常常發(fā)生于子網地址不同、但連接在同一個LAN交換機下的兩個節(jié)點之間的連接上,且LAN交換機連接在一個路由器下,這種本地路由有時也稱為one-armed路由。此時,盡管這兩個節(jié)點均連接在同一個交換機下,但它們之間的數(shù)據(jù)包必須經過路由器的路由之后才能到達對方。
網管員基礎知識A.1.5 故障現(xiàn)象:間歇性的出現(xiàn)網絡連接故障、網絡性能降低以及幀對齊差錯。
原因一:網卡在每個FCS之后還發(fā)送了一些額外的比特。
可以使用協(xié)議分析儀捕獲在FCS之后有額外比特的數(shù)據(jù)幀(稱為dribble數(shù)據(jù)幀或幀對齊差錯的數(shù)據(jù)幀),從數(shù)據(jù)幀的源地址中就可以找到有故障的網卡。
原因二:最大傳輸距離超出了以太網的規(guī)范。
數(shù)據(jù)包能否到達最終目的地取決于發(fā)送站點和接收站點,在兩個站點相距較近時一般沒有什么問題,但是在兩個站點相距較遠、且處在同一個網段中時就有可能會出現(xiàn)連接問題。此時就需要盡力找出這類連接問題是否只與某些特定的節(jié)點有關,可以使用線纜測試儀來檢測傳輸路徑上的線纜長度和質量,必要時可以在傳輸路徑上插入一個網橋或路由器。
原因三:如果在傳輸路徑上級聯(lián)了過多的網橋或路由器,將會導致信號的傳輸延時增加和協(xié)議超時(如TCP超時),可以使用ping命令或響應時間代理來檢測響應時間。
網管員基礎知識A.1.6 故障現(xiàn)象:網絡連接出現(xiàn)間歇性故障的同時伴有短包。
原因:網卡有故障。
可以使用協(xié)議分析儀捕獲短包并從短包的源地址中找到發(fā)送節(jié)點,如果源地址字段損壞,則可采用前面講述的相關測試方法來找到有故障的網卡。
網絡管理人員基礎教程A.1.7 故障現(xiàn)象:網絡連接出現(xiàn)間歇性故障的同時伴有超時傳輸包
原因一:由于在10Base2和10Base5以太網中存在兩個接地連接,因而在網線中產生直流電流。
可以使用電纜測試儀來檢測網線中的直流電流。
原因二:網卡損壞。
網卡損壞有時會產生jabber數(shù)據(jù)幀(即超長數(shù)據(jù)幀),導致所處網段出現(xiàn)連接故障??蓮膮f(xié)議分析儀捕獲的jabber數(shù)據(jù)幀的源地址字段中找到失效網卡的位置。
網管員基礎知識A.1.8 故障現(xiàn)象:網絡連接出現(xiàn)間歇性故障的同時伴有幀間距過短現(xiàn)象
原因:幀間距過短引起數(shù)據(jù)包丟失。
如果以太網中的站點不能維持正常的最小幀間距(10Mbit/s以太網中為9.6μs,100Mbit/s以太網中為0.96μs)的話,某些集線器設備就無法正確處理接收到的數(shù)據(jù)包。此時,數(shù)據(jù)包有可能會轉變?yōu)閖abber數(shù)據(jù)包。在進行故障檢測時,可以用協(xié)議分析儀來測量幀間距(可由數(shù)據(jù)包的時間戳得到幀間距),之后,再從協(xié)議分析儀捕獲的數(shù)據(jù)幀的源地址字段中找到失效網卡的位置。
網管員基礎知識A.1.9 故障現(xiàn)象:經由網橋互連的傳輸路徑上出現(xiàn)間歇性的網絡連接故障
原因:由于網橋使用了負載均衡功能而打亂了數(shù)據(jù)包的到達次序。
檢查網橋的在必要時關閉網橋的負載均衡功能。
網絡管理人員基礎教程A.1.10 故障現(xiàn)象:經由路由器互連的傳輸路徑上出現(xiàn)間歇性的網絡連接故障
原因:路由器連接在重載WAN鏈路或所連接的WAN鏈路質量較差。
排除這類故障可以使用協(xié)議分析儀由器所連接的WAN鏈路的使用率,F(xiàn)CS差錯率以及誤碼率,此外,分析路由器端口的日志也有助于我們找到故障原因。
網管員基礎知識A.1.11 故障現(xiàn)象:單個節(jié)點與網絡失去連接
原因一:MAU與網線或網卡與網絡的連接松動或連接失效。
單個節(jié)點突然與網絡完全失去連接的主要原因如下:
l MAU連接松動;
l 連接電纜斷開、短路或有噪聲干擾;
l 網卡失效。
此時需檢查電纜、接頭、網卡是否有問題,在必要時應予以替換。為了確定故障是否是節(jié)點本身,可以用一個工作正常的節(jié)點(如筆記本電腦)完全替換到有故障的節(jié)點,如果網絡連接恢復正常的話,則表示故障源在節(jié)點內部,否則表示故障源在網絡側。
原因二:網卡配置有誤,如接頭激活有誤(如應激活AUI接頭的卻激活了雙絞線接頭)或選擇的中斷資源已被占用。
此時可利用ping命令(ping 127.0.0.1)檢查網卡的工作是否正常以及數(shù)據(jù)包能否被正確的發(fā)送和接收,此外,還應檢查最近是否有人在網絡中安裝了軟件或硬件。當然,也可以采用原因一中的方法,用一個工作正常的節(jié)點完全替換故障節(jié)點,以確定故障源在節(jié)點本身還是在網絡側。
原因三:網卡損壞或保險絲被燒斷。
使用外接MAU時需要檢查其電系統(tǒng)是否完好。使用ping命令(ping 127.0.0.1)來檢查網卡的工作是否正常以及數(shù)據(jù)包能否被正確的發(fā)送和接收。
原因四:不兼容的網卡把外接MAU發(fā)送的“心跳信號”當成是SQE信號,進而發(fā)生差錯。
此時,應監(jiān)視MAU上的LED,如果每欠發(fā)送數(shù)據(jù)時SQE LED都點亮的話,則應關閉MAU的心跳模式(也就是把MAU的工作模式從Ethernet 2.0切換到IEEE802.3)。
原因五:由于網橋工作于保護模式下而沒有激活學習模式,因而其老化功能將有故障的節(jié)點地址從地址表中刪除了。
原因六:網橋或路由器的過濾器設置不正確。
檢查過濾器的設置情況并與故障節(jié)點的地址相比較,以確定是否因過濾器的設置不當而引起了節(jié)點的連接故障。特別是在網橋使用了備份路徑或負載均衡機制之后,更應檢查過濾器的設置是否與這些功能相沖突。
原因七:MAC-IP地址映射有問題,這主要是由于靜態(tài)IP地址發(fā)生了變化或網絡中同時配置靜態(tài)IP地址和DHCP.
網管員基礎知識A.1.12 故障現(xiàn)象:網絡中的某個網段與其余網段之間失去了橋接連接
原因一:網橋的端口配置不正確(如端口沒有被激活、端口的運行模式不正確(如應為10Mbit/s的卻配成100Mbit/s)、連接失效(如電纜、接頭以及插板松動)或布線錯誤等)。
檢查網橋的安裝和配置是否正確。
原因二:由于網橋工作于保護模式下而沒有激活學習模式,因而其老化功能將有故障的節(jié)點地址從地址表中刪除了。
檢查網橋的地址表和工作模式(網橋的學習模式是否打開?)。
原因三:網橋或路由器的過濾設置不正確。
檢查網橋或路由器的過濾器設置情況,特別是要檢查使用了通配符的過濾項。
網管員基礎知識A.1.14 故障現(xiàn)象:客戶機出現(xiàn)間歇性的網絡連接故障
客戶機出現(xiàn)周期性的網絡連接故障,雖然能ping通,但數(shù)據(jù)包時有丟失。
原因一:NIC或交換機/路由器的配置有誤。
NIC或交換機/路由器的配置有誤,致使連接雙方工作在不同的工作模式下,此時應檢查NIC以及交換機/路由器端口的配置是否正確。
原因二:NIC或交換機/路由器的工作模式配置有誤(一方被配置為手動工作模式,而另一方被配置為自動協(xié)商工作模式)。
檢查NIC以及交換機/路由器的端口配置情況,避免使用自動協(xié)商工作模式。
原因三:主機忙或處于重載狀態(tài),服務器遇到問題。
檢查服務器的運行統(tǒng)計數(shù)據(jù)及其響應時間。
網管員基礎知識A.1.15 故障現(xiàn)象:10/100BaseT自動協(xié)商進程太過頻繁,吞吐量很低
原因:通信雙方未達成一致(一方為全雙工方式,另一方為半雙工方式)。
A.2 以太網中的常見差錯
下面以字母順序列出了以太網中最常見的故障原因:
l AUI電纜損壞;
l 網橋地址列表的配置不正確,網橋工作在保護模式下;
l 網橋過濾器設置不當;
l 網橋過載;
l 網橋的老化功能刪除了某些地址表項;
l 級聯(lián)的網橋或中繼器太多,從而引發(fā)超時和響應時間過長;
l 電纜長度超標;
l 連接器松動或損壞:接咔、墻插、MAU、Hub、網橋、路由器;
l 電磁干擾;
l 外部MAU損壞;
l 路由器、網橋或Hub的物理連接故障(電纜、連接器和插入模塊松動;背板上的電纜連接錯誤);
l 接地時;
l 幀間距過短;
l 網絡被多處接地;
l NIC配置不正確;
l 網橋負載均衡功能引起的數(shù)據(jù)包失序;
l 光組件(如光Hub端口)的功率時;
l 路由器的過濾器設置不當;
l 路由器配置不正確(端口未激活、協(xié)議未激活、運行模式不正確等);
l 路由器過濾;
l 路由協(xié)議屬性項配置不正確(如地址表、映射表、子網掩碼、默認網關、路由表和定時器);
l 路由協(xié)議的(OSPF Hello定時器、Dead定時器、IGRP Active定葉器的設置不正確);
l 終端電阻損壞或丟失(10Base2、10Base5);
l WAN鏈路中斷、過載或質量低劣(BER非常高)。
網絡管理人員基礎教程是新入門的網管員必學,只有掌握了這些網絡管理基礎才能當個合格的管理員
【推薦閱讀】
◆網管軟件專區(qū)
◆成功網管員必備素質軟件篇
◆網管基礎知識:如何關閉無線路由器的信號發(fā)射
◆合格的網管員必備的個人能力和技術知識
◆IT運維管理專區(qū)
- 1調查揭示中美日理想領導類型 中國重視人格魅力
- 2OA是應用型軟件,是實現(xiàn)全員信息化協(xié)同辦公的一種手段
- 3全球IT大鱷的創(chuàng)新方向
- 4成功的人會在上班的第一個小時做12件事
- 5中小企業(yè)的信息化自主開發(fā)之路
- 6知識管理測量框架及其相關概念
- 7泛普協(xié)同辦公OA系統(tǒng)采用的n-tier多層體系架構
- 8執(zhí)行力的三種境界和三個層次
- 9連鎖巨頭阿迪達斯虧了好多錢,不光是因為東西丑
- 10溝通對企業(yè)管理的作用
- 11計世獨家:煤炭企業(yè)狠抓CRM
- 12阿迪達斯養(yǎng)虎遺患
- 13圓通中通客戶信息網上仍在倒賣 涵蓋全國
- 14中國企業(yè)為何做不大
- 15財稅服務:47個省級國、地稅局試點網絡發(fā)票
- 16為什么小客戶也能找采納
- 17沖破家文化
- 18商業(yè)競爭核武器:思維逆反
- 19從趙武靈王的對敵方式看市場競合策略
- 20職場保鮮的10個錦囊妙計
- 21談倉庫管理中如何優(yōu)化庫存管理
- 22胡飛:我讓女人網上逛街
- 23調查:美國人婚禮成本飆升平均花費超3萬美元
- 24保險公司IT治理的是大數(shù)法則
- 25iPaaS是云計算應用部署的必殺技?
- 26中小企業(yè)如何低成本啟動客戶關系管理系統(tǒng)
- 27用戶對OA的理解及應用仍然停留在表象層次
- 28反思你的托管型CRM數(shù)據(jù)是否安全
- 29金融危機下ERP決策如何做
- 30連鎖便利店在中國的發(fā)展優(yōu)勢及思路拓展