路由器在当今互联网中的统治地位已经无可厚非了,在路由器的使用过程中我们总会遇到一些大大小小的问题,甚至有时让你寝食难安。那么在路由器出问题的时候我们应该有一套系统化的故障排除方法来帮助我们简化修复过程,所以我们今天就一起聊聊路由器故障排除。4 Q) V8 l; ]0 J+ z. u8 E. C
S* q5 C- E9 s) G
故障与排错
( [, X! }) c9 h8 U; ^
7 ?3 y9 [3 s! G+ C 想要明确的给“故障”和“排错”下个定义想来并不是一件容易的事,路由器的“故障”总是多种多样的,造成某种故障现象的原因也是多种多样的。有的场合要迅速地找到故障并加以排除,其要求是相当严格的。有些现象是设备在正常运行中出现故障的,另外一种情况就是当我们在实施某种应用,已经完成了配置,但却得不到预期的效果。我们把解决这些问题的方法叫做排错技术。因为它和路由器的配置是不一样的,所以排错技术需要在维护和管理路由器的过程中慢慢积累才能有所提高。一个系统化的故障处理技术就是合理地一步一步找出故障原因并加以解决。+ n# l% o b; e9 J: h: t
) x" ]2 v; }' w4 [7 i& {4 Y( `
思路* |3 I) r( v# |9 T& ~4 H6 l
% L0 e+ i. r+ u( S7 F4 H: v- k/ Q
1.路由器状态- S6 B+ z3 N" `
. Y. ^, x% m' N, m3 r* h' u) R
弄清楚路由器发生故障时处于什么状态,才能进行下一步操作。最直接的方法就是观察路由器上各种指示灯的工作状态,如果你不知道他具体代表什么意思,可以查看相应的用户手册。使用命令行界面和路由器直接对话能够得到更详细的信息,常见的路由器都可以使用“show”或“display”就可以显示路由器当前的工作状态和配置信息。总之弄清状况是一个最基本的要求。
/ q2 H* e! S/ ~" ^0 N) b" Y; Z8 X: E4 S* p
2.正常情况应该得到什么结果
) A; Z: t4 Y6 p) y8 j" l1 _9 J+ G7 |0 V: h, P
你首先应该明确你想让路由器做什么,并按照你的想法来配置路由器,以确认路由器应该可以实现什么功能。例如,你应该能ping通指定接口的地址吗?一个广播网上OSPF所有邻居应该是Full吗?在你调试完路由器后应该对这些问题能够正确回答,确认你想要的东西。. m8 v5 z2 }) t1 G7 p9 c7 t( p" w! z* B
4 I$ E! a; X# P! \7 p: Y# j
3.可能造成某种错误的原因
; U4 G& h( k& O2 E0 U/ R1 ?- N) o7 P# b/ K5 T$ M( J) q" z: P0 K
回答这个具有挑战性的问题光有勇气是不够的,更需要学识和经验。无论那种错误现象,其原因可能有多种,可能是一种故障,也可能是多种故障叠加。当然,对原因的全面可靠列举,需要对特定网络和设备的状况做全面的了解。你的知识水平和经验在此展露无遗。5 i. T2 z4 l9 ?! h' B
T# |7 _; P, q3 K C1 P) B 4.排除假象,寻找真凶
! D8 C8 C" M% w+ m I \) g# ?) @. ?, K$ Y8 z* x
对于一个故障,形成它的“原因”会有很多种,但并不意味着所有“原因”都发生问题。所以排除法就是最好的排错选择,我们可以归纳出下面的这种过程框图对它加以回答。
7 d8 l% G& t/ |, g& K' [
8 D6 b4 a8 Y9 O4 Q9 x* Y- G8 i 一个合格的网络工程师应该在处理故障的时候不断向自己提出问题,并且冷静地加以分析,最终提出方案并细心地逐一检验,最终解除故障,进一步增加自身的维护经验。
5 N) F/ D) t+ Z0 G( y/ ] Z6 ]5 {* s" h5 U6 N
理论# g1 \, x/ s% k* [ ?
" J6 C' q: l P; _* g; H0 D# a" N 单机故障还是网络故障?: p$ H! K) c# L+ } ?: U
" b4 l5 c6 B3 S 单机故障一般与设备以及附件的物理故障相关,比如电源的问题导致设备运行不正常,线缆的原因导致路由器接口不能正常检测到信号。软件处理存在缺陷也属于单机故障的范畴,假设处理过大的NAT HASH表或路由表,内存耗尽导致路由器瘫痪。
; G5 t9 ^* m+ v5 f
6 q3 @0 H$ i9 g8 C: f6 Q 路由器是网络互联的核心设备,所以不得不与整个网络相关联。比如,一个办公网络通过PSTN或ADSL拨号的方式访问Internet,需要正确地安装路由器并连接外部线缆,对路由器进行简单配置包括拨号程序配置,同样需要终端主机指定网关和DNS的地址。另外一方面,日益复杂的网络应用环境对网络设备的排错提出了更多的要求。所以在故障处理中,不论对于连通性的故障还是性能上的问题,都要全面系统地了解网络情况,进行综合性分析。
6 ^) H8 P6 g/ A' ]9 v+ R; X* e2 {& u' P9 N. |7 ]
路由器的物理故障
7 T2 j+ t. h; I0 z8 A% c4 D( G0 K- T# I
路由器的安装和使用注意事项应该严格按照安装手册进行。安装前应检查安装场所的温湿度、洁净度、静电、干扰、防雷击等要求是否满足;安装后应检查电源的输入电压幅值、频率、中性点的连接及保护地、接地电阻等是否满足要求。
! D" L: x) N, l+ `/ @* x
+ z: n% g) S3 q" h 安装后无法使用6 R* `0 B% p5 n; T# s
$ r. j4 p( ], L4 \+ ?/ J/ Z; Y8 H
*线路连接问题。如线路阻抗不匹配、线序连接错误、中间传输设备故障。
/ z8 l9 M0 u6 v
' }9 y+ E: w1 V# e. ` *与其它设备配合有问题。
; G! _" Q9 y. _+ R# M( K" F+ Q5 J7 [0 d. F- n4 A$ R
*接口配置问题。6 i- \ b$ `3 H) v8 [! O
/ L9 I, n; R5 x9 o6 o *电源或接地不符合要求。( I+ @$ ^6 Y- b
8 X; W8 v/ e1 q V) w *在安装过程也要考虑模块接口电缆所支持的最大传输长度、最大速率等因素。
, z8 m% W" X. l2 Z8 ]& e7 _9 t8 ?% \/ b: m
使用过程中发生故障
) b( N& |" |9 t# k; n- r4 }" `
! j, M' |1 T, ]+ G0 Z4 N8 ~" _0 B1 @) W *电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成器件损坏。5 O% |4 ]1 h* V3 f
- B- \" z" S3 M; d1 I3 ~' R7 b *传输线受到干扰。
: E" X+ F- K3 Y3 q D. G1 |8 C% L1 e) e; Y
*中间传输设备故障。) {# R% { m7 O) M% K$ y
3 }1 @& B) K! l+ C- V8 N2 s *环境的温湿度、洁净度、静电等指标超出使用范围。
, m; C+ H! k0 D. ^9 G5 }- L. p/ v9 P6 j$ W/ o
在故障定位的过程中,可把不必要的相连设备先去掉,缩小故障定位的范围,从而有利于快速准确地定位故障。1 Q! ~- a0 ^1 M% v
l7 z& j' ~! L7 Y3 P0 u, I& r 病毒攻击引起的故障9 q7 y1 Z' {& Q/ g
' E9 K) R; l6 q( L8 Q/ K8 c& q# n 网络环境变得复杂后,病毒攻击已经成为路由器排错和维护不得不考虑的因素。病毒和非法报文通过路由器转发,会占用路由器的大量资源。如果路由器的CPU 使用率过高,数据包丢包率高,你可以断开本地局域网,通过抓包等手段来判断是否有本地攻击的情况发生。根据这些攻击报文的特定在路由器上使用访问控制过滤非法数据包,一般会起到一定的效果。当然,最根本的解决方法是对本地计算机进行彻底地杀毒,但工作量也是巨大的。
" {, f# J! }( O6 M# n
& J4 t3 O- W- E* D. ? 排错工程是个复杂的工程,需要管理员有深厚的知识基础和技术水平,同时在处理十分复杂的故障时还需要耐心,细心和清晰的逻辑思维。在排错的过程中同时增加了管理员的经验,能为以后的工作提供帮助,使排错工程更加高效,更加正规,管理员同样能得到职业的满足感。 |