当前位置:首页 > 技术与方案 > 网络管理相关

单链路故障系列之桌面链路故障(一)

(2012-09-05 07:02:41)

作者:尹岗

网络建成以后其结构不是一成不变的。网络的拓扑结构、网上用户的规模、网络设备的数量和种类、网上设备的应用等都可能随时发生变化。这些变化有些则会涉及到网络的基础结构—物理链路。从本期起的一组文章将专门讨论单条物理链路因各种原因被改变后所引发的各种常见问题以及诊断这类故障的简单快捷的方法,这些方法会到使用一些常用的快捷测试工具,比如TDR时域反射测试工具、端口状态测试工具、链路错误检测工具等等。我们将举出几个实际例子。
局域网因为用户数量日渐庞大,网管人员经常会面临增加新用户(工作站/PC和服务器等)、删改网络配置、升级网络设备和网上设备、调整网络拓扑结构、系统扩容、增加网络设备、更改网络设备配置等工作,这些工作都可能会对网络用户和网络设备、网上设备的物理链路进行更新或连接方式的改动。另外,由于实施建筑物的内部结构变动工程、新的物业装修工程或临时的其它物业工程,在施工过程中也可能会对计算机网络的基础物理链路造成不良影响。比如,因物理链路(电缆/光缆)的数量、路径方向和长度的改变而引发的新的物理链路问题,链路器件在施工过程中遭到人为的破坏和损伤,链路因调整路径而出现接触不良的现象,跳线被人为更换或有意无意地损坏、插座和打线模块因用力牵拉而松脱,电缆遭意外的碰撞和碾压而导致受伤或破损等等。部分原先连接质量有问题的链路也可能随着环境温度和湿度的变化而出现接触不良、衰减变化过大等异常现象。
还有一部分常见原因就是受纯粹的人为因素的影响,比如某用户仅仅因为喜欢服务器上的彩色跳线而擅自用一根临时找来的跳线替换下了服务器跳线造成接触不良或速度问题;某个维护人员因为增加了一台刀片服务器而重新捆绑了近旁的电缆模块的连线;由于重新更改电话系统的许多新用户端口而调整了配线架上的网线;扩容施工过程中不小心碰倒了一个机柜而拉伤/砸伤了电缆及其连接模块等等,这些都是网络维护管理过程中经常会遇到的实际问题。另一类特别的原因则来自生物性损害,比如虫吃鼠咬造成链路中断或者链路某个部位短路等等。其中,被啮齿类动物如老鼠等为了满足其磨牙的嗜好而细嚼慢咽造成链路中断的现象在此类原因中所占比例比较高。
因设备端口老化,比如网卡、交换机端口老化,可能造成设备端口的信号发射能力下降,导致链路连接中断或者造成端口的工作状态改变。比如,从100Base-T变成10Base-T,由全双工变成半双工等,有的则可能造成链路的出错率大大增加;由于电缆路径改变,电缆受伤、接触不良、工作环境变化等也都有可能造成设备端口的改变;其它许多相关活动都有可能造成端口工作状态的改变。比如,当我们更换用户端设备(或直接更换网卡)、更换交换机等网络设备时也可能造成端口工作状态的变化;用户将驱动程序特别是网卡驱动程序改变,或者将操作系统升级进而导致驱动程序改变,升级驱动程序造成网卡端口工作状态改变,升级主板程序造成网卡匹配问题导致端口工作状态改变,恶意的黑客或病毒程序造成端口工作状态改变等等。
以上凡此种种,都可能导致链路的物理状态和链路两端设备的端口状态发生改变,这种改变有时候是经常性的,网络维护人员也是无法回避的。多数情况下,我们会凭借经验对这些问题进行处理。最常使用的方法是替代法,我们用这样的方法来对物理链路进行一些故障排除的工作,我们也经常会使用对比法来比较链路或设备的差异性,以便确定是链路的问题还是设备故障而引发的问题。但是,端口的改变和物理链路的改变有时候仅凭经验是很难快速确定的,主要的遗憾就在于处理这类故障所要花费的时间是非常惊人的,我们可能仅仅因为一个插座的松动所引起的链路中断故障,而耗费整整2-3个小时的时间—这对多数对可靠性要求高、排除故障有时间压力的维护人员来说是不能接受的,他们希望能够在几分钟内就能确立这类故障的准确位置。所以,有效的测试方法和快捷易用的测试工具,对于快速诊断这类故障以及缩短宝贵的诊断时间是必要的和有助的。
下面的一组对话将许多网络管理人员和网络维护人员所碰到的有共性的一些问题进行了有代表性的归纳、总结和演绎。针对这些共性问题我们将介绍一些简便、直接的检测的方法,以改变现在被广泛采用的试探、替代和比较的方法(这些方法在没有检测工具时被广大维护人员经常性地采用),从而不致于使用户继续延用耗时费力的方法去查找一个简单的物理链路问题或设备端口一类的常见链路问题。
小张和小杨是一对好朋友,分属在两家不同的公司,干的却是一样的工作。各自负责管理本公司的网络,负责网络设备的维护,网上设备的安装,用户的配置,文档备案,故障诊断,网络升级改造等各种具体事务。下面的对话是他们在处理几起故障的过程当中遇到的一些典型故障的描述。为了简便起见,我们将以小张、小杨来代表对话的双方,客串:Daisy、Lucy......等。

小张(拿起电话): 喂,您好,您是哪位?
Daisy:小张呵,我是Daisy,我的机器现在上不了网了,请你过来帮我看看好吗?(小张从20楼来到13楼Daisy的机器旁)
小张:你的机器怎么了?
Daisy:我的机器联不上网了。
小张:哦?我来看看。让我先做一个Ping看看......好像不通,让我再Ping一下网卡的环回地址127.0.0.1—是通的。你的网卡基本上是好的,可能这条电缆有问题,造成数据信号送不出去。
Daisy:不会吧!我每天都用电脑,这些电缆线我可是从来不去动它的。
小张:那有没有别人动过你的跳线或网卡之类的东西。
Daisy:应该没有,我从来不敢动,也不让别人动,我的机器设有开机密码。我怕别人弄坏了麻烦,影响我的工作,所以一直都是小心翼翼地看护这台机器。
小张:让我看看你的网卡。好像网卡灯不亮嘛,这说明网卡没有收到对端送来的数据信号。这条线可能真的出了问题。
Daisy:是吗?这条线我真的是从来都不动它的,也不让其他人用的。
小张:不好说,让我来检查一下吧。你这里有笔记本电脑吗?
Daisy:小周那里有,就是我们的小老板。
小张:那请你去向他借来用一下吧,让我来看看这个端口上的网卡指示灯为什么不亮,我来比较一下,如果接上笔记本后端口灯亮了,就说明是你的机器有问题。
Daisy:好的。(过一会回来)啊呀!小张,我们小老板他正在用机器,他说要等一会儿,你可不可以等十分钟。
小张:可以的,我们就等他十分钟,我现在正好先到配线柜那边去看看那里的交换机,看看端口上的指示灯是不是也不亮。Daisy,你知道你这条线连到那边交换机的哪个端口上吗?
Daisy:不知道,我可搞不清楚,你这里不是有个表格吗?就是我上次见你给 Shirley排故障时拿的那张,上面写着哪条电缆是连到哪里去的。
小张:我那里是有一份,但从十楼到十四楼的没有,有的都是以前的旧的,去年你们搞过升级改造,是你们小老板亲自负责的。他请人来做的,没有让我们部门插手,所以我没有这个清单。
Daisy:那好,我去问问他,看看他那里有没有。(过一会回来)小张,还不错,老板他那里有一份这样的清单,让我拿来了,你看看是不是这张。我这条办公桌是接到三号交换机的17号口上,我陪你到配线间去看一下吧。
小张:好的。(一起来到配线间)啊呀,17号端口灯亮着,看样子这条链路没有问题。
Daisy:那可怎么办呀,我今天还要赶着做好几个合同呢?
小张:你尽管放心,对我来说这种小CASE不会费什么事的,一会儿就好!你赶紧问问你们小老板电脑还用不用,如果他还继续用,那我们就只能把其他人的台式电脑用长跳线接过来对比一下看看了。
Daisy:好的。(过一会回来)小张,电脑我拿来了,你来试试吧。
小张:线接好了,开机。来看看网卡指示灯亮不亮。糟糕,指示灯还是不亮,看样子你这台机器本身没有什么问题,而是联接这台机器的电缆好象有点问题。
Daisy:哦?那怎么会呢?你刚才不是说17号端口的指示灯亮着电缆没问题呀?
小张:别着急,我来帮你仔细看看。我们现在把笔记本拿到配线间去,直接接到17号端口,来看看17号端口是否有问题,如果17号端口没什么问题,那就证明这条电缆确实有问题。(一起来到配线间,过了一会儿)你看,灯亮了,而且可以上网浏览网页,说明17号端口真的是好的,那就证明是联接你机器的这条电缆确实有问题了。
Daisy:可17号指示灯是亮着的呀,说明电缆是通着的耶!
小张:那到不一定。根据我的经验,有时候端口灯亮着并不等于能Ping通。因为电缆中有两对双绞线被使用,其中一对不通也会联不上。17号端口灯亮着只能说明你的信号可以送到交换机,但不能证明交换机的信号能送到你的网卡!等一下,我这里有一个专门测通断的小工具,让我来测测看。现在请你到你的工位上去,配合我把这个小东西接到那里的跳线水晶头上,我在这边进行测试。
Daisy:好的。
小张(连接好以后):你看仪器,所有的线对对应的灯现在都不亮了,这说明这条链路当中所有线对都断了。请你仔细回想一下,昨天有谁动过你的机器或在配线间调过机器。
Daisy:不知道,应该没有人调过。
小张:那好吧,我来检查跳线,或者换一根跳线试试看。你看,测试跳线时仪器上的灯都亮了,说明你这条跳线是好的,我们再来看一看配线间上的设备跳线是不是好的。很好,所有灯都亮了,这说明两端的跳线都是好的,那么电缆是在哪里断的呢?
Daisy:是啊,到底是在哪里断的呢?
小张:让我想想看。整个电缆链路中最有可能在插座这个地方有问题,或许你那里的墙插座连接不好,让我先动一动或者干脆拆开来看看。(重新摇动和插拔电缆,无效)我还是先拆开你这边的插座看看吧。(过了一会)好象你这边的插座没问题,插座模块里面的线也是连着的,应该不会有什么问题。
Daisy:那怎么办?
小张:那我们只好再拆开配线间设备跳线插座模块上的线看一下,或者重新把线打一遍。(经过一阵操作过程后)奇怪,17号端口跳线连着配线架上的插座模块也很好,看不出有中断或连结上的问题。
Daisy:那到底是哪里断了呢?你不是说要把连接端口模块的线都再打一打看看吗?
小张:我刚才已经打过了,也许已经好了呢!再看一看。(过一会)不好,还是不通。
Daisy:这可怎么办呢?到底是哪里断了,有没有办法知道?
小张:办法是有,但是我手里没有这种工具(此时有人找小张接电话,小张去接听电话,过了一会儿)。Daisy,你给我的这个清单可能有问题。
Daisy:为什么?
小张:你想一想呀,我们刚才把所有相关的线都重新清理打过了,但是线还是不通,如果清单上17号端口是对的,按理它应该通的,而如果17号端口不对,我们检查跳线的时候,就可能让原先连接到17号端口的用户出问题。所以,刚才给我打电话的14楼的王小姐弄不好就成了受害者。
Daisy:那不是更麻烦了吗?原来的链路还没有弄好,又弄出新的问题。
小张:是呀!我先到14楼王小姐那里看一看,看是不是她的计算机网卡端口的指示灯也不亮。(3分钟后回来)Daisy,王小姐的网卡端口果然不亮,看来17号端口真的不是你的机器,而是王小姐的机器。我们赶紧把17号端口的跳线重新接上吧,好!亮了!我给我小姐打个电话问一下。
Daisy:奇怪了!17号端口是王小姐的,那我的机器端口连到哪里去了呢?
小张:鬼才知道!你看看清单的时间,是去年6月份的,清单上的设备备案早就不对了,有没有最新更新过的比较准确的清单。
Daisy:没有,小老板说他只有这几张,还是原来管电脑的Penny留下来的。不过确实是去年升级调整过以后的清单。
小张:那Penny有没有告诉小老板他动过哪些设备和连接跳线呢?
Daisy:小张呀,求求你!我怎么会知道这些细节问题呢?你今天无论如何要帮我把这机器弄好呀,否则我就惨了!我要先从服务器上下载文档,然后把做好的文件和合同传上去。如果今天做不完,那晚上还得加班。
小张:不用这么着急,你可以用软盘拷贝到别的机器上,然后直接从别的机器上上传文件不就可以啦?
Daisy:那不行,我的文件很大,早超过2M了,软盘装不下。再说,上传有机器权限限制,不一定能行的。
小张:应该没问题,我这里有U盘,可以用U盘拷贝过去。
Daisy:我的机器没有USB接口。
小张:那就用交叉线直接对拷,速度很快,也很方便。我这里有一根交叉线(级联线),你现在可以到旁边的机器上上网操作,需要的数据我现在就帮你用交叉线从你这台机器上传过来。(连线对拷操作)
Daisy:太好了,我现在就继续操作,而您可以接着查故障,两不耽误。
小张:好的,真是个好主意。不过让我先把17号端口恢复,这样14楼的王小姐就可以继续她的工作,而我也可以集中精力查找真正的故障所在。

配线间的交换机端口有一百多个,小张查了好长时间,也没有找到Daisy小姐的电缆到底连接到那个交换机端口上。小张感到有些为难了,他想起了好朋友小杨。小杨在另一家公司做专职网络主管,他赶紧拿起了电话。

小张:喂,小杨呀!快来帮我一下吧,我遇到麻烦了!
小杨:怎么啦?
小张:我这里有一条电缆不通了。
小杨:那好办呀,测测通断呀!
小张:测了,结果发现电缆号码和文档清单上的不一样。现在我无法找到这条电缆在哪里?
小杨:那就是电缆不通了,你可以先换换跳线啊。
小张:换了,不行。
小杨:对边也要换换看。
小张:也换过了。墙插座和设备插座我也检查并重新打过线了,他们小老板给我的那张设备连结清单根本就不对,去年他们升级设备的时候就没有让我们参加。
小杨:你可以插拔用户这端的跳线,看看交换机那个指示灯熄灭,那个就是。你还可以拷贝一个大点的文件,看看交换机上哪个指示灯闪得厉害也那个就是。
小张:现在是连都连不上,哪还能拷贝什么文件,再说了,即便是能连上,我看那指示灯都在不停地闪,也很难看出是哪个灯对应的。17号端口实际上是连接到14楼王小姐使用的机器上的。
小杨:那你来我这里方便吗?
小张:如何?
小杨:我这里有一个工具,可以测试电缆的长度,还可以从仪器上发送音频信号到电缆上,到对端用一支音频探测笔靠近电缆就可以检测到相应的音频信号,其他没有音频信号的电缆则不会感应到信号,也就不会使音频探测笔发出特有的声音。这样当你在一堆电缆中移动探测笔时你就可以很快地找出哪一条电缆是你要找的电缆啦—声音最响的就是。
小张:哦!有这么好的东西怎么没有听你说起过?
小杨:我也是最近才搞到手的,还没有来得及跟你说呢。这可真是个好东东,你过来我教你怎么使用。算了,我叫个快递给你送过来,然后在电话里面教你怎么个用法,操作非常简单的。
小张:太好了!赶紧送过来呀!

不一会儿小张拿到了机器——一个叫网络联路通“Link Runner”的小东东。小张先把它接到了Daisy的机器跳线上,仪器显示被测电缆的长度为73米,不过,其中3-6线对(绿白线对)的第3号导线只有66米,因此小张判断第3号导线应该是在距离Daisy机器66米的电缆距离上开路了,根据距离判断应该是在离交换机端口7米的地方开路,由于已知使用的设备跳线长度为3米,所以导线中断点应该在距离配线架4米远的地方。
小张用仪器的音频发生器向电缆链路中发送音频信号,然后用探测笔靠近配线架扫描,很快音频探测笔就感应到了信号—用了不到10秒钟就找到了Daisy的机器在交换机上的端口4号交换机的17号端口而不是3号交换机的17号端口,从4号交换机17号端口一路找过去。小张在离配线架4米靠近墙角的电缆向上转弯地方发现电缆外皮已经被老鼠咬破了,其中绿色线对的那根白/绿导线已经被老鼠已经咬断了。小张用小电烙铁把断线仔细焊接好,包好外皮,Daisy的机器立刻恢复了正常。

小张(拿起电话):小杨,我的问题已经找出来了。这个工具真的很好用,你要是早告诉我就好了,省得我花这么多的时间去东查西查的,最多5分钟我就可以找到问题出在哪里!
小杨:是呀,这个工具可以测长度,根据长度就可以很快找到开路点的准确位置,用不着把跳线换来换去地瞎折腾了。
小张:而且可以用音频探测功能迅速找到一大堆电缆中的某根你想找的电缆,真是太爽了。我在想,如果让我从配线间的几千根电缆中去找一根电缆,我现在也不会感害怕了。小杨,真是太谢谢你了!
小杨:咱哥们,不必客气啦!
小张:机器先不还给你。我呆会儿还要把13楼和14楼的标记错误的电缆链路全部用音频探测功能探测一遍,给他来个彻底大清洗,免得以后又找不到线连到哪里去了,麻烦死了!
小杨:是呀,早知有这样的测试工具和测试方法,就不会浪费如此多的时间了。
小张:是的。不过,Daisy小姐对我还不错,她说午饭她请了。这得多谢你的暗中相助,再多花点时间也许效果更好!哈......
小杨:不够意思!

尹工点评

小杨在处理本故障时遇到了几个本可以避免的麻烦。
其一是缺乏准确的文档备案资料。高水平的网络管理都十分重视为网络设备、网上设备随时提供准确的文档备案资料。同时还能提供网络基准测试,综合布线认证测试、网络认证测试,网络设备配置、网上设备配置、软件安装及配置、系统安全设施配置、网络规划方案、网络优化方案等等及时准确的配置。提供网络文件存储备份机灾难恢复方案等准确文档。这些文档为准确地判断故障位置和性能问题的确切原因将提供便捷准确地帮助,但不准确的文档则有可能事与愿违,造成进一步地混乱并延误大量时间。
其二是缺少一些必要的测试工具,像TDR时域反射测试工具,这是测试长度的必备工具。而很多物理链路的故障诊断都与长度测试密切相关。替代法是没有工具时的常用方法之一,但有些测试是用替代法所不能准确定位故障位置的,只能大致了解故障的属性而已。

更多
关闭窗口 打印 
网站首页    -    联系我们    -   收藏本站    -    网站地图                                                               客户服务热线:0571-85023000
本网站所有网页信息已申请知识产权和著作权保护,版权归四海光纤公司所有,未经授权禁止任何人复制或镜像,违者必究。
公司主营:杭州光纤光缆视频会议系统,是专业的通信网络工程、视频会议系统建设专家

中华人民共和国备案号:浙ICP备10018243号