第一篇:网络故障分析报告(写写帮整理)
网络故障分析报告
一、1XXXX转5故障现象描述
该网络有9台计算机,采用一台S3XXX通过迎宾苑S8XXX接入DCN网络,在今天出现个别机器断网的现象,具体现象为隔一段时间就有一台或几台机器DCN网络中断,重启或者拔掉网线再接上恢复正常。
二、网络故障分析及定位
从上面描述的故障现象来看,问题似乎与S3XXX下9台计算机有关(在此前联系马晓伟从高科技机房测试无丢包、断线等现象,网络正常)。
为了首先恢复业务的正常使用,对S3XXX做了如下操作。
1、因为昨天刚从此S3XXX上21口开LAN业务供9XXXX做互联星空测试使用,所以怀疑是否21口上网有病毒感染到局域网。首先对S3XXX各个端口做了端口隔离,做完之后故障现象依旧。
2、由于做端口隔离故障依旧,而计算机都是上一会就断,重启后又可以上网,和马晓伟联系后怀疑为ARP地址欺骗攻击,建议做端口绑定操作。随后对4号机1号机做端口绑定(做完这两个笔记本没电了,在给笔记本充电过程中对网络进行观察)。
3、从19:00-20:00计算机网络使用正常没有发生过断线情况,同时对4号机进行病毒查杀,通过卡巴斯基查到两个病毒,一个是木马程序Trojan_Downloader.JSIstBar.aj,另一个是蠕虫病毒。
三、对故障现象的解释
S3XXX下计算机刚开机上网正常,一段时间后发生断线情况,重启或重新拔插网线后正常。
现象解释:“ARP欺骗”类病毒在局域网中屡有发现,具体表现为,当局域网中一台计算机感染了这类ARP病毒或木马后,会不定期的发送伪造的ARP响应数据报文和广播报文。受感染的电脑发出的这种报文会欺骗所在网段的其他电脑,对其他电脑宣称自己的mac就是网关的mac,对实际的网关说其他电脑ip的mac就是自己的mac,这样网关(交换机或路由器)无法学习到上网主机的mac,更新不了网关arp表,就无法转发数据帧。电脑中毒后会向同网段内所有计算机发送ARP欺骗包,导致网络内其他电脑因网关物理地址被更改而无法上网,被欺骗电脑的典型症状就是刚开机能上网,几分钟后断网,过一会又能上,或者重启一遍电脑就可以上网,一会又不好了,如此重复不断,影响正常使用。
第二篇:学习计算机网络故障分析心得体会
学习计算机网络故障分析
心得体会
在3-10周我选修了“学习计算机网络故障分析”的课,通过课程我学习了:计算机无线网络故障与排除;计算机网络故障与排除与网络诊断工具;计算机网络层故障与排除;计算机物理层故障与排除;计算机数据备份;计算机网络故障检测与排除方法的知识。也在上课的过程中了解到平时自己电脑出现故障时要冷静的对待。在无线网络出现故障时,我们应该分析可能出现的故障。如排查连接线路,解决只发不收故障。排查连接方式,解决间歇断网故障。排查连接位置,解决上网迟钝故障。对这些可能出现的故障进行逐一查看,一步步的检查和分析,从基本开始。例如:在无线访问操作时,发现访问速度非常缓慢的话,我们应该进行两方面的排查操作。首先排查确认的是我们当前访问的WEB服务器是否正处于繁忙工作状态,要是处于繁忙工作状态的话,我们唯一能做的就是尽量避开上网高峰期;要是在任何时段访问WEB服务器时,访问速度一直很缓慢的话,那多半是无线传输信号比较微弱引起的。而导致无线传输信号比较微弱的最主要原因,往往就是无线路由器设备的连接位置摆放不当;为了尽可能提高无线信号的强度,我们一定要将无线路由器设备摆放在一个位置相对较高的地方,而且确保该设备与工作站之间不能有较多的水泥墙壁,不然无线信号的传输很容易受到外界干扰,导致信号衰减幅度巨大,从而影响无线上网的访问速度。
出现故障与排除我们应该从网络本身来说,经常会遇到的故障有:无力层故障;数据链路层故障;网络层故障;以太网络故障;广域网络故障;TCP/IP故障;服务器故障;及其它业务故障等。其中引起这些故障的原因有几种:一是逻辑故障,二是配置故障,三是网络故障,四是协议故障,五是DOS攻击,六是网络管理员的差错,七海量存储问题,八计算机硬件故障,九软件故障,十使用者发生错误。
在这些故障中,我们一步一步的诊断。而故障诊断有:确定故障的具体现象,分析造成这种故障现象的原因;收集需要的用于帮助隔离可能故障原因的信息,从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集;根据收集到的情况考虑可能的故障原因,排除某些故障原因;根据最后的可能故障原因,建立一个诊断的计划;执行诊断计划,认真做好每一步的测试和观察,每改变一个参数都要确认其结果。
故障诊断后,我们要进行故障的排除。首先识别收集故障的现象。对故障现象详细描述。对计算机设备本身的运行状况进行检查。列举可能导致错误的原因。缩小搜索范围。隔离错误。
诊断的软件工具有网络监视器、协议分析器、性能监视器。诊断的硬件工具有数字电压表、网络测试仪、时域反射计、高级电缆检测器、其它硬件工具等。
网络故障中常用的测试命令有ipconfig、ping、tracert、netstat、和nslookup等。ipconfig命令可以查看IP配置,或配合使用/all参数
查看网络配置情况。ping命令主要是用来检查路由是否能够到达某站点。tracert命令用来检验数据包是通过什么路径到达目的地的。netstat命令可以显示有关统计信息和当前TCP/IP网络连接的情况,用户或网络管理人员可以得到非常详尽的统计结果。nslookup命令一般是用来确认DNS服务器动作的。
既然网络会出现故障,所以我们就应该有管理。对网络进行监测,提前预知故障;发生故障后,找到故障发烧的位置;解决故障;记录故障产生的原因,找到解决方法;故障分析预测。还有对计算机里面重要的数据进行备份,以免丢失。
在上完课后,我体会到在平时我们使用计算机的时候,我们应该多注意自己的计算机的安全,而且还要经常的去查看和检查自己的计算机,以免出现不必要的故障。还有就是在平时多学习一些计算机的防护知识,以便对自己的计算机进行维护。
第三篇:典型的网络故障分析、检测与排除
典型的网络故障分析、检测与排除
摘要:
网络故障极为普遍,故障种类也十分繁杂。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断及排除进行了阐述。根据网络故障的性质把网络故障分为物理故障与逻辑故障。其物理故障也就是网络设备的故障。其逻辑故障是网络中配置管理的错误。也可根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。本文主要介绍路由器故障、配置故障、及连接故障的诊断与排除。通过运用工具和方法分析出导致网络故障的主要原因,及解决方法。
关键词:计算机网络,网络故障,分析诊断,物理类故障,逻辑类故障 引言
计算机网络故障是与网络畅通相对应的一个概念,计算机网络故障主要是指计算机无法实现联网或者无法实现全部联网。引起计算机网络故障的因素多种多样但总的来说可以分为物理故障与逻辑故障,或硬件故障与软件故障。采取有效的故障防预措施网络故障目前已经成为影响计算机网络使用稳定性的重要因素之一,加强对计算机网络故障的分析和网络维护已经成为网络用户经常性的工作之一。及时进行网络故障分析和网络维护也已经成为保障网络稳定性的重要方式方法。本文从实际出发,即工作中遇到的网络故障,描述了通过运用网络知识进行故障排除。按照故障现象—>故障分析-->故障解决的研究路线阐述了如何在实际中排除网络故障,及其在网络安全的应用中的重要性。
本文着重讲解了网络故障的排除方法,通过运用解决问题的策略与排除故障的思路在故障现场很快的检测出是属于哪种故障然后再基于故障提出方案给予解决。正文:
一、网络故障
(一)物理类故障
物理故障,是指设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。比如说,网络中某条线路突然中断,这时网络管理人员从监控界面上发现该线路流量突然掉下来或系统弹出报警界面,这时首先用ping检查线路在网络管理中心这端的端口是否连通,如果不连通,则检查端口插头是否松动,如果松动则插紧,再用ping检查,如果连通如故障解决。这时须把故障的特征及其解决步骤详细记录下来。也有可能是线路远离网络管理中心的那端插头松动,则需要通知对方进行解决。
另一种常见的物理故障就是网络插头误接。这种情况经常是没有搞清网络插头规范或没有弄清网络拓扑规划的情况下导致的。比如说网络插头都有一些规范,只有搞清网线中每根线的颜色和意义,才能做出符合规范的插头,否则就会导致网络连接出错。
另一种情况,比如两个路由器直接连接,这时应该让一台路由器的出口连接另一路由器的入口,而这台路由器的入口连接另一路由器的出口才行,这时制作的网线就应该满足这一特性,否则也会导致网络误解。不过像这种网络连接故障显得很隐蔽,要诊断这种故障没有什么特别好的工具,只有依靠经验丰富的网络管理人员了。1.线路故障
在日常网络维护中,线路故障的发生率是相当高的,约占发生故障的70%。线路故障通常包括线路损坏及线路受到严重电磁干扰。
排查方法:假如是短距离的范围内,判定网线好坏简单的方法是将该网络线一端插入一台确定能够正常连入局域网的主机的RJ45插座内,另一端插入确定正常的HUB端口,然后从主机的一端Ping线路另一端的主机或路由器,根据通断来判定即可。假如线路稍长,或者网线不方便调动,就用网线测试器测量网线的好坏。假如线路很长,比如由邮电部门等供给商提供的,就需通知线路提供商检查线路,看是否线路中间被切断。对于是否存在严重电磁干扰的排查,我们可以用屏蔽较强的屏蔽线在该段网路上进行通信测试,假如通信正常,则表明存在电磁干扰,注重远离如高压电线等电磁场较强的物件。假如同样不正常,则应排除线路故障而考虑其他原因。2.端口故障
端口故障通常包括插头松动和端口本身的物理故障。排查方法:此类故障通常会影响到与其直接相连的其他设备的信号灯。因为信号灯比较直观,所以可以通过信号灯的状态大致判定出故障的发生范围和可能原因。也可以尝试使用其它端口看能否连接正常。3.主机物理故障
网卡故障,笔者把其也归为主机物理故障,因为网卡多装在主机内,靠主机完成配置和通信,即可以看作网络终端。此类故障通常包括网卡松动,网卡物理故障,主机的网卡插槽故障和主机本身故障。
排查方法:对于网卡松动、主机的网卡插槽故障最好的解决办法是更换网卡插槽。对于网卡物理故障的情况,如若上述更换插槽始终不能解决问题的话,就拿到其他正常工作的主机上测试网卡,如若仍无法工作,可以认定是网卡物理损坏,更换网卡即可。
网络硬件故障的分析与诊断方法
网络中的硬件故障比较复杂,现就日常工作中常见的网络连线问题和网卡问题来进行探讨。如,网线至交换机或集线器之间的故障分析与诊断方法,故障诊断:通过看网卡指示灯集线器指示灯。首先,检查网线是否插好;其次,若有数台工作站同时出现网络故障,则有可能是连接这些计算机的交换机或集线器出故障。如,网卡故障,故障分析:这是最常发生的问题。如网卡设置错误,网卡在安装过程中是否正确地设置中断号,I/0端口地址,驱动程序是否出错,网卡是否出故障等。
(二)逻辑类故障
逻辑故障中的最常见情况是配置错误,也就是指因为网络设备的配置错误而导致的网络异常或故障。
1、一些重要进程或端口关闭
一些有关网络连接数据参数得重要进程或端口受系统或病毒影响而导致意外关闭。比如,路由器的SNMP进程意外关闭,这时网络治理系统将不能从路由器中采集到任何数据,因此网络治理系统失去了对该路由器的控制。或者线路中断,没有流量。排查方法:用Ping线路近端的端口看是否能Ping通,Ping不通时检查该端口是否处于down的状态,若是说明该端口已经给关闭了,因而导致故障。这时只需重新启动该端口,就可以恢复线路的连通。
2、主机逻辑故障
主机逻辑故障所造成网络故障率是较高的,通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。
(1)网卡的驱动程序安装不当。网卡的驱动程序安装不当,包括网卡驱动未安装或安装了错误的驱动出现不兼容,都会导致网卡无法正常工作。
排查方法:在设备治理器窗口中,检查网卡选项,看是否驱动安装正常,若网卡型号前标示出现“!”或“X”,表明此时网卡无法正常工作。解决方法很简单,只要找到正确的驱动程序重新安装即可。
(2)网卡设备有冲突。网卡设备与主机其它设备有冲突,会导致网卡无法工作。排查方法:磁盘大多附有测试和设置网卡参数的程序,分别查验网卡设置的接头类型、IRQ、I/O端口地址等参数。若有冲突,只要重新设置(有些必须调整跳线),或者更换网卡插槽,让主机认为是新设备重新分配系统资源参数,一般都能使网络恢复正常。
(3)主机的网络地址参数设置不当。主机的网络地址参数设置不当是常见的主机逻辑故障。比如,主机配置的IP地址与其他主机冲突,或IP地址根本就不在于网范围内,这将导致该主机不能连通。
排查方法:查看网络邻居属性中的连接属性窗口,查看TCP/IP选项参数是否符合要求,包括IP地址、子网掩码、网关和DNS参数,进行修复。
(4)主机网络协议或服务安装不当。主机网络协议或服务安装不当也会出现网络无法连通。主机安装的协议必须与网络上的其它主机相一致,否则就会出现协议不匹配,无法正常通信,还有一些服务如“文件和打印机共享服务”,不安装会使自身无法共享资源给其他用户,“网络客户端服务”,不安装会使自身无法访问网络其他用户提供的共享资源。再比如E-mail服务器设置不当导致不能收发E-mail,或者域名服务器设置不当将导致不能解析域名等。排查方法:在网上邻居属性或在本地连接属性窗口查看所安装的协议是否与其他主机是相一致的,如TCP/IP协议,NetBEUI协议和IPX/SPX兼容协议等。其次查看主机所提供的服务的相应服务程序是否已安装,假如未安装或未选中,请注重安装和选中之。注重有时需要重新启动电脑,服务方可正常工作。典型案例:
(1)计算机在局域网中能看到其他计算机,可就是上不了网。计算机的设置和其它计算机一样,网关、DNS服务器地址、IP地址设置都正确,网卡也没有故障。
故障分析:既然可以在网络中看到其它计算机,说明网络连接和网络协议的安装是正确的。如果确认IP地址信息设置无误,可以试着PING一下网络内的其他计算机、默认网关、外部WEB网站的IP地址和DNS。
①如果PING不通网络内的计算机,说明IP地址信息设置有问题,或者没有正确安装TCP/IP协议。
②如果PING不通默认网关,说明IP地址信息中有关默认网关的设置是错误的,应当认真检查该项设置。
③如果PING不通外部WEB网站的IP地址(要先使用连接正常的计算机进行测试,确认可以PING通该IP地址),说明IP地址信息中默认网关的设置是错误的,或者没有安装代理服务器软件,或者在代理服务器或宽带路口上作了限制,不允许该IP地址或MAC地址访问网络。
④如果以上PING测试全部通过,仍然无法访问WEB网站,查看Internet Explorer 的局域网设置。依次选择“工具”—“Internet选项”—“连接”—“局域网设置”命令,取消“自动检测设置”复选框。如果采用宽带路由器,或者ICS、SyGate等网关类代理服务器共享Internet连接,取消选中“为LAN设置代理服务器”复选框。如果使用WinGate作为代理服务器,则应当选中该复选框,并输入代理服务器的IP地址及使用的端口号。
(5)主机安全性故障。主机故障的另一种可能是主机安全故障。通常包括主机资源被盗、主机被黑客控制、主机系统不稳定等。
排查方法:主机资源被盗,主机没有控制其上的finger,RPC,rlogin等服务。攻击者可以通过这些进程的正常服务或漏洞攻击该主机,甚至得到管理员权限,进而对磁盘所有内容有任意复制和修改的权限。还需注重的是,不要轻易的共享本机硬盘,因为这将导致恶意攻击者非法利用该主机的资源。(6)网络配置故障的分析与诊断
故障分析:网络配置故障就是由网络中的各项配置不当而产生的故障。它是一种较复杂的现象,不但要检查服务器的各项配置、工作站的各项配置,还要根据出现的错误信息和现象查出原因。如,域名、计算机名和地址故障的分析与诊断。故障分析:在实际工作中经常会出现在“网上邻居”中看不到其它计算机或只能看到部分计算机,无法找到指定的计算机等现象。故障诊断:检查网络中每个域、每台计算机的名称是否唯一;检查网络中的计算机名是否和域名或工作组名重复,使用TCP/IP时,检查分配给网络适配器的IP地址有无重复。在如协议故障的分析与诊断,故障分析:确认您所使用的协议与网络上其它计算机使用的协议相同。否则,将看不到网络上其它计算机。在配置和使用TCP/IP协议时的主要问题是IP地址、子网掩码和路由问题。IP地址的分配复杂,分配不好,容易造成网络混乱。计算机无法上网故障排除案例
首先要分别确定此计算机的网卡安装是否正确,是否存在硬件故障,网络配置是否正确,在实际工作中,我们一般采用Ping本机的回送地址(127.0.0.1)来判断网卡硬件安装和TCP/IP协议的正确性。如果能Ping通,即说明这部分没有问题。如果出现超时情况,则要检查计算机的网卡是否与机器上的其它设备存在中断冲突的问题。通过查看系统属性中的设备管理器,查看是否在网络适配器的设备前面有黄色惊叹号或红色叉号,如有则说明硬件的驱动程序没有安装成功,可删除后重新安装。另外,要确保TCP/IP协议安装的正确性,并且要绑定在你所安装的网卡上。如果重新安装后还是Ping不通回送地址,最好换上一块正常的网卡试一试。如果在局域网中划分了VLAN,那么连在不同VLAN中的计算机都有各自不同的IP地址、子网掩码和网关。要在机器的网络属性中设定的IP地址等数据与连接的VLAN相匹配,否则将出现网络不通的情况。当确保了计算机的硬件设备和网络配置正确后,接着就要查看计算机与交换机之间的双绞线,交换机的RJ45端口或交换机的配置是否有问题。此时我们要Ping上网计算机所在VLAN的网关,不通的话就要分段检查上面所说的各项。
最简单的方法是检查双绞线,用线缆测试仪检测双绞线是否断开。双绞线没有问题,就要查看交换机的端口是否坏了。交换机的参数配置表也是网络管理员必备的资料之一,并且随着网络用户的变化要不断地修改,检测到此,如果端口指示灯不亮,就只能是端口损坏了,可以把跳线接到正常使用的端口上排除其它原因。
主机被黑客控制,会导致主机不受操纵者控制。通常是由于主机被安置了后门程序所致。发现此类故障一般比较困难,一般可以通过监视主机的流量、扫描主机端口和服务、安装防火墙和加补系统补丁来防止可能的漏洞。
主机系统不稳定,往往也是由于黑客的恶意攻击,或者主机感染病毒造成。通过杀毒软件进行查杀病毒,排除病毒的可能。或重新安装操作系统,并安装最新的操作系统的补丁程序和防火墙、防黑客软件和服务来防止可能的漏洞的产生所造成的恶性攻击。
逻辑链路故障诊断应用最多的工具,大多还是Windows内置的一些工具。其中,使用使用频率最高的就是PING 命令、Tracert命令和 ipconfig了。
Ping 命令主要用于测试是否发生逻辑链路故障,以及定位链路故障的位置。使用Ping 命令基本可以判断故障是发生在本地计算机,还是发生在接入交换机;是发生在汇聚交换机,还是发生在核心交换机。
Tracert命令主要用于追踪路由,多用于比较复杂的网络结构中,可以大致定位故障发生的路由或三层设备。
IPCONFIG 命令则主要用于显示本地计算机的IP地址信息,可以查看IP地址信息设置是否正确无误。
二、交换机故障
(一)硬件故障
硬件故障主要指交换机电源、背板、模块、端口等部件的故障,可以分为以下几类。
1、电源故障:
由于外部供电不稳定,或者电源线路老化或者雷击等原因导致电源损坏或者风扇停止,从而不能正常工作。由于电源缘故而导致机内其他部件损坏的事情也经常发生。
如果面板上的POWER指示灯是绿色的,就表示是正常的;如果该指示灯灭了,则说明交换机没有正常供电。这类问题很容易发现,也很容易解决,同时也是最容易预防的。针对这类故障,首先应该做好外部电源的供应工作,一般通过引入独立的电力线来提供独立的电源,并添加稳压器来避免瞬间高压或低压现象。如果条件允许,可以添加UPS(不间断电源)来保证交换机的正常供电,有的UPS提供稳压功能,而有的没有,选择时要注意。在机房内设置专业的避雷措施,来避免雷电对交换机的伤害。现在有很多做避雷工程的专业公司,实施网络布线时可以考虑。
2、端口故障:
这是最常见的硬件故障,无论是光纤端口还是双绞线的RJ-45端口,在插拔接头时一定要小心。如果不小心把光纤插头弄脏,可能导致光纤端口污染而不能正常通信。我们经常看到很多人喜欢带电插拔接头,理论上讲是可以的,但是这样也无意中增加了端口的故障发生率。在搬运时不小心,也可能导致端口物理损坏。如果购买的水晶头尺寸偏大,插入交换机时,也容易破坏端口。此外,如果接在端口上的双绞线有一段暴露在室外,万一这根电缆被雷电击中,就会导致所连交换机端口被击坏,或者造成更加不可预料的损伤。
一般情况下,端口故障是某一个或者几个端口损坏。所以,在排除了端口所连计算机的故障后,可以通过更换所连端口,来判断其是否损坏。遇到此类故障,可以在电源关闭后,用酒精棉球清洗端口。如果端口确实被损坏,那就只能更换端口了。(3)模块故障:
交换机是由很多模块组成,比如:堆叠模块、管理模块(也叫控制模块)、扩展模块等。这些模块发生故障的机率很小,不过一旦出现问题,就会遭受巨大的经济损失。如果插拔模块时不小心,或者搬运交换机时受到碰撞,或者电源不稳定等情况,都可能导致此类故障的发生。
当然上面提到的这3个模块都有外部接口,比较容易辨认,有的还可以通过模块上的指示灯来辨别故障。比如:堆叠模块上有一个扁平的梯形端口,或者有的交换机上是一个类似于USB的接口。管理模块上有一个CONSOLE口,用于和网管计算机建立连接,方便管理。如果扩展模块是光纤连接的话,会有一对光纤接口。
在排除此类故障时,首先确保交换机及模块的电源正常供应,然后检查各个模块是否插在正确的位置上,最后检查连接模块的线缆是否正常。在连接管理模块时,还要考虑它是否采用规定的连接速率,是否有奇偶校验,是否有数据流控制等因素。连接扩展模块时,需要检查是否匹配通信模式,比如:使用全双工模式还是半双工模式。当然如果确认模块有故障,解决的方法只有一个,那就是应当立即联系供应商给以更换。(4)背板故障:
交换机的各个模块都是接插在背板上的。如果环境潮湿,电路板受潮短路,或者元器件因高温、雷击等因素而受损都会造成电路板不能正常工作。比如:散热性能不好或环境温度太高导致机内温度升高,指使元器件烧坏。
在外部电源正常供电的情况下,如果交换机的各个内部模块都不能正常工作,那就可能是背板坏了,遇到这种情况即使是电器维修工程师,恐怕也无计可施,惟一的办法就是更换背板了。(5)线缆故障:
其实这类故障从理论上讲,不属于交换机本身的故障,但在实际使用中,电缆故障经常导致交换机系统或端口不能正常工作,所以这里也把这类故障归入交换机硬件故障。比如接头接插不紧,线缆制作时顺序排列错误或者不规范,线缆连接时应该用交叉线却使用了直连线,光缆中的两根光纤交错连接,错误的线路连接导致网络环路等。
(二)软件故障
交换机的软件故障是指系统及其配置上的故障,它可以分为以下几类。
1、系统错误:
交换机系统是硬件和软件的结合体。在交换机内部有一个可刷新的只读存储器,它保存的是这台交换机所必需的软件系统。这类错误也和我们常见的Windows、Linux一样,由于当时设计的原因,存在一些漏洞,在条件合适时,会导致交换机满载、丢包、错包等情况的发生。所以交换机系统提供了诸如Web、TFTP等方式来下载并更新系统。当然在升级系统时,也有可能发生错误。对于此类问题,我们需要养成经常浏览设备厂商网站的习惯,如果有新的系统推出或者新的补丁,请及时更新。
2、配置不当:
初学者对交换机不熟悉,或者由于各种交换机配置不一样,管理员往往在配置交换机时会出现配置错误。比如VLAN 划分不正确导致网络不通,端口被错误地关闭,交换机和网卡的模式配置不匹配等原因。这类故障有时很难发现,需要一定的经验积累。如果不能确保用户的配置有问题,请先恢复出厂默认配置,然后再一步一步地配置。
3、密码丢失:
这可能是每个管理员都曾经经历过的。一旦忘记密码,都可以通过一定的操作步骤来恢复或者重置系统密码。有的则比较简单,在交换机上按下一个按钮就可以了。而有的则需要通过一定的操作步骤才能解决。
此类情况一般在人为遗忘或者交换机发生故障后导致数据丢失,才会发生。
4、外部因素:
由于病毒或者黑客攻击等情况的存在,有可能某台主机向所连接的端口发送大量不符合封装规则的数据包,造成交换机处理器过分繁忙,致使数据包来不及转发,进而导致缓冲区溢出产生丢包现象。还有一种情况就是广播风暴,它不仅会占用大量的网络带宽,而且还将占用大量的CPU处理时间。网络如果长时间被大量广播数据包所占用,正常的点对通信就无法正常进行,网络速度就会变慢或者瘫痪。一块网卡或者一个端口发生故障,都有可能引发广播风暴。由于交换机只能分割冲突域,而不能分割广播域(在没有划分VLAN 的情况下),所以当广播包的数量占到通信总量的30%时,网络的传输效率就会明显下降。总的来说软件故障应该比硬件故障较难查找,解决问题时,可能不需要花费过多的金钱,而需要较多的时间。最好在平时的工作中养成记录日志的习惯。每当发生故障时,及时做好故障现象记录、故障分析过程、故障解决方案、故障归类总结等工作,以积累自己的经验。比如有时在进行配置时,由于种种原因,当时没有对网络产生影响或者没有发现问题,但也许几天以后问题就会逐渐显现出来。如果有日志记录,就可以联想到是否前几天的配置有错误。由于很多时候都会忽略这一点,以为是在其他方面出现问题,当走了许多弯路之后,才找到问题所在。所以说记录日志及维护信息是非常必要的。故障分析排除
对于同时有一批计算机上不了网的故障,首先要找到这些计算机的共性,如是不是属于同一VLAN或接在同一交换机上的,若这些计算机属于同一VLAN,且属于计算机分别连接于不同的楼层交换机,那么检查一下路由器上是否有acl限制,在路由器上对该VLAN的配置是否正确,路由协议(如我局的OSPF协议)是否配置正确。若这些计算机属于同一交换机,则应到机房检查该交换机是否有电源松落情况,或该交换机CPU负载率是否很高,与上一级网络设备的链路是否正常。通常某交换机连接的所有电脑都不能正常与网内其它电脑通讯,这是典型的交换机死机现象,可以通过重新启动交换机的方法解决。如果重新启动后故障依旧,则检查一下那台交换机连接的所有电脑,看逐个断开连接的每台电脑的情况,慢慢定位到某个故障电脑,会发现多半是某台电脑上的网卡故障导致的。故障通常使交换机的某个端口变得非常缓慢,最后导致整台交换机或整个堆叠慢下来。通过控制台检查交换机的状态,发现交换机的缓冲池增长得非常快,达到了90%或更多。原因及解决方法为:首先应该使用其它电脑更换这个端口上原来的连接,看是否由这个端口连接的那台电脑的网络故障导致的,也可以重新设置出错的端口并重新启动交换机。
三、路由器故障
(一)物理故障
路由器的安装和使用注意事项应该严格按照安装手册进行。安装前应检查安装场所的温湿度、洁净度、静电、干扰、防雷击等要求是否满足;安装后应检查电源的输入电压幅值、频率、中性点的连接及保护地、接地电阻等是否满足要求。
以下是使用路由器需要注意的几点故障:(1)、安装后无法使用
*线路连接问题。如线路阻抗不匹配 线序连接错误、中间传输设备故障。*与其它设备配合有问题。*接口配置问题。*电源或接地不符合要求。
*在安装过程也要考虑模块接口电缆所支持的最大传输长度、最大速率等因素。
(2)、使用过程中发生故障
*电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成器件损坏。*传输线受到干扰。*中间传输设备故障。*环境的温湿度、洁净度、静电等指标超出使用范围。
在故障定位的过程中,可把不必要的相连设备先去掉,缩小故障定位的范围,从而有利于快速准确地定位故障。1. 串口故障排除
串口出现连通性问题时,为了排除串口故障,一般是从show interface serial命令开始,分析它的屏幕输出报告内容,找出问题之所在。串口报告的开始提供了该接口状态和线路协议状态。接口和线路协议的可能组合有以下几种:(1)串口运行、线路协议运行,这是完全的工作条件。该串口和线路协议已经初始化,并正在交换协议的存活信息。
(2)串口运行、线路协议关闭,这个显示说明路由器与提供载波检测信号的设备连接,表明载波信号出现在本地和远程的调制解调器之间,但没有正确交换连接两端的协议存活信息。可能的故障发生在路由器配置问题、调制解调器操作问题、租用线路干扰或远程路由器故障,数字式调制解调器的时钟问题,通过链路连接的两个串口不在同一子网上,都会出现这个报告。
(3)串口和线路协议都关闭,可能是电信部门的线路故障、电缆故障或者是调制解调器故障。
(4)串口管理性关闭和线路协议关闭,这种情况是在接口配置中输入了shutdown命令。通过输入no shutdown命令,打开管理性关闭。接口和线路协议都运行的状况下,虽然串口链路的基本通信建立起来了,但仍然可能由于信息包丢失和信息包错误时会出现许多潜在的故障问题。正常通信时接口输入或输出信息包不应该丢失,或者丢失的量非常小,而且不会增加。如果信息包丢失有规律性增加,表明通过该接口传输的通信量超过接口所能处理的通信量。解决的办法是增加线路容量。查找其他原因发生的信息包丢失,查看show interface serial命令的输出报告中的输入输出保持队列的状态。当发现保持队列中信息包数量达到了信息的最大允许值,可以增加保持队列设置的大小。2.以太接口故障排除
以太接口的典型故障问题是:带宽的过分利用;碰撞冲突次数频繁;使用不兼容的幀类型。使用show interface ethernet命令可以查看该接口的吞吐量、碰橦冲突、信息包丢失、和幀类型的有关内容等。
(1)通过查看接口的吞吐量可以检测网络的利用。如果网络广播信息包的百分比很高,网络性能开始下降。光纤网转换到以太网段的信息包可能会淹没以太口。互联网发生这种情况可以采用优化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速转换,并且调整缓冲区和保持队列。
(2)两个接口试图同时传输信息包到以太电缆上时,将发生碰橦。以太网要求冲突次数很少,不同的网络要求是不同的,一般情况发现冲突每秒有3、5次就应该查找冲突的原因了。碰橦冲突产生拥塞,碰橦冲突的原因通常是由于敷设的电缆过长、过分利用、或者“聋”节点。以太网络在物理设计和敷设电缆系统管理方面应有所考虑,超规范敷设电缆可能引起更多的冲突发生。(3)如果接口和线路协议报告运行状态,并且节点的物理连接都完好,可是不能通信。引起问题的原因也可能是两个节点使用了不兼容的幀类型。解决问题的办法是重新配置使用相同幀类型。如果要求使用不同幀类型的同一网络的两个设备互相通信,可以在路由器接口使用子接口,并为每个子接口指定不同的封装类型。
(二)配置故障
逻辑故障中的最常见情况是配置错误,也就是指因为网络设备的配置错误而导致的网络异常或故障。
1、路由器逻辑故障
路由器逻辑故障通常包括路由器端口参数设定有误,路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。
排查方法:路由器端口参数设定有误,会导致找不到远端地址。用Ping命令或用Traceroute命令,查看在远端地址哪个节点出现问题,对该节点参数进行检查和修复。
路由器路由配置错误,会使路由循环或找不到远端地址。比如,两个路由器直接连接,这时应该让一台路由器的出口连接到另一路由器的入口,而这台路由器的入口连接另一路由器的出口才行,这时制作的网线就应该满足这一特性,否则也会导致网络错误。该故障可以用Traceroute工具,可以发现在Traceroute的结果中某一段之后,两个IP地址循环出现。这时,一般就是线路远端把端口路由又指向了线路的近端,导致IP包在该线路上往返反复传递。解决路由循环的方法就是重新配置路由器端口的静态路由或动态路由,把路由设置为正确配置,就能恢复线路了。路由器CPU利用率过高和路由器内存余量太小,导致网络服务的质量变差。比如路由器内存余量越小丢包率就会越高等。检测这种故障,利用MIB变量浏览器较直观,它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据,通常情况下网络治理系统有专门的治理进程,不断地检测路由器的关键数据,并及时给出报警。解决这种故障,只有对路由器进行升级、扩大内存等,或者重新规划网络拓扑结构。故障与排错
想要明确的给“故障”和“排错”下个定义想来并不是一件容易的事,路由器的“故障”总是多种多样的,造成某种故障现象的原因也是多种多样的。有的场合要迅速地找到故障并加以排除,其要求是相当严格的。有些现象是设备在正常运行中出现故障的,另外一种情况就是当我们在实施某种应用,已经完成了配置,但却得不到预期的效果。我们把解决这些问题的方法叫做排错技术。因为它和路由器的配置是不一样的,所以排错技术需要在维护和管理路由器的过程中慢慢积累才能有所提高。一个系统化的故障处理技术就是合理地一步一步找出故障原因并加以解决。思路
(1)路由器状态
弄清楚路由器发生故障时处于什么状态,才能进行下一步操作。最直接的方法就是观察路由器上各种指示灯的工作状态,如果你不知道他具体代表什么意思,可以查看相应的用户手册。使用命令行界面和路由器直接对话能够得到更详细的信息,常见的路由器都可以使用“show”或“display”就可以显示路由器当前的工作状态和配置信息。总之弄清状况是一个最基本的要求。(2)正常情况应该得到什么结果
你首先应该明确你想让路由器做什么,并按照你的想法来配置路由器,以确认路由器应该可以实现什么功能。例如,你应该能ping通指定接口的地址吗?一个广播网上OSPF所有邻居应该是Full吗?在你调试完路由器后应该对这些问题能够正确回答,确认你想要的东西。(3)可能造成某种错误的原因
回答这个具有挑战性的问题光有勇气是不够的,更需要学识和经验。无论那种错误现象,其原因可能有多种,可能是一种故障,也可能是多种故障叠加。当然,对原因的全面可靠列举,需要对特定网络和设备的状况做全面的了解。你的知识水平和经验在此展露无遗。(4)排除假象,寻找真凶
对于一个故障,形成它的“原因”会有很多种,但并不意味着所有“原因”都发生问题。所以排除法就是最好的排错选择,我们可以归纳出下面的这种过程框图对它加以回答。
网络环境变得复杂后,病毒攻击已经成为路由器排错和维护不得不考虑的因素。病毒和非法报文通过路由器转发,会占用路由器的大量资源。如果路由器的CPU 使用率过高,数据包丢包率高,你可以断开本地局域网,通过抓包等手段来判断是否有本地攻击的情况发生。根据这些攻击报文的特定在路由器上使用访问控制过滤非法数据包,一般会起到一定的效果。当然,最根本的解决方法是对本地计算机进行彻底地杀毒,但工作量也是巨大的。
Sniffer(嗅探器)是一种常用的收集有用数据方法,这些数据可以是用户的帐号和密码,可以是一些商用机密数据等等。Snifffer可以作为能够捕获网络报文的设备,ISS为Sniffer这样定义:Sniffer是利用计算机的网络接口截获目的地为其他计算机的数据报文的一种工具。Sniffer的正当用处主要是分析网络的流量,以便找出所关心的网络中潜在的问题。例如,假设网络的某一段运行得不是很好,报文的发送比较慢,而我们又不知道问题出在什么地方,此时就可以用嗅探器来作出精确的问题判断。
四、无线网络的故障
基于IEEE 802.11标准的WLAN逐渐进入主流网络,使得针对无线网络的故障诊断和安全保障变得与有线网络一样重要。
支持多种模式的分析仪可以扫描所有802.11频段,包括2.4GHz和5GHz频段中的所有通道,并以图形化的形式显示,从这些图表中可以查看配置是否合理、SNR信噪比是多少、可以利用的带宽会有多少及其他相关问题。如果某个AP出现突出流量,可能是因为有很多客户端正在通过这个AP上网;另一方面,也可能是某种特别的应用或协议正在大量占用带宽。技术人员携带无线分析仪可以搜索“发送流量最多者”,快速判断是否有MP3下载、BT下载等应用,这些在无线网络中是需要禁止的应用。
当一个无线网络发生问题时,你应该首先从几个关键问题入手进行排错。一些硬件的问题会导致网络错误,同时错误的配置也会导致网络不能正常工作。以下介绍一些无线网络排错的方法和技巧。硬件排错
当只有一个接入点以及一个无线客户端出现连接问题时,我们可能会很快的找到出有问题的客户端。但是当网络非常大时,找出问题的所在可能就不是那么容易了。
在大型的无线网络环境中,如果有些用户无法连接网络,而另一些客户却没有任何问题,那么很有可能是众多接入点中的某个出现了故障。一般来说,通过察看有网络问题的客户端的物理位置,你就能大概判断出是哪个接入点出现问题。当所有客户都无法连接网络时,问题可能来自多方面。如果你的网络只使用了一个接入点,那么这个接入点可能有硬件问题或者配置有错误。另外,也有可能是由于无线电干扰过于强烈,或者是无线接入点与有线网络间的连接出现了问题。
检查接入点的可连接性
要确定无法连接网络问题的原因,首先需要检测一下网络环境中的电脑是否能正常连接无线接入点。简单的检测方法是在你的有线网络中的一台电脑中打开命令行模式,然后ping无线接入点的IP地址,如果无线接入点响应了这个ping命令,那么证明有线网络中的电脑可以正常连接到无线接入点。如果无线接入点没有响应,有可能是电脑与无线接入点间的无线连接出现问题,或者是无线接入点本身出现了故障。要确定到底是什么问题,你可以尝试从无线客户端ping无线接入点的IP地址,如果成功,说明刚才那台电脑的网络连接部分可能出现了问题,比如网线损坏。
如果无线客户端无法ping到无线接入点,那么证明无线接入点本身工作异常。你可以将其重新启动,等待大约五分钟后再通过有线网络中的电脑和无线客户端,利用ping命令察看它的连接性。
如果从这两方面ping无线接入点依然没有响应,那么证明无线接入点已经损坏或者配置错误。此时你可以将这个可能损坏了的无线接入点通过一段可用的网线连接到一个正常工作的网络,你还需要检查它的TCP/IP配置。之后,再次在有线网络客户端ping这个无线接入点,如果依然失败,则表示这个无线接入点已经损坏。这时你就应该更换新的无线接入点了。配置问题
无线网络设备本身的质量一般还是可以信任的,因此最大的问题根源一般来自设备的配置上,而不是硬件本身。知道了这一点,我们下面就来看看几种常见的由于错误配置而导致的网络连接故障。测试信号强度
如果你可以通过网线直接ping到无线接入点,而不能通过无线方式ping到它,那么基本可以认定无线接入点的故障只是暂时的。如果经过调试,问题还没有解决,那么你可以检测一下接入点的信号强度。虽然对于我们来说,还没有一个标准的测量无线信号强度的方法,但是大多数无线网卡厂商都会在网卡上包含某种测量信号强度的机制。无线路由器的位置摆放不当是造成信号微弱的直接原因。解决办法很简单:第一、放置在相对较高的位置上;第二、摆放的放置与接收端不应间隔较多水泥墙壁;第三、尽量放置在使用端的中心位置。试试改变频道
如果经过测试,你发现信号强度很弱,但是最近又没有做过搬移改动,那么可以试着改变无线接入点的频道并通过一台无线终端检验信号是否有所加强。由于在所有的无线终端上修改连接频道是一项不小的工程,因此你首先应该在一台无线终端上测试,证明确实有效后才可以大面积实施。有时候无线网络的故障可能由于一个很细微的动作而突然好转,例如关断手机。检验SSID 不久前,我带着我的笔记本去朋友家工作。由于朋友家也采用了无线网络,因此我决定连接到他的网络。回到家后,我并没有再用这台笔记本。过了两周,当我再打开笔记本后,发现它无法连接到我的无线网络了。很快我就找到了问题的根源:我忘记重新将服务区标识符(SSID,Service Set Identifier)修改回我自己的网络标识了。记住,如果你的SSID没有正确的指定网络,那么你的笔记本根本不会ping到无线接入点,它会忽略无线接入点的存在,按给定的SSID来搜索对应的接入点。检验WEP密钥
检查WEP加密设置。如果WEP设置错误,那么你也无法从无线终端ping到无线接入点。不同厂商的无线网卡和接入点需要你指定不同的WEP密钥。比如,有的无线网卡需要你输入十六进制格式的密钥,而另一些则需要你输入十进制的密钥。同样,有些厂商采用的是40位和64位加密,而另一些厂商则只支持128位加密方式。要让WEP正常工作,所有的无线客户端和接入点都必须正确匹配。很多时候,虽然无线客户端看上去已经正确的配置了WEP,但是依然无法和无线接入点通信。在面对这种情况时,我一般都会将无线接入点恢复到出厂状态,然后重新输入WEP配置信息,并启动WEP功能。DHCP 配置问题
另一个让你无法成功的访问无线网络的原因可能是由DHCP配置错误引起的。网络中的DHCP服务器可以说是你能否正常使用无线网络的一个关键因素。很多新款的无线接入点都自带DHCP服务器功能。一般来说,这些DHCP服务器都会将192.168.0.x这个地址段分配给无线客户端。而且DHCP接入点也不会接受不是自己分配的IP地址的连接请求。这意味着具有静态IP地址的无线客户端或者从其它DHCP服务器获取IP地址的客户端有可能无法正常连接到这个接入点。
对于这种情况,有两种解决方法:
禁用接入点的DHCP服务,并让无线客户端从网络内标准的DHCP服务器处获取IP地址。
修改DHCP服务的地址范围,使它适用于你现有的网络。
这两种方法都是可行的,不过具体还要看你的无线接入点的固件功能。很多无线接入点都允许你采用其中一种方法,而能够支持这两种方法的无线接入点很少。
多个接入点的问题
设想一下假如有两个无线接入点同时按照默认方式工作。在这种情况下,每个接入点都会为无线客户端分配一个192.168.0.X的IP地址。由此产生的问题是,两个无线接入点并不能区分哪个IP是自己分配的,哪个又是另一个接入点分配的。因此网络中早晚会产生IP地址冲突的问题。
要解决这个问题,在每个接入点上设定不同的IP地址分配范围,以防止地址重叠。结论 计算机网络技术发展迅速,网络故障也十分复杂,上述概括了常见的几类故障及其排查方法。针对具体的诊断技术,但是具体情况要具体分析,这些经验就需要长期的积累了。
在网络维护中的还需要注重以下几个方面:
第一,建立完整的组网文档,以供维护时查询。如系统需求分析报告、网络设计总体思路和方案、网路拓扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配,网络设备分布等等。
第二,做好网络维护日志的良好习惯,尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要作完备的维护文档,以有利于以后故障的排查。这也是一种经验的积累。
第三,提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞
网络发生故障是不可避免的。网络建成运行后,网络故障诊断是网络管理的重要技术工作。搞好网络的运行管理和故障诊断工作,提高故障诊断水平需要注意以下几方面的问题:认真学习有关网络技术理论;清楚网络的结构设计,包括网络拓朴、设备连接、系统参数设置及软件使用;了解网络正常运行状况、注意收集网络正常运行时的各种状态和报告输出参数;熟悉常用的诊断工具,准确的描述故障现象。致谢
在本次毕业设计中,我学到了很多东西。老师认真负责的工作态度,严谨的治学精神和深厚的理论水平都使我收益匪浅。他无论在理论上还是在实践中,都给与我很大的帮助,使我得到不少的提高这对于我以后的工作和学习都有一种巨大的帮助,感谢他耐心的辅导。另外,其它同学也给于我很大的帮助,帮助我解决了不少的难点,使得论文能及时完成,谢谢你们!附件清单
该系统的程序设计源代码、安装及运行说明、用户操作手册及其他软件文档见光盘。
本文出自 “晴日” 博客,请务必保留此出处http://21288624.blog.51cto.com/847079/181249
本地连接数据包只有发送,没有接收的解决方法 网卡惹的祸
故障现象:公司局域网一台电脑不能连网,本地网络连接状态只发送数据,而接收数据包为0。
故障处理:使用笔记本电脑测试,网络正常,于是更换计算机网卡,故障解决。
故障原因:网卡物理故障。双绞线惹的祸
故障现象:利用ADSL MODEM的路由功能,多用户通过一个10M HUB共享一条ADSL宽带上网,运行正常。个别电脑突然不能上网了,ADSL虚拟拨号不通,而其它用户都能正常上网。
故障处理:首先怀疑是系统故障,于是在Windows XP中重装网卡驱动程序,重建ADSL拔号连接,仍然不能拨通;换用其它能正常上网电脑,故障依旧,这就排除了电脑本身的问题。在HUB上调换了端口,甚至直接连接到ADSL MODEM上,故障依旧,而他人利用该端口却能正常上网,这也就排除了HUB端口故障。查看本地连接,网络连接图标正常地显示在任务栏,上面并未出现“×”(事实上网络不通时网络连接图标上往往有个“×”),再查看网络连接状态,发现只有发送数据包,接收数据包为0,由此断定网络连接有问题,于是检查了一下线路,看是否有扭曲或断裂,并未发现异常现象,然后在双绞线两端依次重新制作水晶头接头,故障还是没有解决。
思考了一下,双绞线有四对线,水晶头中1、2、3、4、5、6、7、8位臵依次为白橙、橙、白绿、兰、白兰、绿、棕、白棕,实际使用的是其中两对线,它们排在水晶头的1、2与3、6位臵。由于接收数据包为0,怀疑是其中一对线有问题(白橙、橙或白绿、绿,事实上应该是排在3、6位臵的一对线为接收数据线),于是在双绞线两端重新制作接头,按照非常规的排线顺序:水晶头中1、2、3、4、5、6、7、8位臵依次为白橙、橙、白兰、棕、白棕、兰、白绿、绿,当然仍要保持1、2为一对线,3、6为一对线。重新连接好双绞线,问题解决了。为了进一步证明自己的推断,白绿、绿这一对线有问题,后来借来了网线测试仪,果然测得白绿、绿这一对线不通,但由于7、8位臵上这一对线是备用线,实际上不起作用,对网络连接并没有影响。
故障原因:5类UTP双绞线有4对线,实际使用的是其中两对用于接收和发送数据,由于1、2或3、6位臵的某一对线出现故障,引起网络通讯故障,事实上即使4、5或7、8位臵的两对线断裂也不会影响网络通讯。VLAN惹的祸
故障现象:公司局域网通过CISCO 4006交换机千兆光纤接口与上级总部相联,交换机有四个模块,共划分为三个VLAN,网络一直运行正常。后来因上级部门要求,对VLAN及IP地址进行了重新规划与调整,结果公司大部分电脑能正常连网,但有一些电脑却不能正常连网。在不能正常连网的电脑上发现:网络连接图标显示在任务栏,上面并未出现“×”,再查看网络连接状态,发现只有发送数据包,接收数据包为0。
故障处理:首先怀疑是交换机物理故障,但观察交换机的指示灯状态以及各端口的状态,显示为绿灯,状态正常。接着用笔记本电脑在故障点进行测试,故障依旧。这就排除了电脑本身故障。然后用网线测试仪在网络两端进行了测试,网线正常。最后仔细地检查了交换机配制,发现有一条设臵VLAN的命令,SET VLAN 80 3/1-48,5/1-34,而实际上只有4个模块,这里将模块号4错写成了5,重新配制VLAN 80,SET VLAN 80 3/1-48,4/1-34,故障排除。
故障原因:由于连接在模块4上的端口的计算机IP地址是按VLAN 80进行配制,事实上因配制错误,模块4的端口并没有划入VLAN 80,这些计算机实际上并不属于任何VLAN,导致计算机不能通讯的故障。结论:
出现网络故障要善于分析,依次排除。当网络连接图标出现在任务栏中,只有发送数据包而接收数据包为0时,可能的故障原因至少有:网卡物理故障、网线故障、计算机IP地址与交换机上对应的端口所在VLAN不匹配。
第四篇:信息网络故障应急预案
信息网络故障应急预案
1总则 1.1目的
为提高处理突发信息网络事件的能力,形成科学、有效、反应迅速的应急工作机制,确保重要计算机信息系统的实体安全、运行安全和数据安全,最大限度地减少网络与信息安全突发事件的危害,保护学校及师生利益,特制定本预案。
1.2适用范围
本预案适用于XXXX公司信息化系统发生和可能发生的网络与信息安全突发事件。
1.3工作原则
(1)预防为主。立足安全防护,加强预警,重点保护基础信息网络和重要信息系统,从预防、监控、应急处理、应急保障和打击犯罪等环节,采取多种措施,共同构筑网络与信息安全保障体系。
(2)快速反应。在网络与信息安全突发公共事件发生时,按照快速反应机制,及时获取充分而准确的信息,迅速处置,最大程度地减少危害和影响。(3)以人为本。把保障公共利益以及公民、法人和其他组织的合法权益的安全作为首要任务,及时采取措施,最大限度地避免学校财产遭受损失。
(4)分级负责。按照“谁主管谁负责、谁使用谁负责”以及“条块结合”的原则,建立和完善安全责任制及联动工作机制。根据职责,各司其职,加强协调与配合,形成合力,共同履行应急处置工作的管理职责。
1.4编制依据
根据《中华人民共和国计算机信息系统安全保护条例》、《计算机病毒防治管理办法》及XXXX公司相关管理规定等,制定《信息网络故障应急预案》(以下简称预案)。
2团队职责
2.1负责编制、修订所辖范围内突发信息网络事件应急预案。2.2通过国家互联网应急中心及国内外安全网络信息组织交流等手段获取安全预警信息,周期性或即时性地向局域网用户发布;对异常流量来源进行监控,并妥善处理各种异常情况。
2.3及时组织专业技术人员对所辖范围内突发信息网络事件进行应急处置;负责调查和处置突发信息网络事件,及时上报并按照相关规定作好善后工作。2.4负责组建信息网络安全应急救援队伍并组织培训和演练。3预警及预警机制
突发信息网络事件安全预防措施包括分析安全风险,准备应急处置措施,建立网络和信息系统的监测体系,控制有害信息的传播,预先制定信息安全重大事件的通报机制。
3.1突发信息网络故障分类
关键设备或系统的故障;自然灾害(水、火、电等)造成的物理破坏;人为失误造成的安全事件;电脑病毒等恶意代码危害;人为的恶意攻击等。
3.2应急准备
信息化建设部和各单位信息系统管理员明确职责和管理范围,根据实际情况,安排应急值班,确保到岗到人,联络畅通,处理及时准确。
3.3具体措施
(1)建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘;建立备份电源系统;加强所有人员防火、防盗等基本技能培训。(2)实行实时监视和监测,采用认证方式避免非法接入和虚假路由信息。
(3)重要系统采用可靠、稳定硬件,落实数据备份机制,遵守安全操作规范;安装有效的防病毒软件,及时更新升级扫描引擎;加强对局域网内所有用户和信息系统管理员的安全技术培训。
(4)安装反入侵检测系统,监测恶意攻击、病毒等非法侵入技术的发展,控制有害信息经过网络的传播,建立网关控制、内容过滤等控制手段。
4有关应急预案 4.1机房漏水应急预案
(1)发生机房漏水时,第一目击者应立即通知报告中心负责人。
(2)若空调系统出现渗漏水,第一目击者应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况下可临时用电扇对服务器进行降温。
(3)若为墙体或窗户渗漏水,信息化建设部负责人应立即采取有效措施确保机房安全,同时安排通知后勤与基建管理处,及时清除积水,维修墙体或窗户,消除渗漏水隐患。4.2设备发生被盗或人为损害事件应急预案
(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即拍照保留原始影像资料,及时报告中心负责人并立即通知保卫处,同时保护好现场。
(2)重大事件由保卫处通知公安部门,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
(3)事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向中心负责人汇报。
(4)中心负责人安排相关科室及时恢复网络正常运行,并对事件进行调查。事发科室应在调查结束后一日内书面报告中心负责人。事态或后果严重的,应及时报告分管校领导、党院办和相关业务部门。
4.3机房长时间停电应急预案
(1)及时查询停电原因,及时通知电工与电房处理。
(2)接到长时间停电通知后,中心负责人应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求用户在停电前停止业务、保存数据。
(3)停电时间过长的,中心负责人应及时报告分管校领导、党院办和相关业务部门。4.4通信网络故障应急预案
(1)发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应及时通知信息系统管理员,经初步判断后及时上报中心负责人。
(2)信息化建设部接报告后,应及时查清通信网络故障位置,隔离故障区域,并将事态及时报告中心负责人,通知相关通信网络运营商查清原因;同时及时组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
(3)事态或后果严重的,中心负责人应及时报告分管校领导、党院办和相关业务部门。
(4)应急处置结束后,信息化建设部和事发部门应将故障分析报告,在调查结束后一日内书面报告中心负责人。
4.5不良信息和网络病毒事件应急预案
(1)发现不良信息或网络病毒时,信息系统管理员应立即断开网络,终止不良信息或网络病毒传播,并报告中心负责人和信息化建设部。
(2)信息化建设部应根据中心负责人指令,采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。(3)事态或后果严重的,中心负责人应及时报告分管校领导、党院办和相关业务部门。
(4)处置结束后,信息化建设部和事发单位应将事发经过、造成影响、处置结果在调查工作结束后一日内书面报告中心负责人。
4.6服务器软件系统故障应急预案
(1)发生服务器软件系统故障后,应及时报告中心负责人;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,保持原始数据。
(2)信息化建设部应根据中心负责人指令,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理。
(3)事态或后果严重的,及时报告数字化校园建设小组。如有必要,及时报告分管校领导、党院办和相关业务部门。
(4)处置结束后,信息化建设部应将事发经过、处置结果等在调查工作结束后一日内报告中心负责人。
4.7黑客攻击事件应急预案(1)当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告中心负责人。
(2)接报告后,中心负责人应立即指令信息化建设部核实情况,关闭服务器或系统,修改防火墙和路由器的过滤规则,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道。
(3)信息化建设部应及时清理系统,恢复数据、程序,恢复系统和网络正常;情况严重的,应上报数字化校园建设小组,并请求支援。必要时,及时报告分管校领导、党院办和相关业务部门。
(4)处置结束后,信息化建设部应将事发经过、处置结果等在调查工作结束后一日内报告中心负责人。
4.8网络核心设备硬件故障应急预案
(1)发生核心设备硬件故障后,信息化建设部应及时报告中心负责人,并组织查找、确定故障设备及故障原因,进行先期处置。
(2)若故障设备在短时间内无法修复,信息化建设部应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。(3)信息化建设部应在故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联系相关厂商,认真填写设备故障报告单备查。
(4)事态或后果严重的,及时报告数字化校园建设小组。如有必要,及时报告分管校领导、党院办和相关业务部门。
4.9业务数据损坏应急预案
(1)发生业务数据损坏时,信息化建设部应及时报告中心负责人,检查、备份业务系统当前数据。
(2)相关业务部门及信息化建设部负责调用备份服务器备份数据。
(3)业务数据损坏事件超过2小时后,信息化建设部应及时报告中心负责人,及时通知业务部门以手工方式开展业务。
(4)信息化建设部应待业务数据系统恢复后,检查历史数据和当前数据的差别,由相关系统业务员补录数据;重新备份数据,并写出故障分析报告,在调查工作结束后一日内报告中心负责人。
4.10雷击故障应急预案
(1)遇雷暴天气或接上级部门雷暴气象预警,信息化建设部应及时报告中心负责人,经请示同意后关闭所有服务器,切断电源,暂停内部计算机网络工作,并及时通知相关人员关闭一切网络设备及计算机等,并切断电源。
(2)雷暴天气结束后,信息化建设部报经中心负责人同意,及时开通服务器,恢复内部计算机网络工作,并通知相关人员及时恢复设备正常工作,对设备和数据进行检查。出现故障的,事发单位应将故障情况及时报告信息化建设部。
(3)因雷击造成损失的,信息化建设部应会同相关部门进行核实、报损,并在调查工作结束后一日内书面报告中心负责人。必要时,及时报告分管校领导、党院办和相关业务部门。
4.11火灾应急预案
(1)遇机房火灾报警,值班人员应第一时间报告保卫处和中心领导,由保卫处确认险情。
(2)确认险情后,应立即疏散楼宇内所有人员,告知相关情况,按照学校消防规范,配合学校保卫处处理相关险情,并切断电源。
(3)在人员疏散后,阻止除专业消防员以外的人员进入现场。(4)处置结束后,相关人员应会同部门进行核实、报损,并在调查工作结束后一日内书面报告中心负责人,并及时报告分管校领导、党院办和相关业务部门。5应急处置
发生信息网络突发事件后,相关人员应在5分钟内向中心负责人报告,中心负责人组织人员采取有效措施开展先期处置,恢复信息网络正常状态。
发生重大故障(事件),无法迅速消除或恢复系统,影响较大时实施紧急关闭,并立即向数字化校园建设小组报告。如有必要,及时及时报告分管校领导、党院办和相关业务部门。
6善后处置
应急处置工作结束后,中心负责人组织有关人员和技术专家组成事件调查组,对事件发生原因、性质、影响、后果、责任及应急处置能力、恢复重建等问题进行全面调查评估,根据应急处置中暴露出的管理、协调和技术问题,改进和完善预案,实施针对性演练,总结经验教训,整改存在隐患,组织恢复正常工作秩序。
7应急保障 7.1通信保障
信息化建设部负责收集、建立数字化校园建设小组内部及其他相关部门的应急联络信息。中心负责人应在重要部位醒目位置公布报警电话,中心负责人全体人员保证全天24小时通讯畅通。7.2装备保障
信息化建设部负责建立并保持电力、空调、机房等网络安全运行基本环境,预留一定数量的信息网络硬件和软件设备,指定专人保管和维护。
7.3数据保障
重要信息系统均建立备份系统,保证重要数据在受到破坏后可紧急恢复。
7.4队伍保障
建立符合要求的网络与信息安全保障技术支持力量,对网络接入单位的网络与信息安全保障工作人员提供技术支持和培训服务。
8监督管理
8.1宣传、教育和培训
将突发信息网络事件的应急管理、工作流程等列为培训内容,增强应急处置能力。加强对突发信息网络事件的技术准备培训,提高技术人员的防范意识及技能。中心负责人每年至少开展一次全市系统范围内的信息网络安全教育,提高信息安全防范意识和能力。
8.2预案演练 中心负责人每年不定期安排演练,建立应急预案定期演练制度。通过演练,发现和解决应急工作体系和工作机制存在的问题,不断完善应急预案,提高应急处置能力。
9附则 9.1预案更新
结合信息化建设发展状况,配合相关法律法规的制定、修改和完善,适时修订本预案。
9.2制定与解释部门
本预案由信息化建设部制定并负责解释。9.3预案实施或生效时间
本预案经部门讨论后,部门内部发布实施。
第五篇:医疗单位网络故障应急预案
计算机网络故障应急预案
医院计算机信息系统功能涉及各科室,计算机应用在医院发展中的作用越来越重要。因而计算机网络故障可能给医院工作带来极大的影响,为防患于未然,特制定本预案。
一、计算机日常维护与应急处理由医院办公室负责。
二、应用时间:医院HIS局域网出现问题,影响业务部门网上工作时启用。
三、启用目的:不因HIS局域网出现问题,影响医院门诊、住院患者的正常诊疗活动,以及药品管理、收费等工作的正常运行。
四、医院局域网出现故障时,收费、药房、药库及办公室有关人员原则上不准假。各科主任必须及时到达现场,做好协调工作。
五、各部门具体内容:
1、收费室工作人员:
(1)收费室应备有最新的医疗服务及一次性医疗物品收费价格。(2)当发现应用程序异常时,必须立即通知办公室。
(3)退出断网前模块,改为手工收据,保证收费工作不能中断;局域网恢复后立即终止手工收据,启用正常收费模块;
(4)在开具手工收据时,登记患者交费项目明细,以便患者换开收据;
(5)对患者作耐心解释工作;视患者排队情况,财务主任决定是否加派收费人员;(6)当日下班之前,结清手工收据帐款。同时,结清已用的手工收据,重新登记备用手工收据的起始编号。
(7)如有换开收据的,收回其手工收据。
(8)收费人员必须自己盘库,若有账目问题,请计算机维护人员协助解决。
2、药剂科工作人员
(1)药剂科应常备医院《药品目录》,必要时由办公室提供药品最新价格;(2)当发现应用程序异常时,必须立即通知办公室;
(3)门诊药房操作员退出断网前模块,改为手工(药品)划价;(4)网络故障时所调配处方需单独存放,事后做好统计及库存调整工作;
(5)做好病人的解释、输导工作。紧急情况下,经科主任批准,可允许患者先压钱取药;(6)局域网恢复正常后,核实门诊收费药品金额是否准确;将未确认的处方确认发药;及时通知借药的科室补录医嘱。
3、计算机值维护人员:
(1)计算机网络维护人员应有高度的责任心,做好网络日常维护工作。
(2)做好《药品目录》和一次性医用物品的字典维护,包括名称、规格、单价等,随时 为收费室和药房提供药品、一次性医用物品和检查治疗的最新价格,最新价格必须与计算机字典价格同步。
(3)根据故障现象初步判断故障原因和处理故障所需的时间,并在最短时间内排除故障;(4)报告办公室主任,必要时报告院长,同时通告因计算机故障影响正常业务的科室;(5)协助门诊和住院患者的手工业务;
(6)网络恢复通畅后,立即通知局域网各前台机的操作员;
(7)总结经验,做好计算机网络修复维护记录,预防、避免类似事件发生。
4、各临床科室人员:
(1)住院患者需检查治疗者,由大夫开检查治疗单,并通知相关科室,先行检查治疗;(2)病房取药及夜间急诊,由医生开处方到药房借药,系统恢复后及时补录医嘱;(3)局域网恢复正常后,病房护士补录断网期间病房到药房借药的领药医嘱,以保证医院药品的实库存管理正常;
(4)断网期间,病房护士耐心做好暂不能办理出入院手续患者的解释工作。局域网恢复正常后,尽可能将当天已住(出)院未在网上办理手续者全部办理住(出)院手续,以保证患者实际住院日期和网上住院日期一致。
(5)医技科室根据医生的申请单为住院患者做相关的检查,并做好相关记录。局域网恢复正常后,对断网期间到本科室作检查的患者进行医嘱录入,以保证应计费用的完整。