Nothing Special   »   [go: up one dir, main page]

CN115150252A - 一种网络故障检测方法、系统及设备 - Google Patents

一种网络故障检测方法、系统及设备 Download PDF

Info

Publication number
CN115150252A
CN115150252A CN202210694861.9A CN202210694861A CN115150252A CN 115150252 A CN115150252 A CN 115150252A CN 202210694861 A CN202210694861 A CN 202210694861A CN 115150252 A CN115150252 A CN 115150252A
Authority
CN
China
Prior art keywords
network
fault
information
equipment
alarm information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210694861.9A
Other languages
English (en)
Inventor
丁宇桐
王生银
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cisco Networking Technology Co Ltd
Original Assignee
Inspur Cisco Networking Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cisco Networking Technology Co Ltd filed Critical Inspur Cisco Networking Technology Co Ltd
Priority to CN202210694861.9A priority Critical patent/CN115150252A/zh
Publication of CN115150252A publication Critical patent/CN115150252A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/20Network management software packages

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种网络故障检测方法、系统及设备,其中,方法包括:基于预先部署的网管软件,通过指定方式获取当前管理网络内各网络设备所产生的状态数据;指定方式包括向上上传和向下问询;对状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到状态数据对应网络设备的故障信息;状态数据包括设备标识数据和设备描述数据,设备描述数据用于描述网络设备的运行状态,故障信息包括故障描述信息;将故障描述信息与设备标识数据进行拼接处理,得到拼接后的告警信息;确定告警信息的故障优先级,按照故障优先级对告警信息依次进行展示。

Description

一种网络故障检测方法、系统及设备
技术领域
本申请涉及网络管理技术领域,具体涉及一种网络故障检测方法、系统及设备。
背景技术
随着网络技术的发展及网络应用规模的扩大,网络场景愈发复杂,并且,随着云计算等相关技术的发展,网络场景承载的业务种类也层出不穷,使得运维所需管理的内容越来越多,难度也在逐步增加。因此,如何在网络运行时准确评估风险,并对产生的故障进行快速排除,已成为现阶段亟待解决的一大问题。
发明内容
为了解决上述问题,本申请提出了一种网络故障检测方法,包括:基于预先部署的网管软件,通过指定方式获取当前管理网络内各网络设备所产生的状态数据;所述指定方式包括向上上传和向下问询;
对所述状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到所述状态数据对应网络设备的故障信息;所述状态数据包括设备标识数据和设备描述数据,所述设备描述数据用于描述网络设备的运行状态,所述故障信息包括故障描述信息;
将所述故障描述信息与所述设备标识数据进行拼接处理,得到拼接后的告警信息;
确定所述告警信息的故障优先级,按照所述故障优先级对所述告警信息依次进行展示。
在本申请的一种实现方式中,通过指定方式获取当前管理网络内各网络设备所产生的状态数据之前,所述方法还包括:
构建管理网络,并确定所述管理网络内的多个网络设备信息;
通过所述网管软件,对所述多个网络设备信息进行纳管,以根据纳管后的所述多个网络设备信息中的链路信息,生成所述管理网络对应的网络拓扑结构。
在本申请的一种实现方式中,通过所述网管软件,对所述多个网络设备信息进行纳管,具体包括:
对所述多个网络设备信息及其对应的状态反馈设备进行纳管,以使得所述网管软件能够通过IP网络访问所述管理网络内的网络设备,以及通过简单网络管理协议获取所述网络设备的网络设备基础信息;所述状态反馈设备向所述网管软件反馈所述网络设备的状态数据。
在本申请的一种实现方式中,通过指定方式获取当前管理网络内各网络设备所产生的状态数据,具体包括:
判断所述网络设备是否能够通过命令行开启状态数据自动获取模式;
若是,则直接向所述网管软件上传所述网络设备的状态数据;
若否,则通过所述网管软件向下问询的方式,周期性获取所述网络设备的状态数据。
在本申请的一种实现方式中,按照所述故障优先级对所述告警信息依次进行展示,具体包括:
从所述告警信息中,确定所述故障优先级低于预设值的指定告警信息;
在距离所述指定告警信息的获取时间大于预设时间段且所述告警信息未被确认的情况下,将所述指定告警信息的信息状态更改为超时状态。
在本申请的一种实现方式中,得到拼接后的告警信息之后,所述方法还包括:
根据所述告警信息,确定发生故障的指定网络设备和/或指定端口;
基于已生成的网络拓扑结构,对所述指定网络设备和/或指定端口进行标识,以进行告警提示。
在本申请的一种实现方式中,得到拼接后的告警信息之后,所述方法还包括:
通过预设的执行脚本,自动对所述告警信息进行排障处理。
在本申请的一种实现方式中,所述故障信息至少包括以下一项或多项:故障名称、故障风险等级、故障优先级、故障描述信息、故障影响。
本申请实施例提供了一种网络故障检测系统,其特征在于,所述系统包括:
网管软件基础模块,用于通过指定方式获取当前管理网络内各网络设备所产生的状态数据;所述指定方式包括向上上传和向下问询;
故障分析模块,用于对所述状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到所述状态数据对应网络设备的故障信息;所述状态数据包括设备标识数据和设备描述数据,所述设备描述数据用于描述网络设备的运行状态,所述故障信息包括故障描述信息;
还用于将所述故障描述信息与所述设备标识数据进行拼接处理,得到拼接后的告警信息;
交互模块,用于确定所述告警信息的故障优先级,按照所述故障优先级对所述告警信息依次进行展示。
本申请实施例提供了一种网络故障检测设备,其特征在于,应用于交换机上,所述设备包括:至少一个处理器;
以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
基于预先部署的网管软件,通过指定方式获取当前管理网络内各网络设备所产生的状态数据;所述指定方式包括向上上传和向下问询;
对所述状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到所述状态数据对应网络设备的故障信息;所述状态数据包括设备标识数据和设备描述数据,所述设备描述数据用于描述网络设备的运行状态,所述故障信息包括故障描述信息;
将所述故障描述信息与所述设备标识数据进行拼接处理,得到拼接后的告警信息;
确定所述告警信息的故障优先级,按照所述故障优先级对所述告警信息依次进行展示。
通过本申请提出的一种网络故障检测方法能够带来如下有益效果:
通过在管理网络中部署带有故障分析功能的网管软件,在日常网络运维工作中,不仅可对管理网络内的网络设备进行监控,还能够实时获取网络设备的状态数据及组网内变更信息,从而在对状态数据进行故障分析之后展示相应的告警信息,有利于保持网络运维的稳定性,且整个执行流程可自动化进行,提高了检测效率。并且,按照故障优先级展示告警信息,更为直观,有助于提高排障效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种网络故障检测方法的流程示意图;
图2为本申请实施例提供的一种网络故障检测系统的架构图;
图3为本申请实施例提供的一种网络故障检测设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
如图1所示,本申请实施例提供的一种网络故障检测方法,包括:
S101:基于预先部署的网管软件,通过指定方式获取当前管理网络内各网络设备所产生的状态数据;指定方式包括向上上传和向下问询。
网管软件能够完成网络管理功能,借助于预先部署的网管软件,运维人员可以经由网络管理员与被管理系统中代理交换网络信息,从而对网络环境的运行情况进行排查,以检测当前网络环境内是否存在故障。
网络设备指的是能够在网络环境内进行数据交互的设备,比如交换机、路由器、主机等。在本申请实施例中,首先需构建管理网络,即确认网管软件所运行的网络、设备环境,该环境内网管软件通过IP网络可与环境内设备如交换机、路由器、防火墙、负载均衡等网络设备进行IP连通,形成管理网络。在管理网络搭建完成后,确认管理网络内全部网络设备的网络设备信息,包括设备基础信息、管理网络IP、登录用户名、登录密码、简单网络管理协议(Simple Network Management Protocol,SNMP)相关配置等。该网络设备信息用于后续网管软件登录与管理设备,网管软件可通过这种方式,获取设备信息并进行配置变更等操作。同时,确认环境内已部署日志、告警信息服务器,该服务器用于收集环境内开启日志、告警功能的设备上传的各类信息。
在确认完管理网络内的多个网络设备信息之后,需通过网管软件,对多个网络设备信息进行纳管。需要说明的是,可通过网管软件的交互界面,添加网络设备信息以完成纳管过程。其中,网络设备信息具体包括网络设备基础信息、由网管软件可达的IP地址、设备管理用户名及密码、SNMP版本及团体名。
除网络设备信息需进行纳管之外,当前管理网络内的状态反馈设备也需进行纳管,状态反馈设备(比如日志、告警服务器等)能够向网管软件反馈网络设备的状态数据,这样,通过对多个网络设备信息及其对应的状态反馈设备进行纳管,能够使得网管软件通过IP网络访问管理网络内的各个网络设备,通过SNMP协议获取网络设备的网络设备基础信息。其中,网络设备基础信息用于表征网络设备的属性,包括设备厂商,设备型号,设备名称,当前版本,设备硬件使用率,设备链路状态、设备邻居等各项用于设备管理的所需参数。网管软件在获取到上述信息之后会将其保存至自身的数据中,为保证数据的时效性,数据的获取过程是周期性进行的。在某一网络设备完成纳管后,网管软件可根据获取得到的链路信息,确定与该网络设备互为邻居的邻居网络设备是否均完成纳管,若是,此生成可视化的网络拓扑结构,用以进行日常的运维查看,以及后续的故障分析功能。
在完成纳管操作之后,网管设备可通过指定方式获取网络设备的状态数据。状态数据指的是能够反映网络设备运行状态的数据,比如告警提示、日志信息等。网关软件可根据获取到的网络设备基础信息,比如厂商、型号信息,查询自身对应数据库。若该厂商型号的网络设备命令行存在网关软件的数据库中,则可根据命令行访问设备并开启状态数据自动获取模式,此时,网络设备可直接向网管设备上传其自身的状态数据。
需要说明的是,网络设备开启状态数据自动获取模式,实质上就是相当于开启日志、告警功能,设备日志、告警功能为具有跟踪用户活动、管理系统安全的功能,同时也能为系统进行诊断和维护提供依据,在设备在运行过程中,设备系统中的日志、告警模块会对运行中的各种情况进行记录,从而形成用户的状态数据。在开启网络设备的日志、告警功能后,网管软件将配置此前纳管的日志、告警服务器信息至网络设备中,确保网络设备上传日志、告警信息时,可被日志、告警服务器收集,再由网管软件周期性获取告警服务器内该类信息,用于故障排查等功能。
若网络设备无法通过命令行开启状态数据自动获取模式,那么,网管软件通过向下问询的方式,周期性获取网络设备的配置信息,比如端口状态、设备配置、链路状态、设备硬件使用率等,在获取上述配置信息后,将此次得到的配置信息与历史信息进行对比,如若出现如链路断开或硬件使用率过高等情况,则提取出现异常的配置信息,并将提取后的配置信息拼接为状态数据。
S102:对状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到状态数据对应网络设备的故障信息;状态数据包括设备标识数据和设备描述数据,设备描述数据用于描述网络设备的运行状态,故障信息包括故障描述信息。
状态数据通常包括网络设备名称、网络设备IP地址、触发时间等设备标识数据,以及用于描述网络设备运行状态的设备描述数据,比如日志参数等。在获取到网络设备的状态数据,通过正则匹配的方式,对状态数据进行关键词提取,从而根据提取到的关键词,从与当前网络设备型号配合使用的网管软件的故障数据库中,匹配得到网络设备的故障信息。
需要说明的是,故障信息包括故障名称,即根据该状态数据评估后得出可能造成故障的名称,如异常重启、端口环路;故障风险等级,即不同故障类型对应的风险等级,风险级别越高,说明故障将对网络及业务造成的影响更为严重;故障优先级,即运维人员应对该故障进行排查的优先级别,优先级越高,问题排查的优先度也应更高;故障描述信息,即某些状态数据中,会携带特定项的故障信息,如某端口故障或某设备异常重启等,网管软件将获取该类关键词,与描述拼接后进行显示;故障影响,即故障可能对业务造成的影响,以及如果故障未处理可能会造成的后续影响分析。
S103:将故障描述信息与设备标识数据进行拼接处理,得到拼接后的告警信息。
得到故障信息之后,将故障描述信息以及设备标识数据进行拼接处理,从而得到拼接后以字符形式存在的告警信息。
S104:确定告警信息的优先级,按照优先级对告警信息依次进行展示。
在得到告警信息之后,可根据告警信息从故障数据库中确定其对应的故障优先级,进而按照故障优先级的降序顺序,对告警信息依次进行展示,以使得运维人员能够优先处理优先级更高的故障。
在一个实施例中,根据告警信息可以确定发生故障的指定网络设备和/或指定端口,然后在网络拓扑结构中对指定网络设备和/或指定端口进行标识,从而进行告警提示。比如端口环路、端口flap等会影响物理链路的故障,网管软件将在网络拓扑结构中依据具体故障端口在拓扑图中用提示符进行标识。如设备异常重启或管理IP不可达,将依据异常的网络设备在拓扑图中用提示符进行标识。通过上述功能,便于运维人员在网络拓扑图中快速发现故障设备或端口,并根据提示信息进行后续排障工作。
本申请可根据故障是否已经完成确认对告警信息进行分类,具体可分为未确认状态、已确认/超时状态。在日志、告警信息出现时,均处于未确认状态,故障优先级高于预设值的告警信息将需要运维人员在网管软件交互界面上进行确认操作,在点击确认后,其信息状态更改为已确认状态。对于故障优先级低于预设值的指定告警信息,在信息获取超过预设时间段的情况下,如若仍未被确认,将更改其状态为超时状态。其中,预设时间段可设为一天,具体时间可根据实际情况进行设置,本申请对此不进行限定。通过对告警信息的信息状态进行限定,能够有效区分出当前未处理的告警信息,更为直观。
在一种可能实现的方式中,在对告警信息进行显示后,运维人员可在网管软件交互界面查看每条告警信息所需的参考信息,该参考信息可由网管软件自动下发。其中,参考信息为网管软件在完成告警信息查询后,获取数据库中预置的对应的信息并拼接为故障解决方式后显示,部分类型故障将显示由网管软件自动获取网络设备内排障所需参考信息,如端口状态、端口配置等信息。通过提供故障解决方式、排障所需信息等方式,节约了运维人员排障时间,也为排障提供了一定思路。
此外,在部分复杂程度较低的故障中,网管软件将自动下发预设的用于排障的命令行至交换机中,尽可能减少人工排障的操作。在网管软件中上传具有排障或运维功能的自动化脚本,当某条状态数据被网管软件获取后,将自动触发执行脚本动作,从而对告警信息进行排障处理,无需人工手动执行,提高了执行效率。
以上为本申请提出的方法实施例。基于同样的思路,本说明书一个或多个实施例还提供了上述方法对应的系统、设备及介质。
图2为本申请实施例提供的一种网络故障检测系统的架构图。如图2所示,系统包括:日志、告警服务器、纳管网络设备和网络管理软件。
在本申请实施例中,日志、告警服务器用于上传各网络设备所产生的的状态数据;纳管网络设备,用于对多个网络设备信息和日志、告警服务器进行纳管;网络管理软件包括网管软件基础模块、故障分析模块和交互模块。
其中,网管软件基础模块,用于通过指定方式获取当前管理网络内各网络设备所产生的状态数据;指定方式包括向上上传和向下问询;
故障分析模块,用于对状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到状态数据对应网络设备的故障信息;状态数据包括设备标识数据和设备描述数据,设备描述数据用于描述网络设备的运行状态,故障信息包括故障描述信息;
还用于将故障描述信息与设备标识数据进行拼接处理,得到拼接后的告警信息;
交互模块,用于确定告警信息的故障优先级,按照故障优先级对告警信息依次进行展示。
图3为本申请实施例提供的一种网络故障检测设备的结构示意图,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
基于预先部署的网管软件,通过指定方式获取当前管理网络内各网络设备所产生的状态数据;指定方式包括向上上传和向下问询;
对状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到状态数据对应网络设备的故障信息;状态数据包括设备标识数据和设备描述数据,设备描述数据用于描述网络设备的运行状态,故障信息包括故障描述信息;
将故障描述信息与设备标识数据进行拼接处理,得到拼接后的告警信息;
确定告警信息的故障优先级,按照故障优先级对告警信息依次进行展示。
本申请实施例提供了一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:
基于预先部署的网管软件,通过指定方式获取当前管理网络内各网络设备所产生的状态数据;指定方式包括向上上传和向下问询;
对状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到状态数据对应网络设备的故障信息;状态数据包括设备标识数据和设备描述数据,设备描述数据用于描述网络设备的运行状态,故障信息包括故障描述信息;
将故障描述信息与设备标识数据进行拼接处理,得到拼接后的告警信息;
确定告警信息的故障优先级,按照故障优先级对告警信息依次进行展示。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种网络故障检测方法,其特征在于,所述方法包括:
基于预先部署的网管软件,通过指定方式获取当前管理网络内各网络设备所产生的状态数据;所述指定方式包括向上上传和向下问询;
对所述状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到所述状态数据对应网络设备的故障信息;所述状态数据包括设备标识数据和设备描述数据,所述设备描述数据用于描述网络设备的运行状态,所述故障信息包括故障描述信息;
将所述故障描述信息与所述设备标识数据进行拼接处理,得到拼接后的告警信息;
确定所述告警信息的故障优先级,按照所述故障优先级对所述告警信息依次进行展示。
2.根据权利要求1所述的一种网络故障检测方法,其特征在于,通过指定方式获取当前管理网络内各网络设备所产生的状态数据之前,所述方法还包括:
构建管理网络,并确定所述管理网络内的多个网络设备信息;
通过所述网管软件,对所述多个网络设备信息进行纳管,以根据纳管后的所述多个网络设备信息中的链路信息,生成所述管理网络对应的网络拓扑结构。
3.根据权利要求2所述的一种网络故障检测方法,其特征在于,通过所述网管软件,对所述多个网络设备信息进行纳管,具体包括:
对所述多个网络设备信息及其对应的状态反馈设备进行纳管,以使得所述网管软件能够通过IP网络访问所述管理网络内的网络设备,以及通过简单网络管理协议获取所述网络设备的网络设备基础信息;所述状态反馈设备向所述网管软件反馈所述网络设备的状态数据。
4.根据权利要求1所述的一种网络故障检测方法,其特征在于,通过指定方式获取当前管理网络内各网络设备所产生的状态数据,具体包括:
判断所述网络设备是否能够通过命令行开启状态数据自动获取模式;
若是,则直接向所述网管软件上传所述网络设备的状态数据;
若否,则通过所述网管软件向下问询的方式,周期性获取所述网络设备的状态数据。
5.根据权利要求1所述的一种网络故障检测方法,其特征在于,按照所述故障优先级对所述告警信息依次进行展示,具体包括:
从所述告警信息中,确定所述故障优先级低于预设值的指定告警信息;
在距离所述指定告警信息的获取时间大于预设时间段且所述告警信息未被确认的情况下,将所述指定告警信息的信息状态更改为超时状态。
6.根据权利要求1所述的一种网络故障检测方法,其特征在于,得到拼接后的告警信息之后,所述方法还包括:
根据所述告警信息,确定发生故障的指定网络设备和/或指定端口;
基于已生成的网络拓扑结构,对所述指定网络设备和/或指定端口进行标识,以进行告警提示。
7.根据权利要求1所述的一种网络故障检测方法,其特征在于,得到拼接后的告警信息之后,所述方法还包括:
通过预设的执行脚本,自动对所述告警信息进行排障处理。
8.根据权利要求1所述的一种网络故障检测方法,其特征在于,所述故障信息至少包括以下一项或多项:故障名称、故障风险等级、故障优先级、故障描述信息、故障影响。
9.一种网络故障检测系统,其特征在于,所述系统包括:
网管软件基础模块,用于通过指定方式获取当前管理网络内各网络设备所产生的状态数据;所述指定方式包括向上上传和向下问询;
故障分析模块,用于对所述状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到所述状态数据对应网络设备的故障信息;所述状态数据包括设备标识数据和设备描述数据,所述设备描述数据用于描述网络设备的运行状态,所述故障信息包括故障描述信息;
还用于将所述故障描述信息与所述设备标识数据进行拼接处理,得到拼接后的告警信息;
交互模块,用于确定所述告警信息的故障优先级,按照所述故障优先级对所述告警信息依次进行展示。
10.一种网络故障检测设备,其特征在于,应用于交换机上,所述设备包括:至少一个处理器;
以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
基于预先部署的网管软件,通过指定方式获取当前管理网络内各网络设备所产生的状态数据;所述指定方式包括向上上传和向下问询;
对所述状态数据进行关键词提取,根据提取到的关键词,从预设的故障数据库中,匹配得到所述状态数据对应网络设备的故障信息;所述状态数据包括设备标识数据和设备描述数据,所述设备描述数据用于描述网络设备的运行状态,所述故障信息包括故障描述信息;
将所述故障描述信息与所述设备标识数据进行拼接处理,得到拼接后的告警信息;
确定所述告警信息的故障优先级,按照所述故障优先级对所述告警信息依次进行展示。
CN202210694861.9A 2022-06-20 2022-06-20 一种网络故障检测方法、系统及设备 Pending CN115150252A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210694861.9A CN115150252A (zh) 2022-06-20 2022-06-20 一种网络故障检测方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210694861.9A CN115150252A (zh) 2022-06-20 2022-06-20 一种网络故障检测方法、系统及设备

Publications (1)

Publication Number Publication Date
CN115150252A true CN115150252A (zh) 2022-10-04

Family

ID=83407598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210694861.9A Pending CN115150252A (zh) 2022-06-20 2022-06-20 一种网络故障检测方法、系统及设备

Country Status (1)

Country Link
CN (1) CN115150252A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116074182A (zh) * 2022-12-28 2023-05-05 广西交控智维科技发展有限公司 网络设备管理方法及装置
CN117170916A (zh) * 2023-08-15 2023-12-05 深圳金融科技研究院(中国人民银行金融科技研究院) 一种故障分析方法、装置、设备及存储介质
CN117411768A (zh) * 2023-10-07 2024-01-16 国家电网有限公司华东分部 信息展示方法及装置、计算机设备和可读存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103138960A (zh) * 2011-11-24 2013-06-05 百度在线网络技术(北京)有限公司 网络故障处理方法及装置
CN107046481A (zh) * 2017-04-18 2017-08-15 国网福建省电力有限公司 一种信息系统综合网管系统综合分析平台
CN108712294A (zh) * 2018-06-05 2018-10-26 陈艳 一种基于Syslog知识库实现网络设备监控告警的方法
CN109783322A (zh) * 2018-11-22 2019-05-21 远光软件股份有限公司 一种企业信息系统运行状态的监控分析系统及其方法
CN110224894A (zh) * 2019-06-18 2019-09-10 国网四川省电力公司内江供电公司 一种智能变电站过程层网络监测管理系统
CN111030857A (zh) * 2019-12-06 2020-04-17 深圳前海微众银行股份有限公司 网络告警方法、装置、系统与计算机可读存储介质
CN112636962A (zh) * 2020-12-15 2021-04-09 广东华兴银行股份有限公司 一种提高网络监控效率的方法、设备及介质
CN113067729A (zh) * 2021-03-18 2021-07-02 浪潮思科网络科技有限公司 一种网络设备监控方法、设备及介质
CN113986689A (zh) * 2021-09-24 2022-01-28 西安震有信通科技有限公司 一种自定义配置告警方法、系统及终端
CN114020585A (zh) * 2021-10-08 2022-02-08 中移(杭州)信息技术有限公司 业务处理方法、装置和计算机可读存储介质
CN114295930A (zh) * 2021-11-24 2022-04-08 科华数据股份有限公司 电力系统故障处理辅助决策方法、装置和设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103138960A (zh) * 2011-11-24 2013-06-05 百度在线网络技术(北京)有限公司 网络故障处理方法及装置
CN107046481A (zh) * 2017-04-18 2017-08-15 国网福建省电力有限公司 一种信息系统综合网管系统综合分析平台
CN108712294A (zh) * 2018-06-05 2018-10-26 陈艳 一种基于Syslog知识库实现网络设备监控告警的方法
CN109783322A (zh) * 2018-11-22 2019-05-21 远光软件股份有限公司 一种企业信息系统运行状态的监控分析系统及其方法
CN110224894A (zh) * 2019-06-18 2019-09-10 国网四川省电力公司内江供电公司 一种智能变电站过程层网络监测管理系统
CN111030857A (zh) * 2019-12-06 2020-04-17 深圳前海微众银行股份有限公司 网络告警方法、装置、系统与计算机可读存储介质
CN112636962A (zh) * 2020-12-15 2021-04-09 广东华兴银行股份有限公司 一种提高网络监控效率的方法、设备及介质
CN113067729A (zh) * 2021-03-18 2021-07-02 浪潮思科网络科技有限公司 一种网络设备监控方法、设备及介质
CN113986689A (zh) * 2021-09-24 2022-01-28 西安震有信通科技有限公司 一种自定义配置告警方法、系统及终端
CN114020585A (zh) * 2021-10-08 2022-02-08 中移(杭州)信息技术有限公司 业务处理方法、装置和计算机可读存储介质
CN114295930A (zh) * 2021-11-24 2022-04-08 科华数据股份有限公司 电力系统故障处理辅助决策方法、装置和设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116074182A (zh) * 2022-12-28 2023-05-05 广西交控智维科技发展有限公司 网络设备管理方法及装置
CN117170916A (zh) * 2023-08-15 2023-12-05 深圳金融科技研究院(中国人民银行金融科技研究院) 一种故障分析方法、装置、设备及存储介质
CN117411768A (zh) * 2023-10-07 2024-01-16 国家电网有限公司华东分部 信息展示方法及装置、计算机设备和可读存储介质
CN117411768B (zh) * 2023-10-07 2024-05-17 国家电网有限公司华东分部 信息展示方法及装置、计算机设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN115150252A (zh) 一种网络故障检测方法、系统及设备
CN109787817B (zh) 网络故障诊断方法、装置和计算机可读存储介质
CN105165054B (zh) 网络服务故障处理方法,服务管理系统和系统管理模块
CN111831514A (zh) 一种设备监控方法、装置、设备及存储介质
CN111082960B9 (zh) 数据的处理方法及装置
CN112769605B (zh) 一种异构多云的运维管理方法及混合云平台
US11956335B1 (en) Automated mapping of multi-tier applications in a distributed system
CN112291075B (zh) 网络故障定位方法、装置、计算机设备及存储介质
CN105099783A (zh) 一种实现业务系统告警应急处置自动化的方法及系统
CN107491371A (zh) 一种监控部署的方法以及装置
CN102638375A (zh) 一种网络故障识别方法及装置
CN106021070A (zh) 服务器集群监测方法及装置
US11934855B2 (en) System and method to autonomously manage hybrid information technology (IT) infrastructure
CN113672427A (zh) 基于rpa及ai的异常处理方法、装置、设备及介质
US20120284008A1 (en) Systems and methods for modeling a multi-layer network topology
CN111865673A (zh) 一种自动化故障管理方法、装置及系统
CN113285840B (zh) 存储网络故障根因分析方法及计算机可读存储介质
CN107204868B (zh) 一种任务运行监控信息获取方法和装置
CN109086094B (zh) 应用服务自启动的方法、系统、装置及存储介质
CN112671586B (zh) 一种业务配置自动迁移和保障方法及装置
CN113726808A (zh) 一种网站监测方法、装置、设备及存储介质
CN105025179A (zh) 呼叫中心座席的监控方法及系统
CN117650964A (zh) 一种智能化网络运维管理系统
CN115174350B (zh) 一种运维告警方法、装置、设备及介质
CN107547282B (zh) 一种信息与通信业务影响分析模型建立方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination