Nothing Special   »   [go: up one dir, main page]

CN111506422A - 事件分析方法及系统 - Google Patents

事件分析方法及系统 Download PDF

Info

Publication number
CN111506422A
CN111506422A CN202010269282.0A CN202010269282A CN111506422A CN 111506422 A CN111506422 A CN 111506422A CN 202010269282 A CN202010269282 A CN 202010269282A CN 111506422 A CN111506422 A CN 111506422A
Authority
CN
China
Prior art keywords
event
node
calculation
computing
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010269282.0A
Other languages
English (en)
Other versions
CN111506422B (zh
Inventor
李永福
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Hisense Media Network Technology Co Ltd
Original Assignee
Qingdao Hisense Media Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Hisense Media Network Technology Co Ltd filed Critical Qingdao Hisense Media Network Technology Co Ltd
Priority to CN202010269282.0A priority Critical patent/CN111506422B/zh
Publication of CN111506422A publication Critical patent/CN111506422A/zh
Application granted granted Critical
Publication of CN111506422B publication Critical patent/CN111506422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种事件分析方法及系统,属于计算机技术领域。该方法包括:在事件分析系统中发生待分析的第一事件后,获取第一事件的级别,以及与第一事件对应的多个指标的指标数据;基于第一事件的级别,确定分析第一事件所占用的计算资源;向计算节点发送事件关联计算请求。该事件关联计算请求用于指示计算节点采用计算资源,基于指标数据对第一事件进行关联性计算,以得到多个指标中与第一事件具有关联的目标指标。无需后台操作人员手动从多个指标中确定目标指标,仅需计算节点自动从多个指标中确定目标指标,有效的提高了从多个指标中确定目标指标的效率,进而提高了对该第一事件进行诊断的效率。

Description

事件分析方法及系统
技术领域
本申请涉及计算机技术领域,特别涉及一种事件分析方法及系统
背景技术
近年来,随着计算机技术日益成熟,用于监控互联网事件的服务器的规模也越来越大,为了减轻服务器的处理负担,往往需要采用分布式系统监控多个事件。
示例的,发布者将事件(例如,可以为服务器宕机事件)发布至分布式系统中,并由分布式系统中的事件管理节点监控事件是否发生。该事件管理节点还需要实时获取与事件对应多个指标(例如,数据写入成功率或数据读取成功率)的指标数据。如此,在事件发生后,后台操作人员可以基于与该事件对应的多个指标的指标数据,确定多个指标中与该事件具有关联的指标,进而可以分析出该事件发生的原因,以便后续对该事件进行诊断。
然而,目前与事件对应的指标的个数较多,当分布式系统中的某个事件发生后,后台操作人员无法快速的确定多个指标中与该事件具有关联的指标,而与该事件具有关联的指标是后续对该事件进行诊断的重要参考元素,因此,目前对已发生的事件进行诊断的效率较低。
发明内容
本申请实施例提供了一种事件分析方法及系统。可以解决现有技术的对已发生的事件进行诊断的效率较低的问题,所述技术方案如下:
一方面,提供了一种事件分析方法,应用于事件分析系统中的任务调度节点,所述事件分析系统包括所述任务调度节点和计算节点,所述方法包括:
在所述事件分析系统中发生待分析的第一事件后,获取所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据;
基于所述第一事件的级别,确定分析所述第一事件所占用的计算资源;
向所述计算节点发送事件关联计算请求,所述事件关联计算请求用于指示所述计算节点采用所述计算资源,基于所述指标数据对所述第一事件进行关联性计算,以得到所述多个指标中与所述第一事件具有关联的目标指标。
另一方面,提供了一种事件分析系统,所述事件分析系统包括:任务调度节点和计算节点;
所述任务调度节点用于:在所述事件分析系统中发生待分析的第一事件后,获取所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据;
所述任务调度节点用于:基于所述第一事件的级别,确定分析所述第一事件所占用的计算资源;
所述任务调度节点用于:向所述计算节点发送事件关联计算请求,所述事件关联计算请求用于指示所述计算节点采用所述计算资源,基于所述指标数据对所述第一事件进行关联性计算;
所述计算节点用于:采用所述第一事件的计算资源,对所述第一事件进行关联性计算,以得到所述多个指标中与所述第一事件具有关联的目标指标。
本申请实施例提供的技术方案带来的有益效果至少包括:
在事件分析系统发生待分析的第一事件后,通过任务调度节点向计算节点发送事件关联性计算请求,使得计算节点可以基于指标数据对该第一事件进行关联性计算,从而可以得到多个指标中与该第一事件具有关联的目标指标。无需后台操作人员手动从多个指标中确定目标指标,仅需计算节点自动从多个指标中确定目标指标,有效的提高了从多个指标中确定目标指标的效率,进而提高了对该第一事件进行诊断的效率。并且,任务调度节点可以基于事件的级别,为事件配置不同的计算资源,且事件的级别与分析该事件所占用的计算资源呈正相关,如此,在采用计算节点对级别较高的事件进行关联性计算时,计算节点可以采用较多的计算资源对其进行关联性计算,有效的减少了对级别较高的事件进行关联性计算的耗时,从而进一步的提高了对级别较高的事件进行诊断的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种事件分析方法所涉及的事件分析系统的结构图;
图2是本申请实施例提供的一种事件分析方法的流程图;
图3是本申请实施例提供的另一种事件分析方法的流程图;
图4是本申请实施例提供的一种事件分析装置的结构框图;
图5是本申请实施例提供的另一种事件分析装置的结构框图;
图6是本申请实施例提供的又一种事件分析装置的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1,图1是本申请实施例提供的一种事件分析方法所涉及的事件分析系统的结构图。该事件分析系统100可以包括:任务调度节点101和计算节点102。任务调度节点101可以与计算节点102建立通信连接。
任务调度节点101可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。计算节点102可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心,或者为一个计算机设备。
可选的,该事件分析系统100还可以包括:数据存储节点103、事件管理节点104和优化计算节点105。该数据存储节点103可以分别与任务调度节点101和事件管理节点104建立通信连接,该优化计算节点105可以与及计算节点102建立通信连接。
该数据存储节点103、事件管理节点103和优化计算节点均可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心,或者为一个计算机设备。
需要说明的是,本申请实施例中所谓的通信连接,可以是通过有线网络或者无线网络建立的通信连接。
请参考图2,图2是本申请实施例提供的一种事件分析方法的流程图。该事件分析方法应用于图1示出的事件分析系统100中的任务调度节点101。该事件分析方法可以包括:
步骤201、在事件分析系统中发生待分析的第一事件后,获取第一事件的级别,以及与该第一事件对应的多个指标的指标数据。
步骤202、基于第一事件的级别,确定分析第一事件所占用的计算资源。
在本申请实施例中,该计算资源可以为中央处理器(英文:Central ProcessingUnit;简称:CPU)核数和内存,该内存的单位可以为:吉字节(G)。示例的,任务调度节点可以基于第一事件的级别,确定分析该第一事件所占用的CPU核数和内存。
在本申请中,事件的级别与分析该事件所占用的计算资源呈正相关。也即是,当事件的级别越高时,分析该事件所占用的技术资源越多。如此,后续采用计算节点对级别较高的事件进行关联性计算时,计算节点可以采用较多的计算资源对其进行关联性计算,有效的减少了对级别较高的事件进行关联性计算的耗时。
步骤203、向计算节点发送事件关联计算请求,该事件关联计算请求用于指示计算节点采用计算资源,基于指标数据对第一事件进行关联性计算,以得到多个指标中与第一事件具有关联的目标指标。
综上所述,本申实施例提供的事件分析方法,在事件分析系统发生待分析的第一事件后,通过任务调度节点向计算节点发送事件关联性计算请求,使得计算节点可以基于指标数据对该第一事件进行关联性计算,从而可以得到多个指标中与该第一事件具有关联的目标指标。无需后台操作人员手动从多个指标中确定目标指标,仅需计算节点自动从多个指标中确定目标指标,有效的提高了从多个指标中确定目标指标的效率,进而提高了对该第一事件进行诊断的效率。并且,任务调度节点可以基于事件的级别,为事件配置不同的计算资源,且事件的级别与分析该事件所占用的计算资源呈正相关,如此,在采用计算节点对级别较高的事件进行关联性计算时,计算节点可以采用较多的计算资源对其进行关联性计算,有效的减少了对级别较高的事件进行关联性计算的耗时,从而进一步的提高了对级别较高的事件进行诊断的效率。
请参考图3,图3是本申请实施例提供的另一种事件分析方法的流程图。该事件分析方法应用于图1示出的事件分析系统100。该事件分析方法可以包括:
步骤301、事件管理节点向数据存储节点周期性的发送多个事件中与每个事件对应的多个指标的指标数据。
事件管理系统中的事件可以是发布者在事件管理节点中进行添加的事件,同时发布者还需要在事件管理系统中添加与事件对应的多个指标。通常情况下,一个事件是否发生,与该事件对应的多个指标有关。例如,假设该事件可以为服务器的宕机事件,与该服务器的宕机事件对应的多个指标可以包括:数据写入成功率和数据读取成功率等,若数据写入成功率小于第一阈值,数据读取成功率小于第二阈值,则该服务器的宕机事件可能会发发生。
在本申请实施例中,事件管理节点需要实时监控多个事件中与每个事件对应的多个指标的指标数据,并向数据存储节点周期性的发送多个事件中与每个事件对应的多个指标的指标数据。
可选的,事件管理节点需要实时监控事件是否已发生,并生成相应的事件数据后,周期性的发送给数据存储节点。该事件的事件数据用于指示事件是否发生。需要说明的是,事件管理节点可以同时将其监控到的事件数据和指标数据发送给数据存储节点。还需要说明的是,本申请实施例中的指标数据和事件数据均属于时序数据。
步骤302、数据存储节点存储事件管理节点发送的与每个事件对应的多个指标的指标数据。
在本申请实施例中,数据存储节点可以存储事件管理节点发送的与每个事件对应的多个指标的指标数据。
在本申请中,在事件管理节点向数据存储节点发送每个事件的事件数据后,数据存储节点可以对其进行存储。由于事件数据和指标数据是通过数事件管理节点实时监控到的数据,因此,在数据存储节点中可以存储有关于每个事件的海量的指标数据和事件数据。数据存储节点在存储指标数据和事件数据时,还需为其建立时间索引,也即是,对其添加时间戳。示例的,对于每个事件,在数据存储节点每次接收到该事件的事件数据,以及与该事件对应的多个指标的指标数据后,数据存储节点可以为该事件数据和该指标数据建立一个时间索引后,对其进行存储。如此,便于后台操作人员随时查询某个事件在某个时刻是否发生,以及查询对应的多个指标的指标数据。
在本申请实施例中,由于事件管理节点在存储指标数据和事件数据时,需要按照不同类型的事件,对指标数据和事件数据分类存储。例如,对于事件1,数据存储节点需要将事件1的事件数据,以及与事件1对应的指标数据作为事件1的时序数据存储在一起;对于事件2,数据存储节点需要将事件2的事件数据,以及与事件2对应的指标数据作为事件2的时序数据存储在一起。
为了便于数据存储节点对数据的快速存储,该数据存储节点可以为ES(英文全称:ElasticSearch,一个分布式的存储服务器),利用ES的动态映射功能,能够快速的对数据存储节点接收到的数据进行存储。示例的,事件数据和指标数据中均会携带有特定的数据字段,每个数据字段与一种类型的事件对应,数据存储节点可以对该特定的数据字段进行提取和识别,以确定事件数据或指标数据的数据类型,从而能够实现对数据的快速存储。同时,当事件分析系统中新增加指标后,可以对新增加的指标配置特定的数据字段,如此,在数据存储节点存储该新添加的指标数据后,可以根据其携带的特定的数据字段对其进行快速存储。因此,对于新增加的指标,无需人工干预,只需要对其定义特定的数据字段进行提取和识别,便能够实现对该新增加的指标的指标数据的快速存储。
可选的,当发布者在事件管理节点中进行添加的事件后,发布者还需要对不同的事件添加相应的标识,并为不同的事件配置不同的级别,以得到事件的标识与级别的对应关系,并将其发送给数据存储节点,由数据存储节点进行存储。
如此,数据存储节点中可以存储有每个事件的事件数据,与每个事件对应的多个指标的指标数据,以及事件的标识与级别的对应关系。
步骤303、在待分析的第一事件发生后,事件管理节点向任务调度节点发送携带有第一事件的标识的数据获取请求。
在本申请实施例中,在待分析的第一事件发生后,事件管理节点可以向任务调度节点发送携带有第一事件的标识的数据获取请求。示例的,事件管理节点可以监控事件是否发生,当事件管理节点监控到第一事件发生后,该事件管理节点可以向任务调度节点发送数据获取请求。
步骤304、任务调度节点向数据存储节点转发该数据获取请求。
在本申请实施例中,在任务调度节点接收到事件管理节点发送的数据获取请求后,该任务调度节点可以向数据存储节点转发该数据获取请求。
步骤305、数据存储节点基于第一事件的标识查询该第一事件的级别,以及与该第一事件对应的多个指标的指标数据。
在本申请实施例中,数据存储节点在接收到任务调度节点发送的数据获取请求后,数据存储节点可以基于第一事件的标识查询该第一事件的级别,以及与该第一事件对应的多个指标的指标数据。
需要说明的是,在事件管理节点监控到第一事件发生后,可以将发生该第一事件的时间点添加到数据获取请求中。如此,数据获取请求中还携带有发生第一事件时的时间点,由于数据存储节点中存储的指标数据携带有时间戳,因此数据存储节点基于该时间点,可以获取到第一事件发生时,与该第一事件对应的多个指标的指标数据。
可选的,数据存储节点在获取到与第一事件对应的多个指标的指标数据后,还需要基于数据存储节点中记录的第一事件的历史指标数据,对该指标数据进行验证,保证数据存储节点所获取到与第一事件对应的多个指标的指标数据的正确性,避免出现由于事件监控节点在指标数据的监控阶段出现错误时,导致该指标数据的并不准确而影响后续对该第一事件进行诊断时的准确程度。
步骤306、数据存储节点向任务调度节点发送查询到的第一事件的级别,以及与该第一事件对应的对应的多个指标的指标数据。
在本申实施例中,在数据存储节点查询到第一事件的级别,以及与该第一事件对应的多个指标的指标数据,可以将其发送给任务调度节点。
步骤307、任务调度节点基于第一事件的级别,确定分析该第一事件所占用的计算资源。
在本申请实施例中,任务调度节点可以基于第一事件的级别,确定分析该第一事件所占用的计算资源。
示例的,任务调度节点可以查询事件的级别与计算资源的对应关系,并基于第一事件的级别与该对应关系,确定分析该第一事件所占用的计算资源。可选的,该计算资源可以为CPU核数和内存,例如,任务调度节点基于该对应关系可以确定出:分析该第一事件所占用的CPU核数为2核,内存为2G。
步骤308、任务调度节点向计算节点发送事件关联计算请求。
在本申请实施例中,任务调度节点可以向计算节点发送事件关联计算请求。可选的,该事件关联计算请求中携带有与第一事件对应的多个指标的指标数据,以及用于指示分析第一事件时所占用的计算资源的信息。事件关联计算请求用于指示计算节点采用该第一事件的计算资源,基于该指标数据对第一事件进行关联性计算,以得到多个指标中与第一事件具有关联的目标指标。
步骤309、计算节点采用第一事件的计算资源,对该第一事件进行关联性计算,以得到多个指标中与该第一事件具有关联的目标指标。
在本申请实施例中,计算节点在接收到任务调度节点发送的事件关联计算请求后,可以采用第一事件的计算资源,对该第一事件进行关联性计算,以得到多个指标中与该第一事件具有关联的目标指标。
在本申请中,第一事件的发生可能有多种原因,在不同原因导致第一事件发生后,与该第一事件具有关联的指标也不同。例如,假设与第一事件对应的多个指标分别为指标a、指标b、指标c和指标d,第一事件发生的原因分别为原因A和原因B。当由于原因A导致第一事件发生时,与该第一事件具有关联的目标指标可以为指标a和指标b;当由于原因B导致第一事件发生时,与该第一事件具有关联的目标指标可以为指标c和指标d。
在一种可能的实现方式中,为了确保计算节点可以优先对级别较高的事件的进行关联性计算,本申请提供的事件分析方法还可以包括以下几个步骤:
步骤A1、任务调度节点在向计算节点发送事件关联计算请求之前,获取计算节点中正在进行关联性计算的第二事件的级别。
在本申请实施例中,任务调度节点在向计算节点发送事件关联计算请求之前,任务调度节点需要获取计算节点中正在进行关联计算的第二事件的级别。
示例的,任务调度节点可以向计算节点发送第一查询请求;计算节点在接收到第一查询请求后,可以将其正在关联性计算的第二事件的标识发送给任务调度节点;任务调度节点在接收到第二事件的标识后,即可通过事件的标识与级别的对应关系查询到该第二事件的级别。
步骤B1、在任务调度节点确定出第一事件的级别高于第二事件的级别后,任务调度节点查询计算节点的剩余资源。
在本申请实施例中,在任务调度节点确定出第一事件的级别高于第二事件的级别后,任务调度节点需要查询计算节点的剩余资源。
示例的,任务调度节点可以向计算节点发送事件第二查询请求;计算节点在接收到第二查询请求后,可以向任务调度节点发送用于指示计算节点的剩余资源的指示信息;任务调度节点在接收到该指示信息后,即可获取到计算节点的剩余资源。
需要说明的是,在任务调度节点确定出第一事件的级别不高于第二事件的级别后,若计算节点的剩余资源充足,则可以直接对该第一事件进行关联性计算,也即是,执行上述步骤308;若计算节点的剩余资源不足,则需要在对第二事件的关联性计算完成之后,再对该第一事件进行关联性计算。
步骤C1、任务调度节点检测计算节点的剩余资源是否小于第一事件的的计算资源。
在本申请实施例中,任务调度节点在查询到计算节点的剩余资源后,需要检测该计算节点的剩余资源是否小于第一事件的计算资源。若任务调度节点检测出计算节点的剩余资源小于第一事件的计算资源后,执行步骤D1;若任务调度节点检测出计算节点的剩余资源小于第一事件的计算资源后,则可以直接对该第一事件进行关联性计算,也即是,执行上述步骤308。
步骤D1、若任务调度调度节点检测出计算节点的剩余资源小于该第一事件的计算资源,则向计算节点发送第一暂停指令。
在本申请实施例中,若任务调度调度节点检测出计算节点的剩余资源小于该第一事件的计算资源,则向计算节点发送第一暂停指令。该第一暂停指令用于指示计算节点暂停对第二事件的关联性计算。
在本申请中,计算节点在接收到任务调度节点发送的第一暂停指令后,可以暂停对第二事件的关联性计算。计算节点在对第二事件的关联性计算暂停后,向任务调度调度节点发送第一暂停响应,该第一暂停响应用于向任务调度节点指示第二事件的关联性计算已暂停。任务调度节点在接收到该第一暂停响应后,即可向计算节点发送事件关联请求,也即是,执行上述步骤308。
在另一种可能的实现方式中,为了保证计算节点能够在最短的时间内完成对级别最高的事件的关联性计算,本申请提供的事件分析方法还可以包括以下几个步骤:
步骤A2、当第一事件的级别为最高级别时,任务调度节点预测计算节点是否在指定时长内完成对该第一事件的关联性计算。
在本申请实施例中,当第一事件的级别为最高级别时,在任务调度节点向计算节点发送事件关联计算请求之后,任务调度节点需要预测计算节点的是否能够在指定时长内完成对该第一事件的关联性计算。
示例的,任务调度节点可以基于与第一事件对应的多个指标的指标数据的数据量,以及该第一事件的计算资源,预测计算节点是否能够在指定时长内完成对该第一事件的关联性计算。
若任务调度预测得到计算节点在指定时长内未完成对第一事件的关联性计算,则执行步骤B2;若任务调度预测得到计算节点在指定时长内完成对第一事件的关联性计算,则停止动作。
步骤B2、若任务调度预测得到计算节点在指定时长内未完成对第一事件的关联性计算,则向计算节点发送第二暂停指令。
在本申请实施例中,若任务调度预测得到计算节点在指定时长内未完成对第一事件的关联性计算,则任务调度节点需要向计算节点发送第二暂停指令。该第二暂停指令用于指示计算节点暂停对除第一事件之外的其他事件的关联性计算,并指示计算节点采用计算节点的所有计算资源对第一事件进行关联性计算。
在本申请中,计算节点在接收到任务调度节点发送的第二暂停指令后,可以暂停除第一事件之外的其他事件的关联性计算,并指示计算节点采用其所有的计算资源对该第一事件进行关联性计算。如此,可以加快计算节点对第一事件进行关联性计算的速度,使得计算节点能够在最短的时间内完成对级别最高的事件进行关联性计算。
步骤310、计算节点向数据存储节点发送携带有目标指标的标识的事件关联计算响应。
在本申请实施例中,在计算节点对第一事件进行事件关联性计算,以得到多个指标中与该第一事件具有关联的目标指标后,计算节点可以向数据存储节点发送携带有目标指标的标识的事件关联计算响应。数据存储节点在接收到该事件关联计算响应后,可以基于目标指标的标识,存储与第一事件具有关联的目标指标。如此,在第一事件发生后,后台操作人员即可通过数据存储节点查询到与该第一事件具有关联的目标指标,从而便于操后台操作人员对该第一事件进行诊断。
需要说明的是,事件分析系统通过上述步骤301至步骤310能够完成对事件的关联性计算,在本申请实施例中,为了保证计算节点计算的准确度,该任务调度节点还需要执行下述步骤311至步骤316。
步骤311、优化计算节点在指定时刻时,向计算节点发送多个计算参数组。
在本申请实施例中,优化计算节点可以在指定时刻时,向计算节点发送多个参数组。在本申请中,各个计算参数组中至少两个计算参数的数据不同。示例的,每个计算参数组包括的参数可以该为:数据采样周期和数据采样的总时长等。
步骤312、计算节点基于每个计算参数组,对指定事件进行关联性计算,得到与每个计算参数组对应的关联性计算结果。
在本申请实施例中,计算节点可以基于每个计算参数组,对指定事件进行关联性计算,得到与每个计算参数组对应的关联性计算结果。
在本申请中,该关联性计算结果为与指定事件对应的多个指标中和该指定数据关联的指标。示例的,假设与指定事件对应的多个指标包括:指标e、指标f和指标g,对于计算参数组AA和计算参数组BB,与计算参数组AA对应的关联性计算结果为指标e和指标f,与计算参数组BB对应的关联性计算结果为指标e和指标g。
需要说明的是,该指定事件可以为后台操作人员预先添加的事件,与该指定的事件对应的多个指标的指标数据是固定的。
步骤313、计算节点向优化计算节点发送多个关联性计算结果。
在本申请实施例中,计算节点得到与每个计算参数组对应的关联性计算结果,可以向优化计算节点发送多个关联性计算结果。
步骤314、优化计算节点确定每个关联性计算结果的准确度,并将准确度最高的关联性计算结果所对应的计算参数组确定为优化参数组。
在本申请实施例中,优化计算节点接收到计算节点发送的多个关联性计算结果后,该优化计算节点需要确定每个关联性计算结果的准确度,并将准确度最高的关联性计算结果所对应的计算参数组确定为优化参数组。
示例的,由于指定事件是操作人员预先添加的,与该指定的事件对应的多个指标的指标数据是固定的,因此,操作人员也可以在优化计算节点中预先提添加参考计算结果,该参考计算结果为操作人员认为与该指定事件具有关联的较为准确的指标。如此,优化计算节点可以基于该参考计算结果与每个关联性计算结果进行比较,以得到每个关联性计算结果的准确度。
步骤315、优化计算节点向计算节点发送优化参数组。
在本申请实施例中,在优化计算节点确定出优化参数组后,可以将该优化参数组发送给计算节点。
步骤316、计算节点基于优化参数组调整计算节点的参数。
在本申请实施例中,在计算参数组接收到该优化参数组后,可以基于优化参数组调整计算节点的参数,从而使得计算节点在对事件进行关联性计算时,提高得到的关联性计算结果的准确度。
需要说明的是,本申请实施例提供的事件分析方法的步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。
综上所述,本申实施例提供的事件分析方法,在事件分析系统发生待分析的第一事件后,通过任务调度节点向计算节点发送事件关联性计算请求,使得计算节点可以基于指标数据对该第一事件进行关联性计算,从而可以得到多个指标中与该第一事件具有关联的目标指标。无需后台操作人员手动从多个指标中确定目标指标,仅需计算节点自动从多个指标中确定目标指标,有效的提高了从多个指标中确定目标指标的效率,进而提高了对该第一事件进行诊断的效率。并且,任务调度节点可以基于事件的级别,为事件配置不同的计算资源,且事件的级别与分析该事件所占用的计算资源呈正相关,如此,在采用计算节点对级别较高的事件进行关联性计算时,计算节点可以采用较多的计算资源对其进行关联性计算,有效的减少了对级别较高的事件进行关联性计算的耗时,从而进一步的提高了对级别较高的事件进行诊断的效率。
本申请实施例还提供了一种事件分析装置,该事件分析装置可以集成在图1示出的事件分析系统100中的任务调度节点101内。请参考图4,图4是本申请实施例提供的一种事件分析装置的结构框图,该事件分析装置400可以包括:
第一获取模块401,用于在事件分析系统中发生待分析的第一事件后,获取第一事件的级别,以及与第一事件对应的多个指标的指标数据;
确定模块402,用于基于第一事件的级别,确定分析第一事件所占用的计算资源;
第一发送模块403,用于向计算节点发送事件关联计算请求,事件关联计算请求用于指示计算节点采用计算资源,基于指标数据对第一事件进行关联性计算,以得到多个指标中与第一事件具有关联的目标指标。
综上所述,本申实施例提供的事件分析装置,在事件分析系统发生待分析的第一事件后,通过任务调度节点向计算节点发送事件关联性计算请求,使得计算节点可以基于指标数据对该第一事件进行关联性计算,从而可以得到多个指标中与该第一事件具有关联的目标指标。无需后台操作人员手动从多个指标中确定目标指标,仅需计算节点自动从多个指标中确定目标指标,有效的提高了从多个指标中确定目标指标的效率,进而提高了对该第一事件进行诊断的效率。并且,任务调度节点可以基于事件的级别,为事件配置不同的计算资源,且事件的级别与分析该事件所占用的计算资源呈正相关,如此,在采用计算节点对级别较高的事件进行关联性计算时,计算节点可以采用较多的计算资源对其进行关联性计算,有效的减少了对级别较高的事件进行关联性计算的耗时,从而进一步的提高了对级别较高的事件进行诊断的效率。
可选的,请参考图5,图5是本申请实施例提供的另一种事件分析装置的结构框图,该事件分析装置400还可以包括:
第二获取模块404,用于在向计算节点发送事件关联计算请求之前,获取计算节点中正在进行关联性计算的第二事件的级别。
查询模块405,用于在确定出第一事件的级别高于第二事件的级别后,查询计算节点的剩余资源。
第二发送模块406,用于若计算节点的剩余资源小于第一事件的计算资源,则向计算节点发送第一暂停指令。该第一暂停指令用于指示计算节点暂停对第二事件的关联性计算。
可选的,请参考图6,图6是本申请实施例提供的又一种事件分析装置的结构框图,该事件分析装置400还可以包括:
预测模块407,用于在向计算节点发送事件关联计算请求之后,当第一事件的级别为最高级别时,预测计算节点是否在指定时长内完成对第一事件的关联性计算。
第三发送模块408,用于若预测得到计算节点在指定时长内未完成对第一事件的关联性计算,则向计算节点发送第二暂停指令。该第二暂停指令用于指示计算节点暂停对除第一事件之外的其他事件的关联性计算,并指示计算节点采用计算节点的所有计算资源对第一事件进行关联性计算。
可选的,第一获取模块401,用于:向数据存储节点发送携带有第一事件的标识的数据获取请求,数据获取请求用于指示数据存储节点基于第一事件的标识查询第一事件的级别,以及与第一事件对应的多个指标的指标数据;接收数据存储节点发送的第一事件的级别,以及与第一事件对应的多个指标的指标数据。
综上所述,本申实施例提供的事件分析装置,在事件分析系统发生待分析的第一事件后,通过任务调度节点向计算节点发送事件关联性计算请求,使得计算节点可以基于指标数据对该第一事件进行关联性计算,从而可以得到多个指标中与该第一事件具有关联的目标指标。无需后台操作人员手动从多个指标中确定目标指标,仅需计算节点自动从多个指标中确定目标指标,有效的提高了从多个指标中确定目标指标的效率,进而提高了对该第一事件进行诊断的效率。并且,任务调度节点可以基于事件的级别,为事件配置不同的计算资源,且事件的级别与分析该事件所占用的计算资源呈正相关,如此,在采用计算节点对级别较高的事件进行关联性计算时,计算节点可以采用较多的计算资源对其进行关联性计算,有效的减少了对级别较高的事件进行关联性计算的耗时,从而进一步的提高了对级别较高的事件进行诊断的效率。
本申请实施例还提供了一种事件分析系统,如图1所示,该事件分析系统100可以包括:任务调度节点101和计算节点102。可选的,该事件分析系统100还可以包括:数据存储节点103、事件管理节点104和优化计算节点105。图4、图5或图6示出的事件分析装置400可以集成在任务调度节点101中。
该事件分析系统中的任务调度节点、计算节点、数据存储节点、事件管理节点和优化计算节点的作用如下:
任务调度节点用于:在事件分析系统中发生待分析的第一事件后,获取第一事件的级别,以及与第一事件对应的多个指标的指标数据;
任务调度节点用于:基于第一事件的级别,确定分析第一事件所占用的计算资源;
任务调度节点用于:向计算节点发送事件关联计算请求,事件关联计算请求用于指示计算节点采用计算资源,基于指标数据对第一事件进行关联性计算;
计算节点用于:采用第一事件的计算资源,对第一事件进行关联性计算,以得到多个指标中与第一事件具有关联的目标指标。
可选的,任务调度节点还用于:在向计算节点发送事件关联计算请求之前,获取计算节点中正在进行关联性计算的第二事件的级别;
任务调度节点还用于:在确定第一事件的级别高于第二事件的级别后,查询计算节点的剩余资源;
任务调度节点还用于:若计算节点的剩余资源小于第一事件的计算资源,则向计算节点发送第一暂停指令;
计算节点还用于:基于第一暂停指令暂停对第二事件的关联性计算。
可选的,任务调度节点还用于:在向计算节点发送事件关联计算请求之后,当第一事件的级别为等级最高级别时,检测计算节点是否在指定时长内完成对第一事件的关联性计算。
任务调度节点还用于:若检测出计算节点在指定时长内未完成对第一事件的关联性计算,则向计算节点发送第二暂停指令。
计算阶段还用于:基于第二暂停指令暂停对除第一事件之外的其他事件的关联性计算,并指示计算节点按照计算节点的所有计算资源对第一事件进行关联性计算。
可选的,优化计算节点用于:在指定时刻时,向计算节点发送多个计算参数组,各个计算参数组中至少两个计算参数的数据不同。
计算节点用于:基于每个计算参数组,对指定事件进行关联性计算,得到与每个计算参数组对应的关联性计算结果,并向优化计算节点发送多个关联性计算结果。
优化计算节点用于:确定每个关联性计算结果的准确度,将准确度最高的关联性计算结果所对应的计算参数组作为优化参数组发送给计算参数。
计算节点用于:基于优化参数组调整计算节点的参数。
可选的,任务调度节点还用于:向数据存储节点发送携带有第一事件的标识的数据获取请求。
数据存储节点用于:在接收到数据获取请求后,基于第一事件的标识查询第一事件的级别,以及与第一事件对应的多个指标的指标数据,并向任务调度节点发送查询到的第一事件的级别,以及与第一事件对应的多个指标的指标数据。
可选的,事件管理节点用于:向数据存储节点周期性的发送与每个事件对应的多个指标的指标数据。
事件管理节点还用于:在第一事件发生后,向任务调度节点发送携带有第一事件的标识的数据获取请求。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令,该指令由处理器加载并执行以实现图2或图3示出的事件分析方法。
本申请实施例还提供了一种计算机设备,包括:处理器和存储器,该存储器中存储有至少一条指令,指令由处理器加载并执行以实现图2或图3示出的事件分析方法。
在本申请中,术语“第一”和“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种事件分析方法,其特征在于,应用于事件分析系统中的任务调度节点,所述事件分析系统包括所述任务调度节点和计算节点,所述方法包括:
在所述事件分析系统中发生待分析的第一事件后,获取所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据;
基于所述第一事件的级别,确定分析所述第一事件所占用的计算资源;
向所述计算节点发送事件关联计算请求,所述事件关联计算请求用于指示所述计算节点采用所述计算资源,基于所述指标数据对所述第一事件进行关联性计算,以得到所述多个指标中与所述第一事件具有关联的目标指标。
2.根据权利要求1所述的方法,其特征在于,在向所述计算节点发送事件关联计算请求之前,所述方法还包括:
获取所述计算节点中正在进行关联性计算的第二事件的级别;
在确定出所述第一事件的级别高于所述第二事件的级别后,查询所述计算节点的剩余资源;
若所述计算节点的剩余资源小于所述第一事件的计算资源,则向所述计算节点发送第一暂停指令,所述第一暂停指令用于指示所述计算节点暂停对所述第二事件的关联性计算。
3.根据权利要求1所述的方法,其特征在于,在向所述计算节点发送事件关联计算请求之后,所述方法还包括:
当所述第一事件的级别为最高级别时,预测所述计算节点是否在指定时长内完成对所述第一事件的关联性计算;
若预测得到所述计算节点在所述指定时长内未完成对所述第一事件的关联性计算,则向所述计算节点发送第二暂停指令,所述第二暂停指令用于指示所述计算节点暂停对除所述第一事件之外的其他事件的关联性计算,并指示所述计算节点采用所述计算节点的所有计算资源对所述第一事件进行关联性计算。
4.根据权利要求1至3任一所述的方法,其特征在于,所述事件管理系统还包括数据存储节点,所述数据存储节点存储有与多个事件中每个事件对应的多个指标的指标数据,以及事件的标识与级别的对应关系;
获取所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据,包括:
向所述数据存储节点发送携带有所述第一事件的标识的数据获取请求,所述数据获取请求用于指示所述数据存储节点基于所述第一事件的标识查询所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据;
接收所述数据存储节点发送的所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据。
5.一种事件分析系统,其特征在于,所述事件分析系统包括:任务调度节点和计算节点;
所述任务调度节点用于:在所述事件分析系统中发生待分析的第一事件后,获取所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据;
所述任务调度节点用于:基于所述第一事件的级别,确定分析所述第一事件所占用的计算资源;
所述任务调度节点用于:向所述计算节点发送事件关联计算请求,所述事件关联计算请求用于指示所述计算节点采用所述计算资源,基于所述指标数据对所述第一事件进行关联性计算;
所述计算节点用于:采用所述第一事件的计算资源,对所述第一事件进行关联性计算,以得到所述多个指标中与所述第一事件具有关联的目标指标。
6.根据权利要求5所述的系统,其特征在于,
所述任务调度节点还用于:在向所述计算节点发送事件关联计算请求之前,获取所述计算节点中正在进行关联性计算的第二事件的级别;
所述任务调度节点还用于:在确定所述第一事件的级别高于所述第二事件的级别后,查询所述计算节点的剩余资源;
所述任务调度节点还用于:若所述计算节点的剩余资源小于所述第一事件的计算资源,则向所述计算节点发送第一暂停指令;
所述计算节点还用于:基于所述第一暂停指令暂停对所述第二事件的关联性计算。
7.根据权利要求6所述的系统,其特征在于,
所述任务调度节点还用于:在向所述计算节点发送事件关联计算请求之后,当所述第一事件的级别为等级最高级别时,检测所述计算节点是否在指定时长内完成对所述第一事件的关联性计算;
所述任务调度节点还用于:若检测出所述计算节点在所述指定时长内未完成对所述第一事件的关联性计算,则向所述计算节点发送第二暂停指令;
所述计算阶段还用于:基于所述第二暂停指令暂停对除所述第一事件之外的其他事件的关联性计算,并指示所述计算节点按照所述计算节点的所有计算资源对所述第一事件进行关联性计算。
8.根据权利要求6至7任一所述的系统,其特征在于,所述事件管理系统还包括优化计算节点;
所述优化计算节点用于:在指定时刻时,向所述计算节点发送多个计算参数组,各个所述计算参数组中至少两个计算参数的数据不同;
所述计算节点用于:基于每个所述计算参数组,对指定事件进行关联性计算,得到与每个所述计算参数组对应的关联性计算结果,并向所述优化计算节点发送多个所述关联性计算结果;
所述优化计算节点用于:确定每个所述关联性计算结果的准确度,将准确度最高的关联性计算结果所对应的计算参数组作为优化参数组发送给所述计算参数;
所述计算节点用于:基于所述优化参数组调整所述计算节点的参数。
9.根据权利要求5至7任一所述的系统,其特征在于,所述事件管理系统还包括数据存储节点,所述数据存储节点存储有与多个事件中每个事件对应的多个指标的指标数据,以及事件的标识与级别的对应关系;
所述任务调度节点还用于:向所述数据存储节点发送携带有所述第一事件的标识的数据获取请求;
所述数据存储节点用于:在接收到所述数据获取请求后,基于所述第一事件的标识查询所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据,并向所述任务调度节点发送查询到的所述第一事件的级别,以及与所述第一事件对应的多个指标的指标数据。
10.根据权利要求9所述的系统,其特征在于,所述事件管理系统还包括事件管理节点;
所述事件管理节点用于:向所述数据存储节点周期性的发送与每个所述事件对应的多个指标的指标数据;
所述事件管理节点还用于:在所述第一事件发生后,向所述任务调度节点发送携带有所述第一事件的标识的数据获取请求。
CN202010269282.0A 2020-04-08 2020-04-08 事件分析方法及系统 Active CN111506422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010269282.0A CN111506422B (zh) 2020-04-08 2020-04-08 事件分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010269282.0A CN111506422B (zh) 2020-04-08 2020-04-08 事件分析方法及系统

Publications (2)

Publication Number Publication Date
CN111506422A true CN111506422A (zh) 2020-08-07
CN111506422B CN111506422B (zh) 2023-01-20

Family

ID=71864732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010269282.0A Active CN111506422B (zh) 2020-04-08 2020-04-08 事件分析方法及系统

Country Status (1)

Country Link
CN (1) CN111506422B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022048671A1 (zh) * 2020-09-07 2022-03-10 华为技术有限公司 事件分类方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106712980A (zh) * 2015-07-17 2017-05-24 中兴通讯股份有限公司 一种网元分组方法及装置、通信系统
CN107086923A (zh) * 2016-02-16 2017-08-22 中兴通讯股份有限公司 通信网络性能指标分析方法及装置
CN109471727A (zh) * 2018-10-29 2019-03-15 北京金山云网络技术有限公司 一种任务处理方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106712980A (zh) * 2015-07-17 2017-05-24 中兴通讯股份有限公司 一种网元分组方法及装置、通信系统
CN107086923A (zh) * 2016-02-16 2017-08-22 中兴通讯股份有限公司 通信网络性能指标分析方法及装置
CN109471727A (zh) * 2018-10-29 2019-03-15 北京金山云网络技术有限公司 一种任务处理方法、装置及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022048671A1 (zh) * 2020-09-07 2022-03-10 华为技术有限公司 事件分类方法和装置

Also Published As

Publication number Publication date
CN111506422B (zh) 2023-01-20

Similar Documents

Publication Publication Date Title
CN102576326B (zh) 操作监测设备、操作监测方法和程序存储介质
EP2523115B1 (en) Operation management device, operation management method, and program storage medium
EP3745272A1 (en) An application performance analyzer and corresponding method
CN110502366B (zh) 案例执行方法、装置、设备及计算机可读存储介质
CN112506915B (zh) 一种应用数据的管理系统以及处理方法、装置和服务器
CN111563014A (zh) 接口服务性能测试方法、装置、设备和存储介质
US10411969B2 (en) Backend resource costs for online service offerings
CN110096419A (zh) 接口日志的获取方法、接口日志管理服务器及业务服务器
CN111045911A (zh) 性能测试方法、性能测试装置、存储介质与电子设备
CN115269108A (zh) 一种数据处理方法、装置及设备
US20180095819A1 (en) Incident analysis program, incident analysis method, information processing device, service identification program, service identification method, and service identification device
JP6252309B2 (ja) 監視漏れ特定処理プログラム,監視漏れ特定処理方法及び監視漏れ特定処理装置
US11212174B2 (en) Network management device and network management method
CN111506422B (zh) 事件分析方法及系统
US7623527B2 (en) Method for analyzing network trace, method for judging order among nodes, processor for analyzing network trace, computer-executable program for controlling computer as processor, and method for correcting time difference among nodes in network
US20130117275A1 (en) Index monitoring system, index monitoring method and program
CN108667740A (zh) 流量控制的方法、装置及系统
CN112118127B (zh) 一种基于故障相似度的服务可靠性保障方法
CN107368351B (zh) 一种虚拟机配置自动升级扩容方法和装置
CN110825593B (zh) 一种进程的异常状态检测方法、装置、设备及存储介质
CN110011845B (zh) 日志采集方法及系统
CN115545452B (zh) 运维方法、运维系统、设备及存储介质
JP7038629B2 (ja) 機器状態監視装置及びプログラム
CN113760689A (zh) 接口故障的报警方法、装置、设备及存储介质
CN111752786A (zh) 压力测试过程中的数据存储方法、汇总方法、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant