Nothing Special   »   [go: up one dir, main page]

CN116775364B - 一种应用服务健康管理方法、装置、电子设备及存储介质 - Google Patents

一种应用服务健康管理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116775364B
CN116775364B CN202311027707.7A CN202311027707A CN116775364B CN 116775364 B CN116775364 B CN 116775364B CN 202311027707 A CN202311027707 A CN 202311027707A CN 116775364 B CN116775364 B CN 116775364B
Authority
CN
China
Prior art keywords
service
unhealthy
health
determining
leaf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311027707.7A
Other languages
English (en)
Other versions
CN116775364A (zh
Inventor
淮晓永
蒯亮
李俊达
胡志明
王皓
沈亚楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
6th Research Institute of China Electronics Corp
Original Assignee
6th Research Institute of China Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 6th Research Institute of China Electronics Corp filed Critical 6th Research Institute of China Electronics Corp
Priority to CN202311027707.7A priority Critical patent/CN116775364B/zh
Publication of CN116775364A publication Critical patent/CN116775364A/zh
Application granted granted Critical
Publication of CN116775364B publication Critical patent/CN116775364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本公开提供了一种应用服务健康管理方法、装置、电子设备及存储介质,通过获取非健康服务,确定与所述非健康服务相关联的关联应用服务;根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态;确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。可以提升针对不同非健康状态的适用性,从根源上解决引起服务非健康的问题。

Description

一种应用服务健康管理方法、装置、电子设备及存储介质
技术领域
本公开涉及网络信息技术领域,具体而言,涉及一种应用服务健康管理方法、装置、电子设备及存储介质。
背景技术
目前,随着信息化技术的不断发展,越来越多的信息系统为人们的工作、科研以及生活提供了便利。在这些信息系统中,通常采用微服务架构,系统后台由多个应用服务组成,并通过服务网关与前台客户端服务连接,服务网关负责各服务的API路由功能,将请求转发到目标服务。调用方只需要知道网关对外暴露的服务API就可以透明地访问后端的服务,若某个应用服务或者某个API接口出现问题时,会停止向用户提供服务内容,影响用户的使用,因此,针对应用服务的健康管理极为重要。
在现有的服务健康管理技术方案中,往往定时检测服务端口是否可以访问,如果不能访问则认为该服务发生了故障,一般通过重启故障服务来恢复系统。但是这种服务健康检测与故障恢复只是基于服务端口可访问状态的简单健康管理,只能通过重启故障服务来修复系统,针对不同非健康状态的适用性较差。
发明内容
本公开实施例至少提供一种应用服务健康管理方法、装置、电子设备及存储介质,可以提升针对不同非健康状态的适用性,从根源上解决引起服务非健康的问题。
本公开实施例提供了一种应用服务健康管理方法,包括:
获取非健康服务,确定与所述非健康服务相关联的关联应用服务;
根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;
在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点对应的目标非健康状态;
确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。
一种可选的实施方式中,在所述确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复之后,所述方法还包括:
在所述非健康服务关联关系图中修剪所述叶子非健康服务节点;
遍历所述非健康服务关联关系图,重复选取叶子非健康服务节点的步骤,直至所述非健康服务关联关系图遍历完成。
一种可选的实施方式中,所述获取非健康服务,确定与所述非健康服务相关联的关联应用服务,具体包括:
根据预设的服务检测周期,针对每个应用服务的API接口调用过程,调取该应用服务对应的服务健康检测接口,获取该API接口调用过程对应的健康状态信息;
在所述健康状态信息中筛选出非健康状态,确定具有所述非健康状态的所述非健康服务;
获取所述非健康服务在运行过程中所调用的子服务API接口,确定所述子服务API接口对应的子应用服务,以及调用该非健康服务API接口的父应用服务;
将所述子应用服务以及所述父应用服务确定为所述关联应用服务。
一种可选的实施方式中,基于以下步骤在所述非健康服务关联关系图中选取叶子非健康服务节点:
确定所述非健康服务关联关系图中的全部叶子节点,当节点没有子节点时该节点为叶子节点,确定关联关系图中没有子节点的节点作为叶子节点;
从非健康叶子节点集中选取具有最高优先级的叶子节点作为目标叶子节点;
确定所述目标叶子节点对应的所述健康状态信息是否为所述非健康状态;
若是,则将该目标叶子节点确定为所述叶子非健康服务节点;
若不是,则修剪该目标叶子节点,并重复选取所述目标叶子节点的步骤,直至所述目标叶子节点对应的所述健康状态信息为所述非健康状态。
一种可选的实施方式中,所述确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复,具体包括:
根据所述目标非健康状态,确定所述非健康服务对应的非健康类型;
在预设的服务健康处理规则库中,确定与所述非健康类型相匹配的所述目标处理规则,其中,所述服务健康处理规则库中预先存储有多种非健康类型以及每种非健康类型对应的处理规则;
生成所述目标处理规则对应的健康修复指令,执行所述健康修复指令,针对所述叶子非健康服务节点进行健康修复。
本公开实施例还提供一种应用服务健康管理装置,包括:
服务健康监测模块,用于检测应用服务的健康状态,确定与非健康服务相关联的关联应用服务;
关联关系图构建模块,用于根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;
非健康状态确定模块,用于在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点对应的目标非健康状态;
健康修复模块,用于确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。
本公开实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述应用服务健康管理方法,或上述应用服务健康管理方法中任一种可能的实施方式中的步骤。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述应用服务健康管理方法,或上述应用服务健康管理方法中任一种可能的实施方式中的步骤。
本公开实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序、指令被处理器执行时实现上述应用服务健康管理方法,或上述应用服务健康管理方法中任一种可能的实施方式中的步骤。
本公开实施例提供的一种应用服务健康管理方法、装置、电子设备及存储介质,通过获取非健康服务,确定与所述非健康服务相关联的关联应用服务;根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态;确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。可以提升针对不同非健康状态的适用性,从根源上解决引起服务非健康的问题。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种应用服务健康管理方法的流程图;
图2示出了本公开实施例所提供的另一种应用服务健康管理方法的流程图;
图3示出了本公开实施例所提供的一种应用服务健康管理装置的示意图;
图4示出了本公开实施例所提供的一种电子设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
经研究发现,在现有的服务健康管理技术方案中,往往定时检测服务端口是否可以访问,如果不能访问则认为该服务发生了故障,一般通过重启故障服务来恢复系统。但是这种服务健康检测与故障恢复只是基于服务端口可访问状态的简单健康管理,只能通过重启故障服务来修复系统,针对不同非健康状态的适用性较差。
基于上述研究,本公开提供了一种应用服务健康管理方法、装置、电子设备及存储介质,通过获取非健康服务,确定与所述非健康服务相关联的关联应用服务;根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态;确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。可以提升针对不同非健康状态的适用性,从根源上解决引起服务非健康的问题。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种应用服务健康管理方法进行详细介绍,本公开实施例所提供的应用服务健康管理方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备包括:服务器(包括云服务器)、工作站计算机、台式计算机、笔记本计算机、平板电脑等。在一些可能的实现方式中,该应用服务健康管理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图1所示,为本公开实施例提供的一种应用服务健康管理方法的流程图,所述方法包括步骤S101~S104,其中:
S101、获取非健康服务,确定与所述非健康服务相关联的关联应用服务。
在具体实施中,在当前系统应用内检测出现非健康状态的非健康服务,并在系统应用所具有的全部应用服务中确定与该非健康服务之间存在关联的关联应用服务。
这里,非健康服务为应用服务在API调用时出现负载非健康的服务。
可选的,本公开实施例可应用于基于微服务架构的计算流体力学(ComputationalFluid Dynamics,CFD)系统,该系统应用可以通过模拟仿真试验分析工业设计方案的流体动力学特性,进而改进优化设计方案,其所具有的应用服务可以包括:用户管理服务、项目管理服务、网格生成服务、求解器服务、后处理分析服务。
其中,用户管理服务用于提供用户信息管理、用户身份认证、用户数据存储管理等功能。项目管理服务用于管理每个仿真试验项目的元数据信息,包括项目名称、项目工作路径、项目网格文件、求解方案设置、计算结果数据等信息。一个用户可以有多个项目,用户通过客户端选择一个项目作为当前仿真试验项目,对其进行仿真试验分析。网格生成服务用于负责按照网格生成方法对连续计算域流场进行离散化,把一个连续的几何区域分割成许多很小的单元,以便在离散的单元上进行流场代数方程的数值求解计算。求解器服务用于负责在给定的离散化的流场网格上,在给定的试验边界条件下,根据CFD物理模型进行方程求解,计算各时刻的流场状态。后处理分析服务用于对仿真试验求解结果流场数据进行可视化分析,以云图、等值线图、流线图等方式给用户提供流场的特征规律。
作为一种可能的实施方式,步骤S101可以通过如下步骤S1011-步骤S1015实现:
S1011、根据预设的服务检测周期,针对每个应用服务的API接口调用过程,调取该应用服务对应的服务健康检测接口,获取该API接口调用过程对应的健康状态信息。
在具体实施中,在每个服务检测周期,调用每个应用服务的服务健康检测接口,进行一次服务的健康状态监测,得到应用服务的健康状态。由于只有在调用服务API使用服务时才会暴漏出相应的非健康状态,比如:如果服务的CPU配额较小,则在调用服务CPU密集型API接口时会出现超时卡顿非健康现象。因此在API接口调用过程中进行相应的健康状态监测是发现服务非健康状态的有效方式。
这里,每个应用服务对应实现一个服务健康检测接口,该服务健康检测接口根据服务检测周期内的API接口非健康日志数据,统计分析建立服务的API接口功能健康状态作为该API接口调用过程对应的健康状态信息。
需要说明的是,健康状态信息中记录了API接口调用过程为健康状态还是非健康状态,在一般情况下,健康状态信息可以仅对非健康状态进行记录存储。
示例性的,非健康状态信息的消息格式可以为:{“ServiceName”:“服务名”,“HealthStat”:“UH”,“UHStats”:[非健康状态集]},其中UH表示非健康UnHealthy。
其中,在应用服务的每个API接口实现时,除了进行接口功能的计算处理返回处理结果数据外,还评估API接口的健康状态,如果API接口处理时间超过了期望阈值,则会记录一条API非健康日志数据。
示例性的,API非健康日志数据的消息格式可以为:TimeStamp, API_name: API类型,非健康状态,实际用时,期望用时,CPU%,MEM%,NET%。例如:2022-10-26 05:14:47, API_uff.solver.run:I-MPI,超时,实际用时,期望用时,100%,30%,40%。
S1012、在所述健康状态信息中筛选出非健康状态,确定具有所述非健康状态的所述非健康服务。
这里,服务API接口按计算任务分类可以分为CPU密集型(I-API)和I/O密集型(II-API)。调用API时出现的非健康状态主要包括超时,即未能在期望的时间内完成处理,易造成系统卡顿、响应迟缓,甚至死机。
进一步的,如果服务负载过轻则会造成系统资源的浪费,为了提高系统资源利用率,以便在出现瓶颈资源时提高系统的调节能力,因此负载过轻也是一种非健康状态。
其中,若服务的资源占用率过高(>70%),则认为负载过重;若服务的资源占用率过低(<30%)则认为负载过轻。资源主要包括:CPU、内存、网络带宽。
S1013、获取所述非健康服务在运行过程中所调用的子服务API接口,确定所述子服务API接口对应的子应用服务,以及调用该非健康服务API接口的父应用服务。
S1014、将所述父应用服务与所述子应用服务作为所述非健康服务,重复确定子应用服务以及父应用服务的步骤,直至遍历全部所述应用服务。
S1015、将所述子应用服务以及所述父应用服务确定为所述关联应用服务。
在具体实施中,确定非健康服务在运行过程中所调用的API接口,将拥有该API接口的应用服务作为子应用服务;将运行过程中调用该非健康服务的API接口的应用服务作为父应用服务,进一步的遍历全部应用服务进行该步骤,将寻找到的全部子应用服务以及父应用服务确定为关联应用服务。
示例性的,如果服务A的API接口处理中调用了服务B的API接口,则服务A和服务B之间具有关联关系,被调用的服务B是服务A的子应用服务。相反的如果服务A的API接口处理中被服务B的API接口调用,则服务A和服务B之间同样具有关联关系,服务B是服务A的父应用服务。
需要说明的是,在检测出的全部子应用服务以及父应用服务中需要针对当前非健康服务进行过滤,以免出现重复检测。
S102、根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图。
在具体实施中,由非健康服务与关联应用服务作为叶子节点,非健康服务与关联应用服务之间的关联关系作为连接边,构建非健康服务关联关系图。
这里,连接边还包括关联应用服务之间的关联关系,非健康服务与关联应用服务之间的关联关系,以及关联应用服务之间的关联关系可以通过如上步骤S1013中的父级、子级关系进行确定,以确定非健康服务关联关系图中各个叶子节点之间的连接顺序。
S103、在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态。
在具体实施中,按照深度优先遍历非健康服务关联关系图,在非健康服务关联关系图中找到一个具有非健康状态的叶子非健康服务节点,并确定该叶子非健康服务节点在API接口调用过程中对应的目标非健康状态。
具体的,步骤S103可以通过如下步骤S1031-步骤S1035实现:
S1031、确定所述非健康服务关联关系图中的全部叶子节点;
S1032、遍历每两个所述叶子节点之间的节点优先级,选取具有较高优先级的所述叶子节点作为目标叶子节点,其中,所述节点优先级为所述子应用服务的优先级高于所述父应用服务的优先级;
S1033、确定所述目标叶子节点对应的所述健康状态信息是否为所述非健康状态;
S1034、若是,则将该目标叶子节点确定为所述叶子非健康服务节点;
S1035、若不是,则修剪该目标叶子节点,并重复选取所述目标叶子节点的步骤,直至所述目标叶子节点对应的所述健康状态信息为所述非健康状态。
这里,在选取叶子非健康服务节点的过程中,根据服务关联关系图,按照深度优先顺序,子应用服务的优先级高于父应用服务的优先级,即先解决非健康的子应用服务,再解决非健康的父应用服务。
这样,可以避免因关联的子应用服务非健康引起的服务假非健康状态,造成无效的健康管理调节。
S104、确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。
在具体实施中,步骤S104可以通过如下步骤S1041-步骤S1043实现:
S1041、根据所述目标非健康状态,确定所述非健康服务对应的非健康类型。
S1042、在预设的服务健康处理规则库中,确定与所述非健康类型相匹配的所述目标处理规则,其中,所述服务健康处理规则库中预先存储有多种非健康类型以及每种非健康类型对应的处理规则。
S1043、生成所述目标处理规则对应的健康修复指令,执行所述健康修复指令,针对所述叶子非健康服务节点进行健康修复。
这里,预设的服务健康处理规则库中,预先定义了各种非健康状态对应的非健康类型,在出现时相应的处理规则。
其中,处理规则可以包括:若非健康类型为服务非存活,则处理规则为重启服务;若非健康类型为服务负载过轻时:若非健康类型为服务CPU负载过轻,则处理规则为减小服务的CPU配额;若非健康类型为服务内存负载过轻,则处理规则为减小服务的内存配额;若非健康类型为服务网络负载过轻,则处理规则为减小服务的网络带宽配额。
进一步的,若非健康类型为I-API(CPU密集型API接口)超时非健康时:如果CPU负载过重,则处理规则为增加服务的CPU配额;如果内存负载过重,则处理规则为增加服务的MEM配额。若非健康类型为II-API(IO密集型API接口)超时非健康时:如果网络负载过重,则处理规则为增加服务的网络带宽配额;如果磁盘IO过高,则处理规则为增大服务的数据存储周期。
进一步的,根据监测到的服务非健康状态,触发相应的服务健康管理规则,生成相应的服务健康管理操作命令,实现对服务的健康修复。
需要说明的是,在进行健康修复的过程中先解决非健康的子应用服务,再解决非健康的父应用服务。
本公开实施例提供的一种应用服务健康管理方法,通过获取非健康服务,确定与所述非健康服务相关联的关联应用服务;根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态;确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。可以提升针对不同非健康状态的适用性,从根源上解决引起服务非健康的问题。
参见图2所示,为本公开实施例提供的另一种应用服务健康管理方法的流程图,所述方法包括步骤S201~S206,其中:
S201、获取非健康服务,确定与所述非健康服务相关联的关联应用服务。
S202、根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图。
S203、在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态。
S204、确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。
这里,步骤S201-步骤S204与步骤S101-步骤S104实质相同,具有相同的实施方式并且可以达到相同的技术效果,对此不再进行赘述。
S205、在所述非健康服务关联关系图中修剪所述叶子非健康服务节点。
S206、遍历所述非健康服务关联关系图,重复选取叶子非健康服务节点的步骤,直至所述非健康服务关联关系图遍历完成。
在具体实施中,针对修复完成的叶子非健康服务节点进行修剪去除,重复步骤S203-步骤S205,直至非健康服务关联关系图遍历完成,即可视为完成一次服务健康管理,之后按照管理周期,重复步骤S201-步骤S206,进行连续的服务健康监测管理。
本公开实施例提供的一种应用服务健康管理方法,通过获取非健康服务,确定与所述非健康服务相关联的关联应用服务;根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态;确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。在所述非健康服务关联关系图中修剪所述叶子非健康服务节点。遍历所述非健康服务关联关系图,重复选取叶子非健康服务节点的步骤,直至所述非健康服务关联关系图遍历完成。可以提升针对不同非健康状态的适用性,从根源上解决引起服务非健康的问题。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与应用服务健康管理方法对应的应用服务健康管理装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述应用服务健康管理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图3,图3为本公开实施例提供的一种应用服务健康管理装置的示意图。如图3中所示,本公开实施例提供的应用服务健康管理装置300包括:
服务健康监测模块310,用于监测应用服务的健康状态,确定与非健康服务相关联的关联应用服务。
关联关系图构建模块320,用于根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图。
非健康状态确定模块330,用于在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点对应的目标非健康状态。
健康修复模块340,用于确定与所述目标非健康状态对应的目标健康修复处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本公开实施例提供的一种应用服务健康管理装置,通过获取非健康服务,确定与所述非健康服务相关联的关联应用服务;根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态;确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复。在所述非健康服务关联关系图中修剪所述叶子非健康服务节点。遍历所述非健康服务关联关系图,重复选取叶子非健康服务节点的步骤,直至所述非健康服务关联关系图遍历完成。可以提升针对不同非健康状态的适用性,从根源上解决引起服务非健康的问题。
对应于图1与图2中的应用服务健康管理方法,本公开实施例还提供了一种电子设备400,如图4所示,为本公开实施例提供的电子设备400结构示意图,包括:
处理器41、存储器42、和总线43;存储器42用于存储执行指令,包括内存421和外部存储器422;这里的内存421也称内存储器,用于暂时存放处理器41中的运算数据,以及与硬盘等外部存储器422交换的数据,处理器41通过内存421与外部存储器422进行数据交换,当所述电子设备400运行时,所述处理器41与所述存储器42之间通过总线43通信,使得所述处理器41执行图1与图2中的应用服务健康管理方法的步骤。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的应用服务健康管理方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品包括有计算机指令,所述计算机指令被处理器执行时可以执行上述方法实施例中所述的应用服务健康管理方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (9)

1.一种应用服务健康管理方法,其特征在于,包括:
获取非健康服务,确定与所述非健康服务相关联的关联应用服务;
根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;
在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点在API接口调用过程中对应的目标非健康状态;
确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复;
所述获取非健康服务,确定与所述非健康服务相关联的关联应用服务,具体包括:
根据预设的服务检测周期,针对每个应用服务的API接口调用过程,调取该应用服务对应的服务健康检测接口,获取该API接口调用过程对应的健康状态信息;
在所述健康状态信息中筛选出非健康状态,确定具有所述非健康状态的所述非健康服务;
获取所述非健康服务在运行过程中所调用的子服务API接口,确定所述子服务API接口对应的子应用服务,以及调用该非健康服务API接口的父应用服务;
将所述父应用服务与所述子应用服务作为所述非健康服务,重复确定子应用服务以及父应用服务的步骤,直至遍历全部所述应用服务;
将所述子应用服务以及所述父应用服务确定为所述关联应用服务。
2.根据权利要求1所述的方法,其特征在于,在所述确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复之后,所述方法还包括:
在所述非健康服务关联关系图中修剪所述叶子非健康服务节点;
遍历所述非健康服务关联关系图,重复选取其他叶子非健康服务节点的步骤,直至所述非健康服务关联关系图遍历完成。
3.根据权利要求1所述的方法,其特征在于,基于以下步骤在所述非健康服务关联关系图中选取叶子非健康服务节点:
确定所述非健康服务关联关系图中的全部叶子节点,当节点没有子节点时该节点为叶子节点,确定关联关系图中没有子节点的节点作为叶子节点;
从全部叶子节点中选择优先级最高的节点作为目标叶子节点;
确定所述目标叶子节点对应的所述健康状态信息是否为所述非健康状态;
若是,则将该目标叶子节点确定为所述叶子非健康服务节点;
若不是,则修剪该目标叶子节点,并重复选取所述目标叶子节点的步骤,直至所述目标叶子节点对应的所述健康状态信息为所述非健康状态。
4.根据权利要求1所述的方法,其特征在于,所述确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复,具体包括:
根据所述目标非健康状态,确定所述非健康服务对应的非健康类型;
在预设的服务健康处理规则库中,确定与所述非健康类型相匹配的所述目标处理规则,其中,所述服务健康处理规则库中预先存储有多种非健康类型以及每种非健康类型对应的处理规则;
生成所述目标处理规则对应的健康修复指令,执行所述健康修复指令,针对所述叶子非健康服务节点进行健康修复。
5.一种应用服务健康管理装置,其特征在于,包括:
服务健康监测模块,用于监测应用服务的健康状态,确定与非健康服务相关联的关联应用服务;
关联关系图构建模块,用于根据所述非健康服务与所述关联应用服务之间的关联关系,构建非健康服务关联关系图;
非健康状态确定模块,用于在所述非健康服务关联关系图中选取叶子非健康服务节点,并确定所述叶子非健康服务节点对应的目标非健康状态;
健康修复模块,用于确定与所述目标非健康状态对应的目标处理规则,根据所述目标处理规则针对所述叶子非健康服务节点进行健康修复;
所述服务健康监测模块具体用于:
根据预设的服务检测周期,针对每个应用服务的API接口调用过程,调取该应用服务对应的服务健康检测接口,获取该API接口调用过程对应的健康状态信息;
在所述健康状态信息中筛选出非健康状态,确定具有所述非健康状态的所述非健康服务;
获取所述非健康服务在运行过程中所调用的子服务API接口,确定所述子服务API接口对应的子应用服务,以及调用该非健康服务API接口的父应用服务;
将所述父应用服务与所述子应用服务作为所述非健康服务,重复确定子应用服务以及父应用服务的步骤,直至遍历全部所述应用服务;
将所述子应用服务以及所述父应用服务确定为所述关联应用服务。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括循环模块,所述循环模块用于:
在所述非健康服务关联关系图中修剪所述叶子非健康服务节点;
遍历所述非健康服务关联关系图,重复选取叶子非健康服务节点的步骤,直至所述非健康服务关联关系图遍历完成。
7.根据权利要求5所述的装置,其特征在于,所述服务健康监测模块具体用于:
根据预设的服务检测周期,针对每个应用服务,调取该应用服务对应的服务健康检测接口,获取每个应用服务对应的健康状态信息,由健康检测接口对健康状态进行分类,以在修复时实现按类进行修复管理;
在所述健康状态信息中筛选出非健康状态,确定具有所述非健康状态的所述非健康服务;
确定所述非健康服务在运行过程中所调用的子服务API接口,以及调用该非健康服务API接口的父应用服务;
以所述父应用服务作为所述非健康服务,重复所述确定所述非健康服务在运行过程中所调用的子服务API接口,以及调用该非健康服务API接口的父应用服务的步骤,直至遍历全部所述应用服务;
将所述子服务API接口对应的子应用服务以及所述父应用服务确定为所述关联应用服务。
8.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至4中任一项所述的应用服务健康管理方法的步骤。
9.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至4中任一项所述的应用服务健康管理方法的步骤。
CN202311027707.7A 2023-08-16 2023-08-16 一种应用服务健康管理方法、装置、电子设备及存储介质 Active CN116775364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311027707.7A CN116775364B (zh) 2023-08-16 2023-08-16 一种应用服务健康管理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311027707.7A CN116775364B (zh) 2023-08-16 2023-08-16 一种应用服务健康管理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN116775364A CN116775364A (zh) 2023-09-19
CN116775364B true CN116775364B (zh) 2023-12-05

Family

ID=88011839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311027707.7A Active CN116775364B (zh) 2023-08-16 2023-08-16 一种应用服务健康管理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116775364B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10521235B1 (en) * 2019-06-27 2019-12-31 Capital One Services, Llc Determining problem dependencies in application dependency discovery, reporting, and management tool
CN111404759A (zh) * 2020-04-17 2020-07-10 腾讯科技(深圳)有限公司 服务检测方法、规则配置方法、相关设备及介质
CN112434308A (zh) * 2020-12-14 2021-03-02 招商局金融科技有限公司 应用漏洞检测方法、装置、电子设备及计算机存储介质
CN113760641A (zh) * 2021-01-08 2021-12-07 北京沃东天骏信息技术有限公司 业务监控方法、装置、计算机系统和计算机可读存储介质
CN114625554A (zh) * 2021-08-25 2022-06-14 广州亚信技术有限公司 故障修复方法、装置、电子设备及存储介质
CN115348159A (zh) * 2022-08-09 2022-11-15 国家电网有限公司信息通信分公司 基于自编码器和服务依赖图的微服务故障定位方法及装置
CN115967649A (zh) * 2022-11-09 2023-04-14 北京白龙马云行科技有限公司 一种基于服务拓扑关系的业务健康度检查方法及系统
CN116545905A (zh) * 2023-06-20 2023-08-04 南方电网数字平台科技(广东)有限公司 一种服务健康检测方法、装置、电子设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10521235B1 (en) * 2019-06-27 2019-12-31 Capital One Services, Llc Determining problem dependencies in application dependency discovery, reporting, and management tool
CN111404759A (zh) * 2020-04-17 2020-07-10 腾讯科技(深圳)有限公司 服务检测方法、规则配置方法、相关设备及介质
CN112434308A (zh) * 2020-12-14 2021-03-02 招商局金融科技有限公司 应用漏洞检测方法、装置、电子设备及计算机存储介质
CN113760641A (zh) * 2021-01-08 2021-12-07 北京沃东天骏信息技术有限公司 业务监控方法、装置、计算机系统和计算机可读存储介质
CN114625554A (zh) * 2021-08-25 2022-06-14 广州亚信技术有限公司 故障修复方法、装置、电子设备及存储介质
CN115348159A (zh) * 2022-08-09 2022-11-15 国家电网有限公司信息通信分公司 基于自编码器和服务依赖图的微服务故障定位方法及装置
CN115967649A (zh) * 2022-11-09 2023-04-14 北京白龙马云行科技有限公司 一种基于服务拓扑关系的业务健康度检查方法及系统
CN116545905A (zh) * 2023-06-20 2023-08-04 南方电网数字平台科技(广东)有限公司 一种服务健康检测方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
云计算服务质量测评指标体系研究;王彪;谭思敏;阮远华;谢天杰;;电脑与电信(04);第8-10、37页 *

Also Published As

Publication number Publication date
CN116775364A (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
US10048996B1 (en) Predicting infrastructure failures in a data center for hosted service mitigation actions
JP6005706B2 (ja) 異種移動環境用の仮想マシンモーフィング
US11132356B2 (en) Optimizing data entries in a log
JP2020024733A (ja) データボリュームの動的な構成
US10491621B2 (en) Website security tracking across a network
JP6581648B2 (ja) システム障害からのクラウド・ベース・サービスの可用性の回復
US10666715B2 (en) Incident management for complex information technology platforms
US9785507B2 (en) Restoration of consistent regions within a streaming environment
Pourmajidi et al. On challenges of cloud monitoring
US10552306B2 (en) Automated test generation for multi-interface and multi-platform enterprise virtualization management environment
Torres et al. A hierarchical approach for availability and performance analysis of private cloud storage services
US10303678B2 (en) Application resiliency management using a database driver
US10360129B2 (en) Setting software error severity ranking
WO2022028144A1 (en) Blockchain management of provisioning failures
US20060277440A1 (en) Method, system, and computer program product for light weight memory leak detection
US10938655B2 (en) Enterprise cloud garbage collector
CN114338684A (zh) 一种能源管理系统及方法
CN110764985A (zh) 一种命令行记录的方法、系统、设备及可读存储介质
US10176059B2 (en) Managing server processes with proxy files
US10778785B2 (en) Cognitive method for detecting service availability in a cloud environment
CN116775364B (zh) 一种应用服务健康管理方法、装置、电子设备及存储介质
EP3473035B1 (en) Application resilience system and method thereof for applications deployed on a cloud platform
US11340952B2 (en) Function performance trigger
US10027544B1 (en) Detecting and managing changes in networking devices
CN113138772B (zh) 数据处理平台的构建方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant