CN116647476A - 网络管理方法、装置、计算机设备、存储介质和程序产品 - Google Patents
网络管理方法、装置、计算机设备、存储介质和程序产品 Download PDFInfo
- Publication number
- CN116647476A CN116647476A CN202310474361.9A CN202310474361A CN116647476A CN 116647476 A CN116647476 A CN 116647476A CN 202310474361 A CN202310474361 A CN 202310474361A CN 116647476 A CN116647476 A CN 116647476A
- Authority
- CN
- China
- Prior art keywords
- connection
- detected
- link
- fault detection
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title abstract description 249
- 238000001514 detection method Methods 0.000 claims abstract description 335
- 238000000034 method Methods 0.000 claims abstract description 74
- 238000004590 computer program Methods 0.000 claims abstract description 35
- 230000004044 response Effects 0.000 claims description 141
- 230000002159 abnormal effect Effects 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 21
- 206010033799 Paralysis Diseases 0.000 description 22
- 230000008569 process Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 9
- 208000023463 mandibuloacral dysplasia Diseases 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000000120 microwave digestion Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/046—Network management architectures or arrangements comprising network management agents or mobile agents therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请涉及一种网络管理方法、装置、计算机设备、存储介质和计算机程序产品。上述方法包括:检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;待探测连接链路包括第一连接端及第二连接端;若待探测连接链路的初始连接状态处于正常状态,则控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报;根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。采用本方法能够提高IB网络的安全性。
Description
技术领域
本申请涉及网络通信技术领域,特别是涉及一种网络管理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
无限带宽技术(Infiniband,简称IB)是一种高速网络技术和标准,高性能集群通常使用无限带宽技术对应的网络(即无限带宽网络,简称IB网络)作为高速计算网络或者存储网络。为了提高IB网络的可用性和可靠性,需要对IB网络进行网络管理。
传统方法是通过子网管理器对IB网络进行网络管理。
然而,传统的对IB网络进行网络管理的过程,当子网管理器同时接收较多的处理请求时,会导致子网管理器的负载过大,从而导致IB网络出现异常,甚至引发IB网络瘫痪。因此,传统通过子网管理器对IB网络进行网络管理的方法,存在安全性较低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高IB网络的安全性的网络管理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种网络管理方法。所述方法包括:
检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;所述待探测连接链路包括第一连接端及第二连接端;
若所述待探测连接链路的初始连接状态处于正常状态,则控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令;所述故障探测指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
根据所述故障探测指令对所述待探测连接链路进行故障探测,生成故障探测结果,基于所述故障探测结果对所述无限带宽网络进行网络管理。
由于本申请实施例的故障探测指令中包括子网管理接口对应的管理数据报,因此,就能够直接控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令。而不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。之后,根据故障探测指令直接对待探测连接链路进行故障探测生成故障探测结果,并能够基于故障探测结果对无限带宽网络进行网络管理,能够提高IB网络的安全性。
在其中一个实施例中,所述控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令,包括:
获取子网管理接口对应的管理数据报,基于所述子网管理接口对应的管理数据报生成所述故障探测指令;
通过本地标识符控制所述第一连接端向所述第二连接端发送所述故障探测指令。
本实施例中,通过获取子网管理接口对应的管理数据报,并基于子网管理接口对应的管理数据报生成故障探测指令。由于第一连接端的本地标识符中包括第一连接端的路径信息,第二连接端的本地标识符中包括第二连接端的路径信息,因此,能够通过本地标识符直接控制第一连接端向第二连接端发送包含子网管理接口对应的管理数据报的故障探测指令。从而,可以直接通过子网管理接口对应的管理数据报对待探测连接链路进行链路故障检测,而不用向子网管理器发送ICMP数据包或者路径查询请求。从而,避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题,因此,能够提高IB网络的安全性。
在其中一个实施例中,所述根据所述故障探测指令对所述待探测连接链路进行故障探测,生成故障探测结果,包括:
检测所述第一连接端在发送所述故障探测指令之后的第一预设时间段内,是否接收到所述第二连接端发送的故障应答指令;所述故障应答指令为响应于所述故障探测指令所生成的,且所述故障应答指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
若所述第一连接端在第一预设时间段内接收到所述第二连接端发送的故障应答指令,则确定所述故障探测结果为所述待探测连接链路的当前连接状态处于正常状态。
由于故障应答指令为响应于故障探测指令所生成的,且故障应答指令包括无限带宽网络中子网管理接口对应的管理数据报,因此,本实施例可以直接通过包含子网管理接口对应的管理数据报的故障应答指令对待探测连接链路进行链路故障检测。而不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题,因此,能够提高IB网络的安全性。
在其中一个实施例中,所述方法还包括:
若所述第一连接端在第一预设时间段内未接收到所述第二连接端发送的故障应答指令,则确定所述故障探测结果为所述待探测连接链路的当前连接状态未处于正常状态;
循环执行所述控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令;检测所述第一连接端在发送所述故障探测指令之后的第一预设时间段内,是否接收到所述第二连接端发送的故障应答指令,直到确定所述故障探测结果为所述待探测连接链路的当前连接状态处于正常状态。
本实施例中,若第一连接端在第一预设时间段内未接收到第二连接端发送的故障应答指令,则循环执行上述实施例中进行链路故障检测的步骤,就能够根据包含子网管理接口对应的管理数据报的故障应答指令,周期性地对待探测连接链路进行链路故障检测,直到确定出故障探测结果为待探测连接链路的当前连接状态处于正常状态。本实施例不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题,因此,能够提高IB网络的安全性。
在其中一个实施例中,所述方法还包括:
若所述待探测连接链路的初始连接状态未处于正常状态,则检测所述待探测连接链路的当前连接状态是否处于探测状态;所述未处于正常状态包括异常状态及未收到结果的状态;
若所述待探测连接链路的当前连接状态处于探测状态,则检测在第二预设时间段内是否接收到所述第二连接端发送的故障应答指令;
若所述待探测连接链路的当前连接状态未处于探测状态,则返回执行所述控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令;根据所述故障探测指令对所述待探测连接链路进行故障探测,生成故障探测结果,基于所述故障探测结果对所述无限带宽网络进行网络管理。
本实施例中,在待探测连接链路的初始连接状态未处于正常状态的情况下,检测待探测连接链路的当前连接状态是否处于探测状态。并根据待探测连接链路的当前连接状态是否处于探测状态以及故障应答指令进行链路故障检测。就能够根据包含子网管理接口对应的管理数据报的故障应答指令,周期性地对待探测连接链路进行链路故障检测,直到确定出故障探测结果为待探测连接链路的当前连接状态处于正常状态,就可以基于故障探测结果对无限带宽网络进行网络管理。本实施例不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题,因此,能够提高IB网络的安全性。
在其中一个实施例中,所述方法还包括:
若所述故障探测结果为所述待探测连接链路的当前连接状态处于正常状态,则控制所述第一连接端向所述第二连接端发送预约连接指令;所述预约连接指令携带了所述待探测连接链路对应的预约连接信息,且所述预约连接指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
控制所述第二连接端根据所述预约连接指令向所述第一连接端发送连接应答指令;所述连接应答指令携带了所述待探测连接链路对应的邀请连接信息,且所述连接应答指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
根据所述邀请连接信息,控制所述第一连接端与所述第二连接端建立连接。
本实施例中,针对连接状态一直处于正常状态的待探测连接链路,可以在预约连接指令中携带待探测连接链路对应的预约连接信息,在连接应答指令中携带待探测连接链路对应的邀请连接信息,从而通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接。且本实施例能够根据子网管理器的处理效率以及待连接链路的数量确定预设速率,就能够根据预设速率控制建立连接的频率,从而避免了传统的建立连接过程中,子网管理器在短时间内接收到较多的路径查询请求,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。因此,通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接能够提高IB网络的安全性。
在其中一个实施例中,所述控制所述第二连接端根据所述预约连接指令向所述第一连接端发送连接应答指令,包括:
控制所述第二连接端根据所述预约连接指令,在所述第二连接端上登记所述预约连接信息;
根据所述预约连接信息更新所述待探测连接链路在待连接链路列表中的优先级,得到所述待探测连接链路在待连接链路列表中的目标优先级;
根据所述目标优先级,控制所述第二连接端按照预设速率向所述第一连接端发送连接应答指令;所述预设速率为基于子网管理器的处理效率以及待连接链路的数量所确定。
本实施例能够根据子网管理器的处理效率以及待连接链路的数量确定预设速率,就能够根据预设速率控制建立连接的频率,从而避免了传统的建立连接过程中,子网管理器在短时间内接收到较多的路径查询请求,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。因此,通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接能够提高IB网络的安全性。
在其中一个实施例中,所述方法还包括:
若所述故障探测结果为所述待探测连接链路的当前连接状态从异常状态切换至正常状态,则控制所述第二连接端向所述第一连接端发送连接通知指令;所述连接通知指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
根据所述连接通知指令,控制所述第一连接端与所述第二连接端建立连接。
本实施例中,针对当前连接状态从异常状态切换至正常状态的待探测连接链路,可以通过待探测连接链路中的第二连接端主动通知待探测连接链路中的第一连接端建立连接。从而不仅能够在待探测连接链路中的故障恢复正常后及时建立连接,而且能够避免在待探测连接链路中的故障未恢复正常时,待探测连接链路中的第一连接端频繁尝试建立连接,从而子网管理器在短时间内接收到较多的路径查询请求,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。因此,通过第二连接端主动通知第一连接端建立连接能够提高IB网络的安全性。
第二方面,本申请还提供了一种网络管理方法。所述方法包括:
若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;所述预约连接指令携带了所述待探测连接链路对应的预约连接信息,且所述预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报;所述故障探测结果为对无限带宽网络中的待探测连接链路进行故障探测的结果;
控制所述第二连接端根据所述预约连接指令向所述第一连接端发送连接应答指令;所述连接应答指令携带了所述待探测连接链路对应的邀请连接信息,且所述连接应答指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
根据所述邀请连接信息,控制所述第一连接端与所述第二连接端建立连接。
本实施例中,针对连接状态一直处于正常状态的待探测连接链路,可以在预约连接指令中携带待探测连接链路对应的预约连接信息,在连接应答指令中携带待探测连接链路对应的邀请连接信息,从而通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接。且本实施例能够根据子网管理器的处理效率以及待连接链路的数量确定预设速率,就能够根据预设速率控制建立连接的频率,从而避免了传统的建立连接过程中,子网管理器在短时间内接收到较多的路径查询请求,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。因此,通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接能够提高IB网络的安全性。
第三方面,本申请还提供了一种网络管理装置。所述装置包括:
检测模块,用于检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;所述待探测连接链路包括第一连接端及第二连接端;
发送模块,用于若所述待探测连接链路的初始连接状态处于正常状态,则控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令;所述故障探测指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
网络管理模块,用于根据所述故障探测指令对所述待探测连接链路进行故障探测,生成故障探测结果,基于所述故障探测结果对所述无限带宽网络进行网络管理。
第四方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项实施例中的方法的步骤。
第五方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项实施例中的方法的步骤。
第六方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一项实施例中的方法的步骤。
上述网络管理方法、装置、计算机设备、存储介质和计算机程序产品,检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;待探测连接链路包括第一连接端及第二连接端;若待探测连接链路的初始连接状态处于正常状态,则控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报;根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。由于本申请的故障探测指令中包括子网管理接口对应的管理数据报,因此,就能够直接控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令。而不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。之后,根据故障探测指令直接对待探测连接链路进行故障探测生成故障探测结果,并能够基于故障探测结果对无限带宽网络进行网络管理,能够提高IB网络的安全性。
附图说明
图1为一个实施例中网络管理方法的应用环境图;
图2为一个实施例中网络管理方法的流程示意图;
图3为一个实施例中故障探测指令发送步骤的流程示意图;
图4为一个实施例中故障探测结果生成步骤的流程示意图;
图5为一个实施例中第一循环步骤的流程示意图;
图6为一个实施例中第二循环步骤的流程示意图;
图7为一个实施例中第一建立连接步骤的流程示意图;
图8为一个实施例中第一连接端主动建立连接的流程示意图;
图9为一个实施例中第二建立连接步骤的流程示意图;
图10为另一个实施例中第一连接端被动建立连接的流程示意图;
图11为一个可选的实施例中网络管理方法的流程示意图;
图12为一个实施例中网络管理装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
无限带宽技术(Infiniband,简称IB)是一种高速网络技术和标准,高性能集群通常使用无限带宽技术对应的网络(即无限带宽网络,简称IB网络)作为高速计算网络或者存储网络。为了提高IB网络的可用性和可靠性,需要对IB网络进行网络管理。
传统方法是通过子网管理器(Subnet Manager,SM)对IB网络进行网络管理。对IB网络进行网络管理的过程包括IB网络的链路故障检测以及IB网络的连接管理。其中,链路故障检测包括网络故障检测、节点故障检测等。
传统方法中对IB网络进行链路故障检测的步骤为:首先,通过集群的各节点对应的子网管理代理(System Management Agent,SMA)向子网管理器发送因特网控制报文协议(Internet Control Message Protocol,ICMP)对应的数据包(简称ICMP数据包)。其次,通过子网管理器接收ICMP数据包,并对ICMP数据包中的数据进行处理。再次,通过子网管理器向各子网管理代理发送应答包。之后,各子网管理代理根据应答包确定链路是否发生故障。此外,在使用ICMP数据包进行链路故障检测的过程中,集群的各节点对应的子网管理代理会向子网管理器发送路径查询请求,以查询路径信息。
传统方法中对IB网络进行连接管理的步骤为:在检测到链路正常的情况下,通过远程直接数据存取(Remote Direct Memory Access,RDMA)对应的通信管理应用程序接口(Communication Manager Application Program Interface,CM API)进行连接管理。在使用RDMA对应的通信管理应用程序接口进行连接管理的过程中,集群的各节点对应的子网管理代理需要向子网管理器发送路径查询请求,以查询路径信息。
然而,当集群中包含的节点数目较多时,各节点对应的子网管理代理均会向子网管理器发送ICMP数据包或者路径查询请求,导致子网管理器需要接收较多的ICMP数据包或者路径查询请求。且子网管理器的处理能力有限,因此,子网管理器无法及时处理多个ICMP数据包或者路径查询请求中的数据,从而导致集群中部分节点网络不通,甚至导致整个集群网络瘫痪。因此,传统的通过ICMP数据包以及RDMA对应的通信管理应用程序接口对IB网络进行网络管理的过程,当子网管理器同时接收较多的处理请求时,会导致子网管理器的负载过大,从而导致IB网络出现异常,甚至引发IB网络瘫痪。因此,传统通过子网管理器对IB网络进行网络管理的方法,存在安全性较低的问题。
本申请实施例提供的网络管理方法,可以应用于如图1所示的应用环境中。其中,子网管理器120通过网络与集群140进行通信。集群140中包括多个计算机设备142,该计算机设备142可以是服务器,该服务器作为集群140中的一个节点,且各计算机设备142上设置有子网管理代理。数据存储系统可以存储子网管理器120需要处理的数据以及集群140需要处理的数据。数据存储系统可以集成在子网管理器120上,也可以集成在集群104上,还可以放在云上或其他网络服务器上。计算机设备142检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;待探测连接链路包括第一连接端及第二连接端;若待探测连接链路的初始连接状态处于正常状态,则控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报;计算机设备142根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。其中,计算机设备142可以用独立的服务器来实现,计算机设备142也可以用能够实现主备切换的多个服务器集群来实现。
在一个实施例中,如图2所示,提供了一种网络管理方法,以该方法应用于图1中的计算机设备142为例进行说明,包括以下步骤:
S220,检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;待探测连接链路包括第一连接端及第二连接端。
其中,无限带宽技术(Infiniband,简称IB)是一种高速网络技术和标准,高性能集群通常使用无限带宽技术对应的网络(即无限带宽网络,简称IB网络)作为高速计算网络或者存储网络,以实现进程之间的通信。由于对IB网络进行网络管理的过程包括IB网络的链路故障检测以及IB网络的连接管理,且链路故障检测包括网络故障检测、节点故障检测等,因此,待探测连接链路是指无限带宽网络中需要进行故障检测的链路,待探测连接链路包括第一连接端及第二连接端。待探测连接链路的初始连接状态表示待探测连接链路在初始时刻的连接状态,待探测连接链路的初始连接状态包括但不局限于正常状态。
可选地,计算机设备142可以在初始时刻实时监测无限带宽网络中的待探测连接链路的初始连接状态,或者,计算机设备142也可以从待探测连接链路的历史监测结果中获取无限带宽网络中的待探测连接链路的初始连接状态。之后,计算机设备142可以检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态。
S240,若待探测连接链路的初始连接状态处于正常状态,则控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报。
可选地,由于待探测连接链路包括第一连接端及第二连接端,因此,当检测到待探测连接链路的初始连接状态处于正常状态时,计算机设备142可以控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令,以对待探测连接链路进行故障检测。其中,故障探测指令用于对待探测连接链路的连接状态进行故障检测,故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报。子网管理接口对应的管理数据报(Subnet Management Interface Manager Datagram,SMI MAD)是无限带宽网络中的一种通用的管理数据报。
S260,根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。
可选地,计算机设备142可以根据待探测连接链路的第二连接端是否接收到故障探测指令,对待探测连接链路进行故障探测,生成故障探测结果;或者,计算机设备142也可以在待探测连接链路的第二连接端接收到故障探测指令之后,根据待探测连接链路的第一连接端是否接收到第二连接端返回的信息,对待探测连接链路进行故障探测,生成故障探测结果。其中,故障探测结果用于表征待探测连接链路的当前连接状态是否处于正常状态,故障探测结果可以包括待探测连接链路的当前连接状态处于正常状态、待探测连接链路的当前连接状态未处于正常状态。
之后,计算机设备142可以基于故障探测结果对无限带宽网络进行网络管理。示例性的,若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则计算机设备142可以控制待探测连接链路的第一连接端与待探测连接链路的第二连接端建立连接。若故障探测结果为待探测连接链路的当前连接状态未处于正常状态,则计算机设备142可以清理待探测连接链路中的无效连接以及信息,以免网络阻塞。
上述网络管理方法中,检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;待探测连接链路包括第一连接端及第二连接端;若待探测连接链路的初始连接状态处于正常状态,则控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报;根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。由于本申请的故障探测指令中包括子网管理接口对应的管理数据报,因此,就能够直接控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令。而不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。之后,根据故障探测指令直接对待探测连接链路进行故障探测生成故障探测结果,并能够基于故障探测结果对无限带宽网络进行网络管理,能够提高IB网络的安全性。
以上实施例介绍了控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令,下面就对其实施步骤进行介绍。在一个实施例中,如图3所示,控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令,包括:
S320,获取子网管理接口对应的管理数据报,基于子网管理接口对应的管理数据报生成故障探测指令。
可选地,计算机设备142可以根据待探测连接链路的第一连接端及第二连接端,获取待探测连接链路的对应的子网管理接口。从而,可以从待探测连接链路的对应的子网管理接口中获取子网管理接口对应的管理数据报(SMI MAD)。之后,计算机设备142可以基于子网管理接口对应的管理数据报(SMI MAD)生成故障探测指令。其中,数据报(Datagram)是指通过网络传输的数据的基本单元,数据报包括报头(header)和数据本身。
S340,通过本地标识符控制第一连接端向第二连接端发送故障探测指令。
可选地,根据待探测连接链路的第一连接端及第二连接端,计算机设备142可以确定待探测连接链路的第一连接端的本地标识符及待探测连接链路的第二连接端的本地标识符。其中,本地标识符(local identifier,LID)是指用来标识连接端位置信息的符号。之后,计算机设备142可以根据第一连接端的本地标识符及第二连接端的本地标识符,控制第一连接端向第二连接端发送故障探测指令。
本实施例中,通过获取子网管理接口对应的管理数据报,并基于子网管理接口对应的管理数据报生成故障探测指令。由于第一连接端的本地标识符中包括第一连接端的路径信息,第二连接端的本地标识符中包括第二连接端的路径信息,因此,能够通过本地标识符直接控制第一连接端向第二连接端发送包含子网管理接口对应的管理数据报的故障探测指令。从而,可以直接通过子网管理接口对应的管理数据报对待探测连接链路进行链路故障检测,而不用向子网管理器发送ICMP数据包或者路径查询请求。从而,避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题,因此,能够提高IB网络的安全性。
以上实施例介绍了根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,下面就对其实施步骤进行介绍。在一个实施例中,如图4所示,根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,包括:
S420,检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令;故障应答指令为响应于故障探测指令所生成的,且故障应答指令包括无限带宽网络中子网管理接口对应的管理数据报。
需要说明的是,本申请实施例中进行链路故障检测的原理为:首先,创建待探测连接链路的链路信息,并初始化待探测连接链路的初始连接状态。其次,控制待探测连接链路的第一连接端直接向待探测连接链路的第二连接端发送故障探测指令。再次,控制待探测连接链路的第二连接端接收故障探测指令,并将该待探测连接链路的链路信息加入待探测的链路队列。之后,控制待探测连接链路的第二连接端直接向待探测连接链路的第一连接端发送故障应答指令。最后,根据第一连接端是否接收到故障应答指令确定待探测连接链路的连接状态是否发生故障。其中,故障探测指令和故障应答指令均包括无限带宽网络中子网管理接口对应的管理数据报(SMI MAD)。
可选地,计算机设备142可以在第一连接端发送故障探测指令之后的第一预设时间段内,定时地检测第一连接端是否接收到第二连接端发送的故障应答指令。或者,计算机设备142也可以直接在第一连接端发送故障探测指令之后的第一预设时间段内的最后一刻,检测第一连接端是否接收到第二连接端发送的故障应答指令。其中,故障应答指令为响应于故障探测指令所生成的,且故障应答指令包括无限带宽网络中子网管理接口对应的管理数据报(SMI MAD)。只有在第一连接端接收到第二连接端发送的故障应答指令的情况下,才能表征待探测连接链路的连接状态处于正常状态。
S440,若第一连接端在第一预设时间段内接收到第二连接端发送的故障应答指令,则确定故障探测结果为待探测连接链路的当前连接状态处于正常状态。
可选地,若检测到第一连接端在第一预设时间段内接收到第二连接端发送的故障应答指令,则计算机设备142可以实时更新待探测连接链路的当前连接状态为正常状态,从而确定本次链路故障探测的故障探测结果为待探测连接链路的当前连接状态处于正常状态。其中,待探测连接链路的当前连接状态处于正常状态用于表征待探测连接链路的当前连接状态正常,即可以在待探测连接链路的第一连接端与待探测连接链路的第二连接端之间建立连接。第一预设时间段可以根据实际情况进行设置,本申请实施例对此不做限定。
本实施例中,检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令。若第一连接端在第一预设时间段内接收到第二连接端发送的故障应答指令,则确定故障探测结果为待探测连接链路的当前连接状态处于正常状态。由于故障应答指令为响应于故障探测指令所生成的,且故障应答指令包括无限带宽网络中子网管理接口对应的管理数据报,因此,本实施例可以直接通过包含子网管理接口对应的管理数据报的故障应答指令对待探测连接链路进行链路故障检测。而不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题,因此,能够提高IB网络的安全性。
在一个实施例中,如图5所示,提供了一种网络管理方法,还包括:
S520,若第一连接端在第一预设时间段内未接收到第二连接端发送的故障应答指令,则确定故障探测结果为待探测连接链路的当前连接状态未处于正常状态。
可选地,若检测到第一连接端在第一预设时间段内未接收到第二连接端发送的故障应答指令,则计算机设备142可以确定故障探测结果为待探测连接链路的当前连接状态未处于正常状态。其中,这里的待探测连接链路的当前连接状态未处于正常状态用于表征待探测连接链路的当前连接状态故障,即不能在待探测连接链路的第一连接端与待探测连接链路的第二连接端之间建立连接,且计算机设备142需要清理待探测连接链路中的无效连接以及信息,以免网络阻塞。
S540,循环执行控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令,直到确定故障探测结果为待探测连接链路的当前连接状态处于正常状态。
可选地,在故障探测结果为待探测连接链路的当前连接状态未处于正常状态的情况下,返回S240重新发起链路故障检测,即可以理解为,首先,将待探测连接链路的当前连接状态设置为探测状态;之后,循环执行控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;并检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令,直到在第一连接端在第一预设时间段内接收到第二连接端发送的故障应答指令的情况下,确定故障探测结果为待探测连接链路的当前连接状态处于正常状态,此时停止循环,并可以在待探测连接链路的第一连接端与待探测连接链路的第二连接端之间建立连接。
本实施例中,若第一连接端在第一预设时间段内未接收到第二连接端发送的故障应答指令,则确定故障探测结果为待探测连接链路的当前连接状态未处于正常状态。此时,循环执行上述实施例中进行链路故障检测的步骤,就能够根据包含子网管理接口对应的管理数据报的故障应答指令,周期性地对待探测连接链路进行链路故障检测,直到确定出故障探测结果为待探测连接链路的当前连接状态处于正常状态。本实施例不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题,因此,能够提高IB网络的安全性。
在一个实施例中,如图6所示,提供了一种网络管理方法,还包括:
S620,若待探测连接链路的初始连接状态未处于正常状态,则检测待探测连接链路的当前连接状态是否处于探测状态;未处于正常状态包括异常状态及未收到结果的状态。
可选地,若检测到待探测连接链路的初始连接状态未处于正常状态,且由于这里的初始连接状态未处于正常状态包括异常状态及未收到结果的状态,则说明待探测连接链路的初始连接状态可以处于异常状态,或者,待探测连接链路的初始连接状态可以处于未收到结果的状态(即待探测连接链路在初始时刻还处于故障探测中的状态,简称探测状态)。此时,计算机设备142可以接着检测待探测连接链路的当前连接状态是否处于探测状态。
S640,若待探测连接链路的当前连接状态处于探测状态,则检测在第二预设时间段内是否接收到第二连接端发送的故障应答指令。
可选地,若检测到待探测连接链路的当前连接状态处于探测状态,则说明待探测连接链路在当前时刻还处于故障探测中。此时,可选地,计算机设备142可以在第一连接端发送故障探测指令之后的第二预设时间段内,定时地检测第一连接端是否接收到第二连接端发送的故障应答指令。或者,计算机设备142也可以直接在第一连接端发送故障探测指令之后的第二预设时间段内的最后一刻,检测第一连接端是否接收到第二连接端发送的故障应答指令。其中,第二预设时间段可以根据实际情况进行设置,本申请实施例对此不做限定。
S660,若待探测连接链路的当前连接状态未处于探测状态,则返回执行控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。
可选地,若检测到待探测连接链路的当前连接状态未处于探测状态,则说明待探测连接链路在当前时刻处于异常状态。此时,返回S240重新发起链路故障检测,即可以理解为,首先,将待探测连接链路的当前连接状态设置为探测状态;之后,循环执行控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;并检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令,直到在第一连接端在第一预设时间段内接收到第二连接端发送的故障应答指令的情况下,确定故障探测结果为待探测连接链路的当前连接状态处于正常状态,此时停止循环,并基于故障探测结果对无限带宽网络进行网络管理。
本实施例中,若待探测连接链路的初始连接状态未处于正常状态,则检测待探测连接链路的当前连接状态是否处于探测状态。若待探测连接链路的当前连接状态处于探测状态,则检测在第二预设时间段内是否接收到第二连接端发送的故障应答指令;若待探测连接链路的当前连接状态未处于探测状态,则循环执行上述实施例中进行链路故障检测的步骤。就能够根据包含子网管理接口对应的管理数据报的故障应答指令,周期性地对待探测连接链路进行链路故障检测,直到确定出故障探测结果为待探测连接链路的当前连接状态处于正常状态,就可以基于故障探测结果对无限带宽网络进行网络管理。本实施例不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题,因此,能够提高IB网络的安全性。
以上实施例介绍了根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果。本申请实施例还可以基于故障探测结果对无限带宽网络进行连接管理,下面就对其实施步骤进行介绍。在一个实施例中,如图7所示,提供了一种网络管理方法,还包括:
S720,若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;预约连接指令携带了待探测连接链路对应的预约连接信息,且预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报。
其中,待探测连接链路的当前连接状态处于正常状态包括待探测连接链路的连接状态一直处于正常状态,以及待探测连接链路的当前连接状态从异常状态切换至正常状态。预约连接指令是用于在第一连接端与第二连接端之间预约建立连接的指令,预约连接指令中携带了待探测连接链路对应的预约连接信息,且预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报(SMI MAD)。在建立连接的过程中,可以将第一连接端称为连接主动端或者客户端,可以将第二连接端称为连接被动端或者服务端。
可选地,如图8所示,图8为一个实施例中第一连接端主动建立连接的流程示意图。在故障探测结果为待探测连接链路的连接状态一直处于正常状态的情况下,S801,计算机设备142可以控制第一连接端按照预设频率向第二连接端发送携带有待探测连接链路对应的预约连接信息的预约连接指令。其中,预设频率是根据子网管理器的处理效率具体设置的,本申请实施例对此不做限定。
此外,计算机设备142还可以检测第一连接端是否向第二连接端成功发送预约连接指令。若检测到第一连接端向第二连接端未成功发送预约连接指令,或者在第三预设时间段内未接收到第二连接端发送的连接应答指令,则等待第四预设时间段之后重新发送预约连接指令;若检测到第一连接端向第二连接端成功发送预约连接指令,则将该待探测连接链路的链路信息加入待连接链路列表,并在第三预设时间段内等待接收到第二连接端发送的连接应答指令。其中,第三预设时间段以及第四预设时间段可以根据实际情况进行设置,本申请实施例对此不做限定。
S740,控制第二连接端根据预约连接指令向第一连接端发送连接应答指令;连接应答指令携带了待探测连接链路对应的邀请连接信息,且连接应答指令包括无限带宽网络中子网管理接口对应的管理数据报。
可选地,在第二连接端接收到第一连接端发送的预约连接指令之后,计算机设备142可以控制第二连接端根据预约连接指令向第一连接端发送携带有待探测连接链路对应的邀请连接信息的连接应答指令。其中,连接应答指令为响应于预约连接指令所生成的,连接应答指令中携带了待探测连接链路对应的邀请连接信息,且连接应答指令包括无限带宽网络中子网管理接口对应的管理数据报(SMI MAD)。
在其中一个实施例中,S740包括:
S742,控制第二连接端根据预约连接指令,在第二连接端上登记预约连接信息。
可选地,结合图8所示,S802,根据预约连接指令中携带的待探测连接链路对应的预约连接信息,计算机设备142可以控制第二连接端在第二连接端上登记预约连接信息。登记预约连接信息的过程可以理解为,在第二连接端接收到第一连接端发送的预约连接指令之后,检测待连接链路列表中是否包括待探测连接链路的链路信息。若检测到待连接链路列表中不包括待探测连接链路的链路信息,则创建待探测连接链路的链路信息,并将该待探测连接链路的链路信息加入待连接链路列表。
S744,根据预约连接信息更新待探测连接链路在待连接链路列表中的优先级,得到待探测连接链路在待连接链路列表中的目标优先级。
可选地,结合图8所示,在检测到待连接链路列表中包括待探测连接链路的链路信息的情况下,计算机设备142可以根据预约连接信息更新待探测连接链路在待连接链路列表中的优先级,即提高待探测连接链路在待连接链路列表中的优先级,从而得到待探测连接链路在待连接链路列表中的目标优先级。其中,待探测连接链路在待连接链路列表中的目标优先级高于待探测连接链路在待连接链路列表中的初始优先级。
此外,计算机设备142还可以检测第二连接端在第五预设时间段内是否接收到第一连接端发送的待探测连接链路对应的建立连接指令。若检测到第二连接端在第五预设时间段内未接收到第一连接端发送的待探测连接链路对应的建立连接指令,则清理该待探测连接链路以及该待探测连接链路中的无效链路信息。
S746,根据目标优先级,控制第二连接端按照预设速率向第一连接端发送连接应答指令;预设速率为基于子网管理器的处理效率以及待连接链路的数量所确定。
可选地,结合图8所示,S803,根据待探测连接链路在待连接链路列表中的目标优先级,计算机设备142可以控制第二连接端按照预设速率向第一连接端发送携带有待探测连接链路对应的邀请连接信息的连接应答指令。其中,预设速率为基于子网管理器的处理效率以及待连接链路的数量所确定的,第二连接端能够发送的最大速率。示例性的,假设子网管理器的处理效率为100个/秒,且当前时刻待连接链路的数量为10个,则预设速率(即第二连接端能够发送的最大速率)等于子网管理器的处理效率除以当前时刻待连接链路的数量,即10个/秒。
S760,根据邀请连接信息,控制第一连接端与第二连接端建立连接。
可选地,结合图8所示,S804,在第一连接端接收到第二连接端发送的携带有待探测连接链路对应的邀请连接信息的连接应答指令之后,计算机设备142可以从待连接链路列表中移除待探测连接链路,并根据邀请连接信息,按照预设速率控制第一连接端向第二连接端发送待探测连接链路对应的建立连接指令,从而控制第一连接端与第二连接端建立连接。
本实施例中,针对连接状态一直处于正常状态的待探测连接链路,可以在预约连接指令中携带待探测连接链路对应的预约连接信息,在连接应答指令中携带待探测连接链路对应的邀请连接信息,从而通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接。且本实施例能够根据子网管理器的处理效率以及待连接链路的数量确定预设速率,就能够根据预设速率控制建立连接的频率,从而避免了传统的建立连接过程中,子网管理器在短时间内接收到较多的路径查询请求,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。因此,通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接能够提高IB网络的安全性。
以上实施例介绍了基于故障探测结果对无限带宽网络进行连接管理,下面对连接管理的另一种实施步骤进行介绍。在一个实施例中,如图9所示,提供了一种网络管理方法,还包括:
S920,若故障探测结果为待探测连接链路的当前连接状态从异常状态切换至正常状态,则控制第二连接端向第一连接端发送连接通知指令;连接通知指令包括无限带宽网络中子网管理接口对应的管理数据报。
可选地,如图10所示,图10为另一个实施例中第一连接端被动建立连接的流程示意图。S1001,第二连接端可以在待探测连接链路出现故障之前预先保存待探测连接链路的链路信息。在故障探测结果为待探测连接链路的当前连接状态从异常状态切换至正常状态的情况下,计算机设备142可以控制第二连接端加载待探测连接链路的链路信息。S1002,计算机设备142可以控制第二连接按照预设速率端向第一连接端发送连接通知指令。其中,连接通知指令是第二连接端发送的、用于通知第一连接端预约可以建立连接的指令,连接通知指令包括无限带宽网络中子网管理接口对应的管理数据报(SMI MAD)。示例性的,待探测连接链路的当前连接状态从异常状态切换至正常状态的情况可以包括但不局限于待探测连接链路中的节点或进程重启的情况。
S940,根据连接通知指令,控制第一连接端与第二连接端建立连接。
可选地,结合图10所示,S1003,在第一连接端接收到第二连接端发送的连接通知指令之后,计算机设备142可以根据连接通知指令,按照预设速率控制第一连接端向第二连接端发送待探测连接链路对应的建立连接指令,从而控制第一连接端与第二连接端建立连接。
本实施例中,针对当前连接状态从异常状态切换至正常状态的待探测连接链路,可以通过待探测连接链路中的第二连接端主动通知待探测连接链路中的第一连接端建立连接。从而不仅能够在待探测连接链路中的故障恢复正常后及时建立连接,而且能够避免在待探测连接链路中的故障未恢复正常时,待探测连接链路中的第一连接端频繁尝试建立连接,从而子网管理器在短时间内接收到较多的路径查询请求,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。因此,通过第二连接端主动通知第一连接端建立连接能够提高IB网络的安全性。
在一个实施例中,还提供了一种网络管理方法,以该方法应用于图1中的计算机设备142为例进行说明,包括以下步骤:
若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;预约连接指令携带了待探测连接链路对应的预约连接信息,且预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报;故障探测结果为对无限带宽网络中的待探测连接链路进行故障探测的结果。
控制第二连接端根据预约连接指令向第一连接端发送连接应答指令;连接应答指令携带了待探测连接链路对应的邀请连接信息,且连接应答指令包括无限带宽网络中子网管理接口对应的管理数据报。
根据邀请连接信息,控制第一连接端与第二连接端建立连接。
关于本实施例的具体描述可参考上述各实施例,在此不做赘述。
上述网络管理方法中,针对连接状态一直处于正常状态的待探测连接链路,可以在预约连接指令中携带待探测连接链路对应的预约连接信息,在连接应答指令中携带待探测连接链路对应的邀请连接信息,从而通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接。且本实施例能够根据子网管理器的处理效率以及待连接链路的数量确定预设速率,就能够根据预设速率控制建立连接的频率,从而避免了传统的建立连接过程中,子网管理器在短时间内接收到较多的路径查询请求,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。因此,通过“预约-登记-邀请-建连”的方式在待探测连接链路的第一连接端与第二连接端之间建立连接能够提高IB网络的安全性。
在一个可选的实施例中,如图11所示,提供了一种网络管理方法,应用于计算机设备142,包括:
S1102,检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;待探测连接链路包括第一连接端及第二连接端;若是,则执行S1104;若否,则执行S1114;
S1104,获取子网管理接口对应的管理数据报,基于子网管理接口对应的管理数据报生成故障探测指令;
S1106,通过本地标识符控制第一连接端向第二连接端发送故障探测指令;故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报;
S1108,检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令;故障应答指令为响应于故障探测指令所生成的,且故障应答指令包括无限带宽网络中子网管理接口对应的管理数据报;若是,则执行S1110;若否,则执行S1112;
S1110,确定故障探测结果为待探测连接链路的当前连接状态处于正常状态;执行S1118或S1128;
S1112,确定故障探测结果为待探测连接链路的当前连接状态未处于正常状态;循环执行S1104,直到确定故障探测结果为待探测连接链路的当前连接状态处于正常状态;
S1114,检测待探测连接链路的当前连接状态是否处于探测状态;未处于正常状态包括异常状态及未收到结果的状态;若是,则执行S1116;若否,则执行返回执行S1104;
S1116,检测在第二预设时间段内是否接收到第二连接端发送的故障应答指令;若是,则执行S1110;若否,则执行返回执行S1104;
S1118,若故障探测结果为待探测连接链路的当前连接状态一直处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;预约连接指令携带了待探测连接链路对应的预约连接信息,且预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报;
S1120,控制第二连接端根据预约连接指令,在第二连接端上登记预约连接信息;
S1122,根据预约连接信息更新待探测连接链路在待连接链路列表中的优先级,得到待探测连接链路在待连接链路列表中的目标优先级;
S1124,根据目标优先级,控制第二连接端按照预设速率向第一连接端发送连接应答指令;预设速率为基于子网管理器的处理效率以及待连接链路的数量所确定;连接应答指令携带了待探测连接链路对应的邀请连接信息,且连接应答指令包括无限带宽网络中子网管理接口对应的管理数据报;
S1126,根据邀请连接信息,控制第一连接端与第二连接端建立连接;
S1128,若故障探测结果为待探测连接链路的当前连接状态从异常状态切换至正常状态,则控制第二连接端向第一连接端发送连接通知指令;连接通知指令包括无限带宽网络中子网管理接口对应的管理数据报;
S1130,根据连接通知指令,控制第一连接端与第二连接端建立连接。
上述网络管理方法中,由于本申请的故障探测指令中包括子网管理接口对应的管理数据报,因此,就能够直接控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令。而不用向子网管理器发送ICMP数据包或者路径查询请求,从而避免了传统方法中通过子网管理器进行链路故障检测时,导致的子网管理器的负载过大、进而导致IB网络出现异常,甚至引发IB网络瘫痪的问题。之后,根据故障探测指令直接对待探测连接链路进行故障探测生成故障探测结果,并能够基于故障探测结果对无限带宽网络进行网络管理,能够提高IB网络的安全性。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的网络管理方法的网络管理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个网络管理装置实施例中的具体限定可以参见上文中对于网络管理方法的限定,在此不再赘述。
在一个实施例中,如图12所示,提供了一种网络管理装置1200,包括:检测模块1220、发送模块1240和网络管理模块1260,其中:
检测模块1220,用于检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;待探测连接链路包括第一连接端及第二连接端。
发送模块1240,用于若待探测连接链路的初始连接状态处于正常状态,则控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报。
网络管理模块1260,用于根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。
在一个实施例中,发送模块1240包括:
获取单元,用于获取子网管理接口对应的管理数据报,基于子网管理接口对应的管理数据报生成故障探测指令;
发送单元,用于通过本地标识符控制第一连接端向第二连接端发送故障探测指令。
在一个实施例中,网络管理模块1260包括:
检测单元,用于检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令;故障应答指令为响应于故障探测指令所生成的,且故障应答指令包括无限带宽网络中子网管理接口对应的管理数据报;
确定单元,用于若第一连接端在第一预设时间段内接收到第二连接端发送的故障应答指令,则确定故障探测结果为待探测连接链路的当前连接状态处于正常状态。
在一个实施例中,网络管理装置1200还包括:
正常状态确定模块,用于若第一连接端在第一预设时间段内未接收到第二连接端发送的故障应答指令,则确定故障探测结果为待探测连接链路的当前连接状态未处于正常状态;
第一循环模块,用于循环执行控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令,直到确定故障探测结果为待探测连接链路的当前连接状态处于正常状态。
在一个实施例中,网络管理装置1200还包括:
探测状态检测模块,用于若待探测连接链路的初始连接状态未处于正常状态,则检测待探测连接链路的当前连接状态是否处于探测状态;未处于正常状态包括异常状态及未收到结果的状态;
故障应答指令检测模块,用于若待探测连接链路的当前连接状态处于探测状态,则检测在第二预设时间段内是否接收到第二连接端发送的故障应答指令;
第二循环模块,用于若待探测连接链路的当前连接状态未处于探测状态,则返回执行控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。
在一个实施例中,网络管理装置1200还包括:
预约连接指令发送模块,用于若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;预约连接指令携带了待探测连接链路对应的预约连接信息,且预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报;
连接应答指令发送模块,用于控制第二连接端根据预约连接指令向第一连接端发送连接应答指令;连接应答指令携带了待探测连接链路对应的邀请连接信息,且连接应答指令包括无限带宽网络中子网管理接口对应的管理数据报;
第一建立连接模块,用于根据邀请连接信息,控制第一连接端与第二连接端建立连接。
在一个实施例中,连接应答指令发送模块包括:
登记单元,用于控制第二连接端根据预约连接指令,在第二连接端上登记预约连接信息;
目标优先级确定单元,用于根据预约连接信息更新待探测连接链路在待连接链路列表中的优先级,得到待探测连接链路在待连接链路列表中的目标优先级;
连接应答指令发送单元,用于根据目标优先级,控制第二连接端按照预设速率向第一连接端发送连接应答指令;预设速率为基于子网管理器的处理效率以及待连接链路的数量所确定。
在一个实施例中,网络管理装置1200还包括:
连接通知指令发送模块,用于若故障探测结果为待探测连接链路的当前连接状态从异常状态切换至正常状态,则控制第二连接端向第一连接端发送连接通知指令;连接通知指令包括无限带宽网络中子网管理接口对应的管理数据报;
第二建立连接模块,用于根据连接通知指令,控制第一连接端与第二连接端建立连接。
在一个实施例中,还提供了一种网络管理装置,包括:预约连接指令发送模块、连接应答指令发送模块和第一建立连接模块,其中:
预约连接指令发送模块,用于若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;预约连接指令携带了待探测连接链路对应的预约连接信息,且预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报;故障探测结果为对无限带宽网络中的待探测连接链路进行故障探测的结果;
连接应答指令发送模块,用于控制第二连接端根据预约连接指令向第一连接端发送连接应答指令;连接应答指令携带了待探测连接链路对应的邀请连接信息,且连接应答指令包括无限带宽网络中子网管理接口对应的管理数据报;
第一建立连接模块,用于根据邀请连接信息,控制第一连接端与第二连接端建立连接。
上述网络管理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储网络管理数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种网络管理方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;待探测连接链路包括第一连接端及第二连接端;
若待探测连接链路的初始连接状态处于正常状态,则控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;故障探测指令包括无限带宽网络中子网管理接口对应的管理数据报;
根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。
在一个实施例中,控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令,处理器执行计算机程序时还实现以下步骤:
获取子网管理接口对应的管理数据报,基于子网管理接口对应的管理数据报生成故障探测指令;
通过本地标识符控制第一连接端向第二连接端发送故障探测指令。
在一个实施例中,根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,处理器执行计算机程序时还实现以下步骤:
检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令;故障应答指令为响应于故障探测指令所生成的,且故障应答指令包括无限带宽网络中子网管理接口对应的管理数据报;
若第一连接端在第一预设时间段内接收到第二连接端发送的故障应答指令,则确定故障探测结果为待探测连接链路的当前连接状态处于正常状态。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若第一连接端在第一预设时间段内未接收到第二连接端发送的故障应答指令,则确定故障探测结果为待探测连接链路的当前连接状态未处于正常状态;
循环执行控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;检测第一连接端在发送故障探测指令之后的第一预设时间段内,是否接收到第二连接端发送的故障应答指令,直到确定故障探测结果为待探测连接链路的当前连接状态处于正常状态。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若待探测连接链路的初始连接状态未处于正常状态,则检测待探测连接链路的当前连接状态是否处于探测状态;未处于正常状态包括异常状态及未收到结果的状态;
若待探测连接链路的当前连接状态处于探测状态,则检测在第二预设时间段内是否接收到第二连接端发送的故障应答指令;
若待探测连接链路的当前连接状态未处于探测状态,则返回执行控制待探测连接链路的第一连接端向待探测连接链路的第二连接端发送故障探测指令;根据故障探测指令对待探测连接链路进行故障探测,生成故障探测结果,基于故障探测结果对无限带宽网络进行网络管理。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;预约连接指令携带了待探测连接链路对应的预约连接信息,且预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报;
控制第二连接端根据预约连接指令向第一连接端发送连接应答指令;连接应答指令携带了待探测连接链路对应的邀请连接信息,且连接应答指令包括无限带宽网络中子网管理接口对应的管理数据报;
根据邀请连接信息,控制第一连接端与第二连接端建立连接。
在一个实施例中,控制第二连接端根据预约连接指令向第一连接端发送连接应答指令,处理器执行计算机程序时还实现以下步骤:
控制第二连接端根据预约连接指令,在第二连接端上登记预约连接信息;
根据预约连接信息更新待探测连接链路在待连接链路列表中的优先级,得到待探测连接链路在待连接链路列表中的目标优先级;
根据目标优先级,控制第二连接端按照预设速率向第一连接端发送连接应答指令;预设速率为基于子网管理器的处理效率以及待连接链路的数量所确定。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若故障探测结果为待探测连接链路的当前连接状态从异常状态切换至正常状态,则控制第二连接端向第一连接端发送连接通知指令;连接通知指令包括无限带宽网络中子网管理接口对应的管理数据报;
根据连接通知指令,控制第一连接端与第二连接端建立连接。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;预约连接指令携带了待探测连接链路对应的预约连接信息,且预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报;故障探测结果为对无限带宽网络中的待探测连接链路进行故障探测的结果;
控制第二连接端根据预约连接指令向第一连接端发送连接应答指令;连接应答指令携带了待探测连接链路对应的邀请连接信息,且连接应答指令包括无限带宽网络中子网管理接口对应的管理数据报;
根据邀请连接信息,控制第一连接端与第二连接端建立连接。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (13)
1.一种网络管理方法,其特征在于,所述方法包括:
检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;所述待探测连接链路包括第一连接端及第二连接端;
若所述待探测连接链路的初始连接状态处于正常状态,则控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令;所述故障探测指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
根据所述故障探测指令对所述待探测连接链路进行故障探测,生成故障探测结果,基于所述故障探测结果对所述无限带宽网络进行网络管理。
2.根据权利要求1所述的方法,其特征在于,所述控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令,包括:
获取子网管理接口对应的管理数据报,基于所述子网管理接口对应的管理数据报生成所述故障探测指令;
通过本地标识符控制所述第一连接端向所述第二连接端发送所述故障探测指令。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述故障探测指令对所述待探测连接链路进行故障探测,生成故障探测结果,包括:
检测所述第一连接端在发送所述故障探测指令之后的第一预设时间段内,是否接收到所述第二连接端发送的故障应答指令;所述故障应答指令为响应于所述故障探测指令所生成的,且所述故障应答指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
若所述第一连接端在第一预设时间段内接收到所述第二连接端发送的故障应答指令,则确定所述故障探测结果为所述待探测连接链路的当前连接状态处于正常状态。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若所述第一连接端在第一预设时间段内未接收到所述第二连接端发送的故障应答指令,则确定所述故障探测结果为所述待探测连接链路的当前连接状态未处于正常状态;
循环执行所述控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令;检测所述第一连接端在发送所述故障探测指令之后的第一预设时间段内,是否接收到所述第二连接端发送的故障应答指令,直到确定所述故障探测结果为所述待探测连接链路的当前连接状态处于正常状态。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述待探测连接链路的初始连接状态未处于正常状态,则检测所述待探测连接链路的当前连接状态是否处于探测状态;所述未处于正常状态包括异常状态及未收到结果的状态;
若所述待探测连接链路的当前连接状态处于探测状态,则检测在第二预设时间段内是否接收到所述第二连接端发送的故障应答指令;
若所述待探测连接链路的当前连接状态未处于探测状态,则返回执行所述控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令;根据所述故障探测指令对所述待探测连接链路进行故障探测,生成故障探测结果,基于所述故障探测结果对所述无限带宽网络进行网络管理。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若所述故障探测结果为所述待探测连接链路的当前连接状态处于正常状态,则控制所述第一连接端向所述第二连接端发送预约连接指令;所述预约连接指令携带了所述待探测连接链路对应的预约连接信息,且所述预约连接指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
控制所述第二连接端根据所述预约连接指令向所述第一连接端发送连接应答指令;所述连接应答指令携带了所述待探测连接链路对应的邀请连接信息,且所述连接应答指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
根据所述邀请连接信息,控制所述第一连接端与所述第二连接端建立连接。
7.根据权利要求6所述的方法,其特征在于,所述控制所述第二连接端根据所述预约连接指令向所述第一连接端发送连接应答指令,包括:
控制所述第二连接端根据所述预约连接指令,在所述第二连接端上登记所述预约连接信息;
根据所述预约连接信息更新所述待探测连接链路在待连接链路列表中的优先级,得到所述待探测连接链路在待连接链路列表中的目标优先级;
根据所述目标优先级,控制所述第二连接端按照预设速率向所述第一连接端发送连接应答指令;所述预设速率为基于子网管理器的处理效率以及待连接链路的数量所确定。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
若所述故障探测结果为所述待探测连接链路的当前连接状态从异常状态切换至正常状态,则控制所述第二连接端向所述第一连接端发送连接通知指令;所述连接通知指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
根据所述连接通知指令,控制所述第一连接端与所述第二连接端建立连接。
9.一种网络管理方法,其特征在于,所述方法包括:
若故障探测结果为待探测连接链路的当前连接状态处于正常状态,则控制第一连接端向第二连接端发送预约连接指令;所述预约连接指令携带了所述待探测连接链路对应的预约连接信息,且所述预约连接指令包括无限带宽网络中子网管理接口对应的管理数据报;所述故障探测结果为对无限带宽网络中的待探测连接链路进行故障探测的结果;
控制所述第二连接端根据所述预约连接指令向所述第一连接端发送连接应答指令;所述连接应答指令携带了所述待探测连接链路对应的邀请连接信息,且所述连接应答指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
根据所述邀请连接信息,控制所述第一连接端与所述第二连接端建立连接。
10.一种网络管理装置,其特征在于,所述装置包括:
检测模块,用于检测无限带宽网络中的待探测连接链路的初始连接状态是否处于正常状态;所述待探测连接链路包括第一连接端及第二连接端;
发送模块,用于若所述待探测连接链路的初始连接状态处于正常状态,则控制所述待探测连接链路的第一连接端向所述待探测连接链路的第二连接端发送故障探测指令;所述故障探测指令包括所述无限带宽网络中子网管理接口对应的管理数据报;
网络管理模块,用于根据所述故障探测指令对所述待探测连接链路进行故障探测,生成故障探测结果,基于所述故障探测结果对所述无限带宽网络进行网络管理。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
13.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310474361.9A CN116647476A (zh) | 2023-04-27 | 2023-04-27 | 网络管理方法、装置、计算机设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310474361.9A CN116647476A (zh) | 2023-04-27 | 2023-04-27 | 网络管理方法、装置、计算机设备、存储介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116647476A true CN116647476A (zh) | 2023-08-25 |
Family
ID=87617868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310474361.9A Pending CN116647476A (zh) | 2023-04-27 | 2023-04-27 | 网络管理方法、装置、计算机设备、存储介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116647476A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117527637A (zh) * | 2023-12-29 | 2024-02-06 | 摩尔线程智能科技(北京)有限责任公司 | 一种链路故障检测的方法、装置、存储介质及电子设备 |
-
2023
- 2023-04-27 CN CN202310474361.9A patent/CN116647476A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117527637A (zh) * | 2023-12-29 | 2024-02-06 | 摩尔线程智能科技(北京)有限责任公司 | 一种链路故障检测的方法、装置、存储介质及电子设备 |
CN117527637B (zh) * | 2023-12-29 | 2024-04-02 | 摩尔线程智能科技(北京)有限责任公司 | 一种链路故障检测的方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7518983B2 (en) | Proxy response apparatus | |
KR100812374B1 (ko) | 클러스터 시스템에서 프로토콜 네트워크 장애 관리 시스템및 방법 | |
US9026654B2 (en) | Peer-to-peer overlay graph construction | |
CN110708175B (zh) | 分布式网络中消息同步的方法 | |
US8782147B2 (en) | Concurrent delivery for messages from a same sender | |
CN116647476A (zh) | 网络管理方法、装置、计算机设备、存储介质和程序产品 | |
KR20160042933A (ko) | 데이터 피드 관리 | |
CN110661836B (zh) | 消息路由方法、装置及系统、存储介质 | |
US20100293266A1 (en) | System and method for dynamic control of network management traffic loads | |
WO2023273240A1 (zh) | 微服务调用方法、装置、电子设备和可读存储介质 | |
CN114090342A (zh) | 存储容灾的链路管理方法及消息执行节点、存储控制集群 | |
KR20150079724A (ko) | 상이한 타입의 통신에 최적화된 복수의 서버를 이용한 디바이스 모니터링 | |
CN115277379B (zh) | 分布式锁容灾处理方法、装置、电子设备及存储介质 | |
CN113098709B (zh) | 基于分布式组网系统的网络恢复方法、装置和计算机设备 | |
CN106230747B (zh) | 恢复tcp连接序列号的方法、装置及系统 | |
CN112787970B (zh) | 用于订阅事件流的方法和装置 | |
CN113010337A (zh) | 故障检测方法、总控节点、工作节点及分布式系统 | |
CN112835728A (zh) | 消息处理方法、装置、计算机设备和存储介质 | |
US11695743B2 (en) | Connecting and resetting devices | |
CN110716827A (zh) | 适用于分布式系统的热备份方法及分布式系统 | |
EP3050283B1 (en) | Providing network management information in a communications network | |
CN113765711B (zh) | 一种网络设备保活方法及装置 | |
CN117478299B (zh) | 区块链共识算法切换方法、装置和计算机设备 | |
CN115277114B (zh) | 分布式锁处理方法、装置、电子设备及存储介质 | |
CN113204440B (zh) | 消息发送方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |