CN118433092A - 无限带宽网络中的链路聚合 - Google Patents
无限带宽网络中的链路聚合 Download PDFInfo
- Publication number
- CN118433092A CN118433092A CN202410134617.6A CN202410134617A CN118433092A CN 118433092 A CN118433092 A CN 118433092A CN 202410134617 A CN202410134617 A CN 202410134617A CN 118433092 A CN118433092 A CN 118433092A
- Authority
- CN
- China
- Prior art keywords
- physical
- ports
- physical ports
- lag
- messaging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002776 aggregation Effects 0.000 title claims abstract description 14
- 238000004220 aggregation Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 63
- 238000013507 mapping Methods 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000004891 communication Methods 0.000 claims description 39
- 230000008859 change Effects 0.000 claims description 14
- 238000012544 monitoring process Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 7
- 230000000977 initiatory effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 22
- 230000015654 memory Effects 0.000 description 7
- 239000004744 fabric Substances 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 229920000147 Styrene maleic anhydride Polymers 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000007667 floating Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 208000023463 mandibuloacral dysplasia Diseases 0.000 description 4
- 238000000120 microwave digestion Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000001341 grazing-angle X-ray diffraction Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000786 liquid-assisted grinding Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013316 zoning Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/24—Multipath
- H04L45/245—Link aggregation, e.g. trunking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/09—Mapping addresses
- H04L61/10—Mapping addresses of different types
- H04L61/103—Mapping addresses of different types across network layers, e.g. resolution of network layer into physical layer addresses or address resolution protocol [ARP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/50—Address allocation
- H04L61/5007—Internet protocol [IP] addresses
- H04L61/5014—Internet protocol [IP] addresses using dynamic host configuration protocol [DHCP] or bootstrap protocol [BOOTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/668—Internet protocol [IP] address subnets
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了无限带宽网络中的链路聚合,本文中的系统和方法用于子网管理器(SM)的一个或更多个处理单元与关联于至少一个交换机和主机的至少一个子网管理代理(SMA)传送配置信息,该配置信息用于使至少一个交换机能够部分地基于至少一个虚拟网络地址到主机的两个或更多个物理端口的物理网络地址的映射来配置转发表,以及配置信息用于使主机能够使用至少一个交换机和至少一个虚拟网络地址与其他主机进行通信。
Description
技术领域
至少一个实施例涉及InfiniBand(无限带宽,IB)网络中的链路聚合(LAG)。例如,子网管理器(SM)和子网管理代理(SMA)用于建立映射到物理IB端口的物理网络地址的虚拟网络地址。
背景技术
以太网网络中的链路聚合(LAG)可以由链路聚合控制协议(LACP)进行配置和管理。该协议允许具有网络设备的主机与对等体(peer)协商作为网络端口的其两个或更多个物理端口的结合(bond)。这些物理端口的结合可以在称为链路聚合(LAG)的分组之下。对等体可以是也支持LACP的交换机。LACP报文(packet)作为建立或更新以太网LAG的一部分而在对等体之间周期性地被发送。进一步地,这些LACP报文可被发送以支持对支持以太网LAG的以太网端口的状态进行监控。LACP报文还可用于在以太网LAG中增加以及从其移除物理端口。在LACP模式下,可以创建端口通道传送LACP报文。经由这种LACP信道可以配置新的或现有的以太网LAG。例如,以太网交换机可根据经由LACP报文提供的配置来配置其转发表,并可基于以太网网络内的散列计算来解决负载平衡。
附图说明
图1示出了根据至少一个实施例的经受InfiniBand(IB)链路聚合(LAG)的系统;
图2示出了根据至少一个实施例的用于具有多个子网的IB网络中的IB LAG的系统的IB管理方面;
图3示出了根据至少一个实施例的用于使用子网管理器(SM)和子网管理代理(SMA)进行IB网络中的IB LAG的系统的进一步方面;
图4示出了根据至少一个实施例的用于由子网中的至少网关支持的IB网络中的IBLAG的系统的又进一步方面;
图5示出了根据至少一个实施例的用于IB网络中的IB LAG的处理流程;
图6示出了根据至少一个实施例的用于IB软件服务支持IB网络中的IB LAG的处理流程;以及
图7示出了根据至少一个实施例的用于在IB网络中的IB LAG中添加端口的系统的处理流程。
具体实施方式
在至少一个实施例中,图1示出了经受InfiniBand(无限带宽,IB)链路聚合(LAG)的系统100,如本文详述的。系统100还支持InfiniBand(IB)网络102与以太网网络104之间以及其他IB网络106之间的接合(interface)。对于以太网网络104,可由以太网LAG使能(enable)负载平衡和高可用性功能。为了建立和修改这种以太网LAG,可以使用LACP。然而,这种LACP在IB网络106中不可用。进一步地,虽然LACP也可以用于在操作的不同时间验证以太网LAG中的连接性,但是这不同于依赖于子网管理器(SM)和子网管理代理(SMA)来协调不同IB设备之间的网络改变的IB网络106。
例如,在图1的以太网网络104中,LACP允许具有网络设备的以太网主机1-N 122与对等体(诸如,也支持LACP的以太网交换机112)协商其两个(或更多个)端口的结合。在对等体112之间周期性地发送LACP报文,以监控被配置用于一个或更多个以太网主机1-N 122上的以太网LAG的以太网端口的状态。LACP报文还用于允许添加以太网端口到以太网LAG中以及从以太网LAG中移除以太网端口。可以经由LACP通道配置新的以太网LAG(或者修改现有的以太网LAG)。以太网交换机112可负责基于LACP报文配置其内部转发表,以基于散列计算提供负载平衡。
然而,由于LACP不能直接用于IB网络102,因此这种方法不能在IB网络中使用。在一个示例中,因为IB网络102包括SM和SMA,诸如关于至少图2-4所示和所讨论的,所以这些方面被替代地用于监控IB主机120、124内的IB端口的链路状态。此外,SM 206(在图2中)用于经由SMA 302(在图3中)配置IB交换机116的内部转发表。照此,当相对于以太网LAG建立IB LAG时,必须通知SM,使得其可以配置一个或更多个IB交换机116。IB交换机在同一IB子网中(诸如在图2中的子网202、204中的每一个内)将IB报文从IB链路路由到另一IB链路。IB路由器可在图2中的子网1、2、202、204之间路由分组。
因此,在至少一个实施例中,本文的系统和方法允许通过SM 206(在图2中)和至少一个子网管理代理(SMA)(如图3中的SMA 302和关联的描述)来建立、修改和监控IB LAG。在这样做时,IB LAG通过使用浮动媒体访问控制(MAC)(本文也称为虚拟网络地址)在IB网络102中提供负载平衡。进一步地,一个或更多个IB主机1-N 120可以是执行操作系统(OS)以控制具有一个或更多个IB端口的一个或更多个IB网络适配器的计算机平台。主机与主机机器可互换地使用,以描述IB或以太网主机,除非使用前面的文本IB或以太网另外明确地陈述,其中IB主机独占地在IB网络内并且以太网主机独占地在以太网网络内。进一步地,这样的独占性不将IB限制于如本文通篇描述的以太网通信。
在图1中,互连设备112的IB方面可以表示IB结构118并且可以至少包括多个IB交换机116和一个或更多个IB路由器114。这样的IB结构118允许一个或更多个IB主机120、124通过一个或更多个指定的IB链路126在子网内或跨子网通信。即使经由IB路由器示出,IB链路也可以将IB交换机耦接在一起。IB链路126是可以包括队列对(QP)的抽象(abstraction),队列对(QP)将源IB主机和目的地IB主机带到一起以用于彼此通信。这些IB主机可在同一子网内或在不同的子网内,如进一步关于至少图2所描述的。
然而在抽象中,IB链路126可以被绑定到IB主机120的物理IB端口上。相对于以太网LAG,提供给IB网络102的IB LAG支持使用至少IB网关108与以太网网络104接合(诸如经由通过IB 128的以太网或IP)。可以提供进一步的以太网网关110以便以这样的互连布置与IB网关108进行通信。IB LAG可以针对一个或更多个IB主机1-N 120至A1-AN 124的至少两个端口被启用(enable)。
在至少一个实施例中,与基于以太网的LACP方法不同,包括IB网络102的系统100经由彼此进行通信以建立和修改IB LAG的SM 206和至少一个SMA 302被启用以用于IBLAG。例如,SM 206包括至少一个虚拟网络地址到至少一个主机120的两个或更多个物理IB端口的两个或更多个物理网络地址的映射。SMA 302能够与SM 206通信(例如接收)配置信息。例如,SM 206向SM与主机120之间的一个或更多个IB设备的一个或更多个SMA提供配置信息。该配置信息可以使得IB设备中的至少一个IB设备(诸如IB交换机116)能够部分地基于映射来配置其内部转发表。借助于IB交换机中的所配置的转发表,该配置信息可以使得主机120能够使用至少一个IB交换机116和至少一个虚拟网络地址与其他主机124(或至少同一子网202;204内的主机)进行通信。
对于IB网络102,全局标识符(GID)可以与互连设备112之一(诸如IB网关108)相关联,以支持IB网络与包括以太网网络104在内的其他协议网络之间的通信。进一步地,GID是用于识别一个或更多个IB主机120的一个或更多个网络适配器上、一个或更多个IB路由器114上或一个或更多个IB网关108上的IB端口的128位数。GID可以经由SM 206被分配用于IB端口。借助于SM 206中的GID至LID映射,GID可以包括LID。GID的第一部分(诸如,前64位)可以是用于IB端口的所分配的子网ID,而GID的第二部分(诸如,接下来的64位)是IB端口的所分配的GUID(全局单元标识符)。在至少一个实施例中,SM向其子网内的每个端口分配相同的子网ID,其可以是GID前缀或子网前缀。
IB主机或节点120可以通过IB网关108、IB交换机116或IB路由器114之一发起流量流。对于IB通信,SM为将在IB主机之间的通信中使用的相应IB主机内的相应端口提供相应LID。在子网之间,可以使用来自IB主机的目的地GID来查询目的地主机的目的地端口的目的地LID。一旦提供了目的地LID,就可以使用目的地LID和GID来传送IB通信的IB报文。
在至少一个实施例中,对于IB设备中的改变(如配置的改变,包括线缆被丢弃、以太网链路被禁用或电器被断电),可以经由SM 206来重新分配GID。在这种改变之后,IB结构118的其余IB网关108和网络适配器可以处理流量。然而,对于IB主机120之间的通信,这样的改变可能不被注意到。例如,可能保持如最初提供的相同的GID和LID。
在至少一个实施例中,图2示出了用于具有多个子网1、2 202、204的IB网络中的IBLAG的系统200的IB管理。系统200详述了图1中的系统100的进一步方面。例如,IB路由器1、2114使能(enable)两个或更多个IB子网1、2 202之间的流量。IB路由器1、2 114是IB结构118的一部分,并且支持扩展IB网络以在多个IB主机120、124中包括超过40,000个IB端口。进一步地,在这种拓扑中可支持IB子网1、2 202、204之间的分离和故障恢复。IB路由器1、2 114允许到由不同的子网202、204使用的不同的子网拓扑的连接。IB交换机1、N 116的不同之处在于它们支持从一个IB链路到子网202;204内的另一IB链路(诸如在IB链路208之间)的IB报文路由。因此,每个子网可以包括多个IB交换机116。
在至少一个实施例中,每个子网202;204包括相应的SM 206。SM 206可以是在IB交换机N 116上运行的集中式软件服务。SM 206执行用于发现所有连接的端口的功能,并配置IB结构118中的所有IB设备(诸如IB路由器114和其他IB交换机1、AN 116)。例如,SM 206经由子网202、204内的IB交换机116来控制在主机120之间发生的流量流的端口布置。端口布置的发现和配置因此由SM 206使能以支持经由一个或更多个IB交换机116在相关IB主机120、124的那些活动端口之间的流量流。SM 206还应用与网络流量相关的配置,包括针对IB结构118中的IB设备的服务质量(QoS)、路由和分区的配置。
虽然SM 206可用于发现和配置IB设备以使能那些设备之间的流量流,但是可以使用GRH(全局路由报头)查找来执行子网202、204之间的转发。在至少一个实施例中,IB路由器114包括用于去除L2 LRH(本地路由报头)、用于使用来自GRH的GID引用路由表以及用于根据目的地和路由表提供新的LRH的能力。在至少一个实施例中,可以使用简化的GID至LID映射来提供新的LRH中的目的地LID。例如,LID可以由来自GID的比特组成,并且移除对支持IB网络与以太网网络之间的接合的地址解析协议(ARP)的需求。
在至少一个实施例中,图3示出了用于使用子网管理器(SM)206和子网管理代理(SMA)302、310进行IB网络中的IB LAG的系统300的进一步方面。在至少一个实施例中,可以为IB LAG中的IB端口分配相同的浮动MAC或虚拟网络地址。这确保IB网络中的负载平衡可在IB端口之间实现,至少因为一个或更多个主机314之间的流量316可被引导到主机120的可用IB端口,而不必指定IB端口。从主机120的视角来看,它所涉及的通信是以太网通信,而该通信可通过IB网络发生。
因此,在至少一个实施例中,图3示出了使用SM 206来配置用于与至少一个主机120相关的最近的IB交换机116的端口。这使得到主机120中的一组端口的所有流量都能够根据在IB LAG中指定并在IB交换机116的转发表中提供的虚拟网络地址被发送到主机120。在提供配置之后,SM 206不参与通过一个或更多个IB交换机116的主机之间的这种流量流。
这种布置的益处在于,代替如在以太网LAG中那样在对等体之间发送LACP报文,LACP软件服务(诸如以太网后台程序308)可以与表示IB软件服务的IB后台程序306通信。这样的通信可以使得一个或更多个SMA使用例如捕获消息传递(trap messaging)来对SM 206的管理数据报(MAD)消息传递(messaging)进行响应。然而,在至少一个实施例中,IB后台程序306可以包括用于由SM 206管理LAG端口的一组MAD。例如,可提供MAD以包括LAG端口信息(例如LID),其表示至少一个IB交换机116的两个或更多个物理IB端口的物理网络地址和将两个或更多个这样的LID关联在一起的虚拟地址。
因此,在至少一个实施例中,主机或端点120的IB软件服务(诸如IB后台程序306)可以使用MAD消息传递使能(enable)SM与SMA之间的通信。IB软件服务可使能与以太网服务的LACP软件服务(例如,以太网后台程序308)的进一步通信。该进一步通信用于针对现在被配置为IB端口的两个或更多个物理端口发起或更新IB LAG模式。可以为LAG网络设备404的至少一个虚拟网络地址412(在图4中)标记流量流(并且该流量流预定前往该至少一个虚拟网络地址412),但是至少借助于IB LAG模式,可以以LAG模式将该流量流路由到两个或更多个物理端口408、410(在图4中)中的至少一个物理端口。因此,对于主机120,物理端口408、410可被视为以太网端口并且LAG驱动器312被视为以太网LAG驱动器,但是以太网端口可被配置为IB端口并且进一步被配置为处于IB LAG模式。
在至少一个实施例中,可以在SM 206、主机300与IB交换机116之间(经由它们对应的SMA)发送一个或更多个MAD。在主机300和IB交换机116中,可使用适当的SMA 302、310。IB后台程序306与SMA 310通信。在至少一个实施例中,SM 206被配置有子网以使得SM 206能够监控子网是否有任何改变。这可以是SM 206的监控阶段。这样的改变可以包括IB网络的IB子网的改变,包括IB链路故障或IB设备被添加或移除。在至少一个实施例中,对于包括用于到以太网网络的通信的IB网关的子网,以太网网络的改变可以被传送到该子网的底层SM。
在至少一个实施例中,在监控阶段中,子网中的每个IB设备可以向SM 206转发捕获消息。例如,SM 206可向所有IB设备通知监控阶段,并且IB设备可通过捕获消息或捕获消息传递来对SM进行响应。SM 206可重新配置其子网,包括允许流量重路由到IB设备中的某些IB设备(诸如IB路由器、IB交换机和端点),包括重路由到所示的主机120、124。这可以包括确保所有源和目的地IB设备之间的负载平衡。
在至少一个实施例中,来自SM 206的MAD消息传递允许捕获消息传递被发送回SM206。捕获消息传递可以包括:向SM通知用于两个或更多个物理IB端口的LAG模式;请求在LAG模式下为两个或更多个物理IB端口分配至少一个虚拟网络地址;通知该SM关于LAG模式的改变,该改变包括该两个或更多个物理IB端口以及其他物理IB端口的添加或移除中的一者;或通知禁用LAG模式。
在至少一个实施例中,在监控阶段中,SM 206可以通过与相应的SMA(如图3的IB交换机和主机中示出的SMA 302、310)通信来监控子网的改变。然而,SMA在每个IB设备中用于使能这种通信。进一步地,使用至少捕获消息传递,SMA向子网的SM 206传送上述改变(诸如,相关端口的改变(状态改变))以及IB设备或IB链路的连接和断开连接。捕获消息可以被发送以警告关于事件,并且可以包括提供这样的事件的细节的通知属性。因此,本文中的捕获消息被定义为传送如结合图3所描述的物理IB端口的事件,并且MAD消息传递可以提供配置信息以使得至少一个IB交换机能够部分地基于从子网的SM 206提供的映射来配置转发表。这使得主机120能够使用至少一个IB交换机和至少一个虚拟网络地址与至少在同一子网内的其他主机进行通信。
在至少一个实施例中,IB后台程序或软件服务306可以与SMA 310进行通信,以用于向SM 206发送MAD消息以及从SM 206接收响应。至少部分地基于捕获消息传递,SM 206可维护子网中物理IB端口的信息。进一步地,SM 206可以包括子网中的两个或更多个物理IB端口到LAG端口的映射,该LAG端口被表示为浮动MAC或虚拟网络地址,无论是新创建的还是从先前创建的LAG端口更新的。可以有多个这样的LAG或滞后端口以将不同的物理IB端口进行分组。在至少一个实施例中,LAG端口可以包括与LAG端口互斥的物理IB端口。
在至少一个实施例中,当接收到将物理IB端口添加到新的或现有的LAG中的新的请求时,SM 206可以进行某些配置检查,以确定该物理IB端口可以加入到该LAG中。这样的配置检查可以是所要求的配置检查。例如,为了建立或修改LAG,可由一个或更多个主机120经由其相应的SMA 310进行请求。在至少一个实施例中,使用与以太网后台程序308通信的IB后台程序306来协调IB LAG和以太网LAG是可能的。主机可以仅看到以太网后台程序308,而以太网后台程序308与IB后台程序306进行通信以实现IB通信的各方面。
在至少一个实施例中,响应于这种请求,SM 206可以为主机120分配将由新的LAG端口使用的虚拟网络地址。为了修改现有LAG,SM 206可简单地改变其对现有LAG端口所使用的现有虚拟网络地址的映射,以包括进一步的物理IB端口或者移除先前映射的物理IB端口。然后,SM 206可通过在主机和其他主机之间的通信中向IB设备(诸如,IB交换机116的SMA)发送MAD来进行针对新的或更新的LAG的所有所需的IB设备配置。在至少一个实施例中,MAD可以包括用于配置IB交换机以指示具有两个或更多个物理IB端口的新的LAG有效(in effect)的配置信息,以向IB交换机通知现有LAG的变化,或完全移除LAG。
在至少一个实施例中,图4示出了用于由子网中的至少数据处理单元(DPU)402支持的IB网络中的IB LAG的系统400的又进一步方面。然而,在一个示例中,代替DPU 402,可在中央处理单元(CPU)上执行的硬件设备、软件或固件中的一个或更多个可以用于支持IB网络。DPU可以是可编程CPU,其与CPU相比能够进行大数据存储和事务。在至少一个实施例中,DPU 402可以与主机120的网络适配器相关联。DPU 402可以与IB后台程序306相关联,并且可以存储并使用来自SM 206的指示与LAG相关联的虚拟网络地址的配置信息的至少一部分。这允许到主机120的流量通过至少一个交换机116在(主机的)网络适配器的物理IB端口P1 408、P2 410和其他主机的其他端口之间移动,即使这样的IB报文被路由到LAG网络设备404的虚拟网络地址LID C 412。
在至少一个实施例中,SM 206可以存储映射信息416以生成待经由MAD 318传送至子网中的其他IB设备的配置信息。使用配置信息经由IB交换机116在主机120与其他主机314之间建立IB链路。进一步,MAD 318可以通过此类IB链路但使用主机120的各个端口P1408及其关联的SMA 310A或P2 410及其关联的SMA 310B被传送至SM 206。不同地,一旦LAG模式针对LAG网络设备404有效,就可以使用IB链路在主机120的LAG网络设备404与其他主机314的其他IB端口之间提供用于数据流量的流量流316。尽管SM 206使用其相应物理端口将MAD传送至相应IB设备的相应SMA,但主机使用LAG网络设备将流量传送至其他主机。因此,即使示出为直接连接,SM 206也可以经由在IB链路中的多个IB路由器和/或IB交换机与SMA 310A、310B进行通信以到达主机120(或交换机)的DPU 402。
在至少一个实施例中,每个物理IB端口P1、P2 408、410与LID A、B 414相关联并且与相应的SMA 310A、B相关联。在启动IB LAG时,具有DPU 402的主机120通过IB端口408、410与SM 206通信(communicate)对IB LAG的请求。这可以是MAD消息或者可以是捕获消息。SM206包括或更新至少一个虚拟网络地址412到主机120的两个或更多个物理IB端口408、410的两个或更多个物理网络地址414的映射416。SM 206可提供将与两个或更多个物理IB端口408、410相关联的虚拟网络地址LID C412。虚拟网络地址LID C 412可以与LAG网络设备404相关联并且可以被存储或注册406在DPU 402内。因此,SM 206使用其LID A、B 414与物理IB端口408、410的SMA 310A、B进行通信,以通知DPU 402特定物理IB端口408、410作为具有单个虚拟网络地址LID C 412的团队被结合在一起。
在至少一个实施例中,图4还示出了在IB链路故障的情况下,SM 206可以检查作为IB LAG的一部分的物理IB端口408、410是否已经故障。在确认作为IB LAG的一部分的物理IB端口已经故障的情况下,则SM 206可重新配置一个或更多个IB交换机,以使那些一个或更多个IB交换机更新它们相应的内部转发表。这允许活动物理IB端口之间的流量的负载平衡动作。
图4还示出了当将物理IB端口408、410添加至IB LAG时,SM 206经由其相应的SMA310A、310B将MAD发送至物理IB端口408、410。SM 206可能不通过IB LAG进行负载平衡,例如不将MAD发送到虚拟网络地址LID C 412,而是使用特定IB端口的物理IB地址LID A、B 414。需要SM 206能够分别监控每个物理IB端口408、410,尽管端口被结合在一起。此外,在至少第二代IB(IBg2)中,MAD可以在其源/目的地MAC地址报头字段中具有原始端口的物理端口地址,诸如其MAC地址(如LID)(这取决于通信的方向)。此过程中发送的MAD将不使用LAG的虚拟网络地址(浮动MAC地址),从而使得意图针对物理IB端口408、410的IB报文到达该端口,而没有其中虚拟网络地址允许LAG的任何物理IB端口接收IB报文的冗余动作。
在至少一个实施例中,图4还示出了当物理IB端口掉线或者当从IB LAG移除物理IB端口时,SM 206通过定期发现其连接的IB设备变得知晓(aware)。SM 206可以通过被发送到一个或更多个交换机的配置信息来重新配置一个或更多个交换机,以使它们更新它们相应的内部转发表。在加入IB LAG时,从物理IB端口408、410的SMA 310A、310B采用加入LAG的请求向SM 206发送MAD,直到SM 206用要被分配给物理IB端口408、410的虚拟网络地址(浮动MAC)LID C 412进行响应时,物理IB端口408、410的操作状态可以由LAG驱动器312设置为“初始化”。这样做是为了示出物理IB端口408、410处于配置过程的中间,并且一旦该过程结束,就将被改变为“UP”状态。
在至少一个实施例中,两个或更多个物理IB端口408、410是IB端口,并且这些IB端口通过使用虚拟网络地址LID C 412将它们关联在一起而被置于LAG模式。这使得流量(作为主机120与至少同一子网中的其他主机之间的通信的一部分)能够使用至少一个虚拟网络地址LID C 412到两个或更多个物理IB端口408、410的两个或更多个物理网络地址的映射。在至少一个实施例中,IB路由器114和IB网关可支持使用虚拟网络地址和每个子网内的IB交换机跨子网到主机120、124的通信。
在至少一个实施例中,SM 206包括用于接收管理员输入的接口。此接口至少由发送和接收MAD消息传递以及接收捕获消息传递的能力定义,如本文中所描述的。SM 206能够执行对其内部映射的配置更新,并且能够通过发送至一个或更多个IB交换机的配置信息引起对这样的一个或更多个IB交换机的配置更新。例如,管理员输入可以是经由MAD消息传递被传送到SM 206的通过主机120的请求。管理员输入可使用在主机120与SM 206之间通信的SMA将IB端口置于LAG模式。进一步,SM 206被使能为将至少一个虚拟网络地址分配给两个或更多个物理端口408、410的两个或更多个物理网络地址LID A、B 414。
在至少一个实施例中,因此SM 206被配置为接收将两个或更多个物理端口或其他物理端口中的一个端口添加至LAG模式的请求。这些端口可以是用于IB网络的指定的IB端口。SM 206可执行配置检查以确定两个或更多个物理IB端口或其他物理IB端口中的该端口可用于加入LAG模式。配置检查可包括在先前由SM 206进行的发现期间对这样的一个或更多个物理IB端口的初始状态的验证。SM 206可响应于该请求而更新或建立LAG模式。例如,SM 206可以将至少一个虚拟网络地址(LID C)412分配给两个或更多个物理IB端口408或其他物理端口410的两个或更多个物理网络地址(LID A、B)414。该SM 206可经由其SMA 302使用MAD消息传递将包括由该SM 206进行的分配的配置信息传送至该至少一个IB交换机116。
一旦接收到配置信息,IB交换机116就可以配置其内部转发表以反映LID C 412将与相应IB端口408、410的LID A、B 414一起使用以用于与其他主机(诸如,在同一子网内或经由IB路由器到其他子网或经由网关到不需要在IB网络中的不同主机)的进一步通信。到具有作为LAG的一部分的IB端口的主机的流量使用LID C 412地址被发送至主机,但是可以到达两个IB端口414以实现冗余。
在至少一个实施例中,可以使用IB LAG模式来执行流量的负载平衡。例如,主机的两个或更多个物理端口之间的流量的负载平衡可通过将两个或更多个物理IB端口加入IBLAG模式来提供。为此,SM 206与至少一个SMA 302(诸如,交换机116的SMA)之间的通信可包括配置信息,该配置信息包括要被添加到LAG模式的物理IB端口。通信可以使用MAD消息传递并且可以引用物理IB端口(诸如向LAG模式添加物理IB端口),这使物理IB端口离开或加入LAG模式。
在至少一个实施例中,至少图3和图4中的系统300或400包括SM 206的一个或更多个处理单元,用于与至少一个SMA 302传送配置信息,诸如至少一个IB交换机116的SMA(而且还向与主机120的网络适配器相关联的SMA 310A、B传送配置信息)。由于主机120中的IB端口在IB LAG中被结合在一起,因此至少一个SMA 302与至少一个IB交换机116相关联并且与主机120相关联。来自SM 206的配置信息可以使得至少一个IB交换机116能够部分地基于至少一个虚拟网络地址到主机120的两个或更多个物理IB端口的物理网络地址的映射来配置其内部转发表。进一步,配置信息可使得主机120能够使用至少一个IB交换机116并使用至少一个虚拟网络地址与子网中或子网外的其他主机进行通信。
在至少一个实施例中,此类系统300、400使用SM的一个或更多个处理单元进一步被配置为使用来自至少一个SMA的捕获消息传递来监控两个或更多个物理端口中的各个物理端口。这经由配置信息部分地基于在来自至少一个SMA的捕获消息传递中所指示的改变来使能主机和至少一个IB交换机的改变。例如,捕获消息传递可以指示加入LAG或从LAG移除的意图。在进一步的示例中,捕获消息传递可以指示物理端口的故障,使得需要将其从LAG中移除。
在至少一个实施例中,图5示出了用于IB网络中的IB LAG的处理流程或方法500。方法500包括:在SM中提供(502)至少一个虚拟网络地址到主机的两个或更多个物理端口的两个或更多个物理网络地址的映射。可在SM中执行验证(504),以检查这两个或更多个物理网络地址是否与要改变的IB LAG模式相关联,或者是否要建立新的IB LAG,该新的IB LAG将底层的两个或更多个物理端口置于IB LAG模式中。当已经处于IB LAG模式时,作为响应可以提供信息。
对于新的IB LAG模式或IB LAG模式的改变,方法500包括:使用与两个或更多个物理端口中的至少一个物理端口相关联的至少一个SMA与SM通信(communicate)(506)配置信息。在至少一个实施例中,配置信息被提供给主机的SMA并提供给交换机的SMA。方法500包括:使用配置信息使能(508)至少一个交换机部分地基于映射来配置转发表。进一步,方法500包括:使能(510)主机使用至少一个交换机和至少一个虚拟网络地址与其他主机进行通信。
在至少一个实施例中,图6示出了IB软件服务支持IB网络中的IB LAG的处理流程或方法600。方法600包括:经由MAD消息传递使能(602)方法500的步骤506中的SM与SMA之间的通信。方法600包括:使用主机或端点的IB软件服务来使能与以太网服务的LACP软件服务的进一步通信。在方法600中执行验证(606)以确定IB配置的改变是否已发生。例如,该改变可以是向LAG模式添加或移除IB端口,或者启动LAG模式。进一步的通信允许IB网络不知道启动或更新(608)主机的两个或更多个物理端口的LAG模式,或将IB网络视为以太网网络。进一步,方法600使能(610)去往至少一个虚拟网络地址的流量流路由到LAG模式中的两个或更多个物理端口中的至少一个物理端口。
在至少一个实施例中,方法500或600是这样的:MAD消息传递允许响应,该响应包括:用于向SM通知针对两个或更多个物理端口的LAG模式的捕获消息传递;请求为LAG模式下的两个或更多个物理端口分配至少一个虚拟网络地址的捕获消息传递;用于向SM通知LAG模式的改变的捕获消息传递,该改变包括该两个或更多个物理端口和其他物理端口的添加或移除中的一个;或者通知禁用LAG模式的捕获消息传递。
在至少一个实施例中,图7示出了用于系统在IB网络中的IB LAG中添加端口的处理流程或方法700。方法700包括:在SM中接收(702)将两个或更多个物理端口或其他物理端口中的端口添加至IB LAG模式的请求。方法700包括:执行配置检查以确定该两个或更多个物理端口或其他物理端口中的端口可用于加入LAG模式。方法700包括验证(704)配置检查完成。方法700可包括更新或建立(706)LAG模式。为此,SM将至少一个虚拟网络地址分配给该两个或更多个物理端口或其他物理端口的两个或更多个物理网络地址。这是SM中的内部映射的一部分。方法700包括:验证(708)配置信息完成。这可以通过在步骤706中完成LAG建立或更新来实现。方法700包括根据方法500中的步骤506通信(710)配置信息。例如,该通信(710)的步骤是使用MAD消息传递,且包括将该SM进行的分配传送至至少一个交换机。
在至少一个实施例中,这样的方法500-700中的一个或更多个可以包括:由SM检查两个或更多个物理端口是LAG模式的一部分,以及重新配置至少一个交换机以使能两个或更多个物理端口之间的负载平衡的流量。在至少一个实施例中,这样的方法500-700中的一个或更多个可以包括:将另外的(further)端口作为两个或更多个物理端口的一部分添加到LAG模式。然后,可针对可包括另外的端口的配置信息在SM与至少一个SMA之间执行通信。该通信使用MAD消息传递以及该MAD消息传递中的另外的端口。该另外的端口不同于经受流量的负载平衡并且已经处于LAG模式中的两个或更多个端口。照此,用于控制和配置的通信被直接发送到物理IB端口,而主机之间的流量在作为LAG模式的一部分的物理IB端口之间并使用这些IB端口的虚拟网络地址进行通信。在至少一个实施例中,此类方法500-700中的一个或更多个可包括:在发送到物理IB端口的MAD消息的源地址和目的地地址报头字段中提供该另外的端口的物理地址作为配置信息的一部分。
其他变型在本公开的精神内。因此,尽管所公开的技术易于进行各种修改和替代构造,但是某些示出的其实施例在附图中示出并且已经在上面进行了详细描述。然而,应理解,无意将公开内容限制为所公开的一种或更多种特定形式,而是相反,其意图是涵盖落入如所附权利要求所定义的本公开内容的精神和范围内的所有修改、替代构造和等同物。
除非另有说明或显然与上下文矛盾,否则在描述所公开的实施例的上下文中(特别是在所附权利要求的上下文中),术语“一”和“一个”和“该”以及类似指代词的使用应被解释为涵盖单数和复数,而不是作为术语的定义。除非另有说明,否则术语“包括”、“具有”、“包含”和“含有”应被解释为开放式术语(意味着“包括但不限于”)。术语“连接”(在未经修改时,其指的是物理连接)应解释为部分或全部包含在内、附接到或连接在一起,即使有某些介入物。除非本文另外指出,否则本文中对数值范围的引用仅旨在用作分别指代落入该范围内的每个单独值的简写方法,并且每个单独值都被并入说明书中,就如同其在本文中被单独叙述一样。在至少一个实施例中,除非另外指出或与上下文矛盾,否则术语“集”(例如“项目集”)或“子集”的使用应解释为包括一个或更多个成员的非空集合。此外,除非另外指出或与上下文矛盾,否则术语相应集的“子集”不一定表示对应集的适当子集,而是子集和对应集可以相等。
除非以其他方式明确指出或与上下文明显矛盾,否则诸如“A,B和C中的至少一个”或“A,B与C中的至少一个”形式的短语之类的连接语在上下文中理解为通常用来表示项目(item)、术语(term)等,其可以是A或B或C,也可以是A和B和C集的任何非空子集。例如,在具有三个成员的集的说明性示例中,连接短语“A,B和C中的至少一个”和“A,B与C中的至少一个”是指以下任意集:{A},{B},{C},{A,B},{A,C},{B,C},{A,B,C}。因此,这种连接语言通常不旨在暗示某些实施例要求存在A中的至少一个,B中的至少一个和C中的至少一个中的每一个。另外,除非另有说明或与上下文矛盾,否则术语“多个”指示复数的状态(例如,“多个项目”指示多个项目)。在至少一个实施例中,多个项目中项目的数量至少为两个,但如果明确指示或通过上下文指示,则可以更多。此外,除非另有说明或从上下文中可以清楚得知,否则短语“基于”是指“至少部分地基于”而不是“仅基于”。
除非本文另外指出或与上下文明显矛盾,否则本文描述的过程的操作可以任何合适的顺序执行。在至少一个实施例中,诸如本文所述的那些过程(或其变形和/或其组合)之类的过程在配置有可执行指令的一个或更多个计算机系统的控制下执行,并且被实现为代码(例如,可执行指令,一个或更多个计算机程序或一个或更多个应用程序),该代码由硬件或其组合在一个或更多个处理器上共同执行。在至少一个实施例中,代码以例如计算机程序的形式存储在计算机可读存储介质上,该计算机程序包括可由一个或更多个处理器执行的多个指令。
在至少一个实施例中,计算机可读存储介质是非暂时性计算机可读存储介质,其排除了暂时性信号(例如,传播的瞬态电或电磁传输),但包括暂时性信号的收发器内的非暂时性数据存储电路(例如,缓冲区、高速缓存和队列)。在至少一个实施例中,代码(例如,可执行代码或源代码)被存储在其上存储有可执行指令的一组一种或更多种非暂时性计算机可读存储介质(或用于存储可执行指令的其他存储器)上,该可执行指令在由计算机系统的一个或更多个处理器执行时(即,作为被执行的结果),使得计算机系统执行本文所述的操作。在至少一个实施例中,一组非暂时性计算机可读存储介质包括多个非暂时性计算机可读存储介质,并且多个非暂时性计算机可读存储介质中的各个非暂时性存储介质中的一个或更多个缺少全部代码,而是多个非暂时性计算机可读存储介质共同存储全部代码。在至少一个实施例中,可执行指令被执行,以使得不同的指令由不同的处理器执行,例如,非暂时性计算机可读存储介质存储指令,并且主中央处理单元(“CPU”)执行一些指令,而图形处理单元(“GPU”)执行其他指令。在至少一个实施例中,计算机系统的不同组件具有单独的处理器并且不同的处理器执行不同的指令子集。
在至少一个实施例中,算术逻辑单元是采用一个或更多个输入来产生结果的一组组合逻辑电路。在至少一个实施例中,处理器使用算术逻辑单元来实现数学运算,诸如加法、减法或乘法。在至少一个实施例中,算术逻辑单元用于实现逻辑运算,诸如逻辑AND/OR或XOR。在至少一个实施例中,算术逻辑单元是无状态的,并且由被布置为形成逻辑门的物理开关组件(诸如半导体晶体管)制成。在至少一个实施例中,算术逻辑单元可以在内部操作为具有关联的时钟的有状态逻辑电路。在至少一个实施例中,算术逻辑单元可构造为具有未保持在关联的寄存器组中的内部状态的异步逻辑电路。在至少一个实施例中,算术逻辑单元由处理器使用以组合被存储在处理器的一个或更多个寄存器中的操作数并产生可以由处理器存储在另一寄存器或存储器位置中的输出。
在至少一个实施例中,作为处理由该处理器检索的指令的结果,该处理器向算术逻辑单元呈现一个或更多个输入或操作数,从而使该算术逻辑单元至少部分地基于被提供给该算术逻辑单元的输入的指令代码来产生结果。在至少一个实施例中,由处理器提供给ALU的指令代码至少部分地基于由处理器执行的指令。在至少一个实施例中,ALU中的组合逻辑处理输入并产生输出,该输出被放置在处理器内的总线上。在至少一个实施例中,处理器选择输出总线上的目的地寄存器、存储器位置、输出设备或输出存储位置,使得对处理器进行钟控使得ALU产生的结果被发送到所需位置。
因此,在至少一个实施例中,计算机系统被配置为实现单独地或共同地执行本文所述的过程的操作的一个或更多个服务,并且这样的计算机系统被配置有使能执行操作的适用的硬件和/或软件。此外,实现本公开的至少一个实施例的计算机系统是单个设备,并且在另一实施例中是分布式计算机系统,其包括不同地操作的多个设备,使得分布式计算机系统执行本文所述的操作,并且使得单个设备不执行所有操作。
本文提供的任何和所有示例或示例性语言(例如,“诸如”)的使用仅旨在更好地阐明本公开的实施例,并且不对公开的范围施加限制,除非另有要求。说明书中的任何语言都不应被解释为指示任何未要求保护的要素对于实践公开内容是必不可少的。
在说明书和权利要求书中,可以使用术语“耦合”和“连接”以及它们的派生词。应当理解,这些术语可能不旨在作为彼此的同义词。相反,在特定示例中,“连接”或“耦合”可用于指示两个或更多个元素彼此直接或间接物理或电接触。“耦合”也可能意味着两个或更多个元素彼此不直接接触,但仍彼此协作或交互。
除非另有明确说明,否则可以理解,在整个说明书中,诸如“处理”、“计算”、“运算”、“确定”等之类的术语,是指计算机或计算系统或类似的电子计算设备的动作和/或过程,其将计算系统的寄存器和/或存储器中表示为物理量(例如电子量)的数据操纵和/或转换为类似地表示为计算系统的存储器、寄存器或其他此类信息存储、传输或显示设备中的物理量的其他数据。
以类似的方式,术语“处理器”可以指处理来自寄存器和/或存储器的电子数据并将该电子数据转换成可以存储在寄存器和/或存储器中的其他电子数据的任何设备或设备的一部分。作为非限制性示例,“处理器”可以是CPU或GPU。“计算平台”可以包括一个或更多个处理器。如本文所使用的,“软件”进程可以包括例如随时间执行工作的软件和/或硬件实体,诸如任务、线程和智能代理。同样,每个进程可以指代多个进程,以顺序地或并行地、连续地或间歇地执行指令。在至少一个实施例中,术语“系统”和“方法”在本文中可以互换使用,只要系统可以体现一种或更多种方法,并且方法可以被认为是系统。
在本文档中,可以参考获得、获取、接收模拟或数字数据或将模拟或数字数据输入子系统、计算机系统或计算机实现的机器中。在至少一个实施例中,可以通过各种方式来完成获得、获取、接收或输入模拟和数字数据的过程,诸如通过接收作为函数调用或对应用程序编程接口的调用的参数的数据。在至少一个实施例中,可以通过经由串行或并行接口传输数据来完成获得、获取、接收或输入模拟或数字数据的过程。在至少一个实施例中,可以通过经由计算机网络将数据从提供实体传输到获取实体来完成获得、获取、接收或输入模拟或数字数据的过程。也可以参考提供、输出、传送、发送或呈现模拟或数字数据。在至少一个实施例中,提供、输出、传送、发送或呈现模拟或数字数据的过程可以通过将数据作为函数调用的输入或输出参数、应用程序编程接口或进程间通信机制的参数进行传输来实现。
虽然本文的描述阐述了所描述的技术的示例实现方式,但是其他架构可以用于实现所描述的功能,并且旨在落入本公开的范围内。此外,尽管出于描述的目的在上面定义了具体的职责分配,但是根据情况,可以以不同的方式分配和划分各种功能和职责。
此外,尽管已经用特定于结构特征和/或方法动作的语言描述了主题,但是应当理解,所附权利要求所要求保护的主题不必限于所描述的特定特征或动作。而是,公开了特定的特征和动作作为实现权利要求的示例性形式。
Claims (20)
1.一种用于网络中的链路聚合的系统,包括:
子网管理器SM,所述SM包括至少一个虚拟网络地址到主机的两个或更多个物理端口的两个或更多个物理网络地址的映射;以及
至少一个子网管理代理SMA,所述至少一个SMA用于与所述SM通信配置信息,所述配置信息用于使得至少一个交换机能够部分地基于所述映射来配置转发表,以及使得所述主机能够使用所述至少一个交换机和所述至少一个虚拟网络地址与其他主机进行通信。
2.如权利要求1所述的系统,其中管理数据报MAD消息传递和捕获消息传递用于执行所述SM与所述至少一个SMA之间的所述配置信息的通信。
3.如权利要求1所述的系统,其中所述两个或更多个物理端口为无限带宽IB端口,并且其中所述IB端口被置于链路聚合LAG模式中,以使用所述至少一个虚拟网络地址到所述两个或更多个物理端口的所述两个或更多个物理网络地址的映射,来使得流量作为所述主机与所述其他主机之间的所述通信的一部分。
4.如权利要求3所述的系统,进一步包括:
所述SM的接口,所述接口用于接收管理员输入,以使用所述SMA将所述IB端口置于所述LAG模式中。
5.如权利要求1所述的系统,其中所述SM被使能为将所述至少一个虚拟网络地址分配给所述两个或更多个物理端口的所述两个或更多个物理网络地址。
6.如权利要求1所述的系统,进一步包括:
所述主机或端点的无限带宽IB软件服务,所述IB软件服务用于使能与以太网服务的链路聚合控制协议LACP软件服务的进一步通信,所述进一步通信用于启动或更新所述两个或更多个物理端口的LAG模式,其中去往所述至少一个虚拟网络地址的流量流被路由到处于所述LAG模式的所述两个或更多个物理端口中的至少一个物理端口。
7.如权利要求6所述的系统,其中对所述MAD的响应包括以下各项中的一项或更多项:
用于向所述SM通知所述两个或更多个物理端口的LAG模式的捕获消息传递;
请求为所述LAG模式下的所述两个或更多个物理端口分配所述至少一个虚拟网络地址的捕获消息传递;
用于向所述SM通知关于所述LAG模式中的改变的捕获消息传递,所述改变包括所述两个或更多个物理端口和其他物理端口的添加或移除中的一者;或
通知关于禁用所述LAG模式的捕获消息传递。
8.如权利要求1所述的系统,其中所述SM进一步被配置为:
接收将所述两个或更多个物理端口或其他物理端口中的端口添加至LAG模式的请求;
执行配置检查,以确定所述两个或更多个物理端口或所述其他物理端口中的端口可用于加入所述LAG模式;
更新或建立所述LAG模式,其中所述SM将所述至少一个虚拟网络地址分配给所述两个或更多个物理端口或所述其他物理端口的所述两个或更多个物理网络地址;以及
使用管理数据报MAD消息传递向所述至少一个交换机传送包括由所述SM进行的所述分配的所述配置信息。
9.如权利要求1所述的系统,其中所述SM进一步被配置为:
检查所述两个或更多个物理端口是LAG模式的一部分;以及
重新配置所述至少一个交换机以使能所述两个或更多个物理端口之间的流量的负载平衡。
10.如权利要求9所述的系统,其中所述系统进一步被配置为:
将另外的端口作为所述两个或更多个物理端口的一部分添加到LAG模式中;
在所述SM与所述至少一个SMA之间通信包括所述另外的端口的所述配置信息,其中所述通信使用管理数据报MAD消息传递并使用所述另外的端口。
11.如权利要求10所述的系统,其中所述MAD消息传递在源和目的地地址报头字段中包括所述另外的端口的物理地址。
12.一种用于网络中的链路聚合的方法,所述方法包括:
在子网管理器SM中提供至少一个虚拟网络地址到主机的两个或更多个物理端口的两个或更多个物理网络地址的映射;
使用与所述两个或更多个物理端口中的至少一个物理端口相关联的至少一个子网管理代理SMA与所述SM通信配置信息;以及
使用所述配置信息使得至少一个交换机能够部分地基于所述映射来配置转发表,使得所述主机能够使用所述至少一个交换机和所述至少一个虚拟网络地址与其他主机进行通信。
13.如权利要求12所述的方法,进一步包括:
使用所述主机或端点的无限带宽IB软件服务,使能与以太网服务的链路聚合控制协议LACP软件服务的进一步通信,所述进一步通信用于启动或更新所述两个或更多个物理端口的LAG模式,其中去往所述至少一个虚拟网络地址的流量流被路由到处于所述LAG模式的所述两个或更多个物理端口中的至少一个物理端口。
14.如权利要求13所述的方法,其中所述MAD消息传递允许包括以下各项中的一项或更多项的响应:
用于向所述SM通知所述两个或更多个物理端口的LAG模式的捕获消息传递;
请求为所述LAG模式下的所述两个或更多个物理端口分配所述至少一个虚拟网络地址的捕获消息传递;
用于向所述SM通知关于所述LAG模式中的改变的捕获消息传递,所述改变包括所述两个或更多个物理端口和其他物理端口的添加或移除中的一者;或
通知关于禁用所述LAG模式的捕获消息传递。
15.如权利要求12所述的方法,进一步包括:
在所述SM中接收将所述两个或更多个物理端口或其他物理端口中的端口添加至LAG模式的请求;
执行配置检查,以确定所述两个或更多个物理端口或所述其他物理端口中的端口可用于加入所述LAG模式;
更新或建立所述LAG模式,其中所述SM将所述至少一个虚拟网络地址分配给所述两个或更多个物理端口或所述其他物理端口的所述两个或更多个物理网络地址;以及
使用MAD消息传递向所述至少一个交换机传送包括由所述SM进行的所述分配的所述配置信息。
16.如权利要求12所述的方法,进一步包括:
由所述SM检查所述两个或更多个物理端口是LAG模式的一部分;以及
重新配置所述至少一个交换机以使能所述两个或更多个物理端口之间的流量的负载平衡。
17.如权利要求16所述的方法,进一步包括:
将另外的端口作为所述两个或更多个物理端口的一部分添加到LAG模式中;
在所述SM与所述至少一个SMA之间通信包括所述另外的端口的所述配置信息,其中所述通信使用MAD消息传递并使用所述另外的端口。
18.如权利要求17所述的方法,其中所述MAD消息传递在源和目的地地址报头字段中包括所述另外的端口的物理地址。
19.一种系统,包括:
子网管理器SM的一个或更多个处理单元,所述一个或更多个处理单元用于与至少一个子网管理代理SMA通信配置信息,所述至少一个SMA与至少一个交换机以及主机相关联,所述配置信息用于使得所述至少一个交换机能够部分地基于至少一个虚拟网络地址到所述主机的两个或更多个物理端口的物理网络地址的映射来配置转发表,以及所述配置信息用于使得所述主机能够使用所述至少一个交换机和所述至少一个虚拟网络地址与其他主机进行通信。
20.如权利要求19所述的系统,所述SM的所述一个或更多个处理单元进一步被配置为:
使用来自所述至少一个SMA的捕获消息传递来监控所述两个或更多个物理端口中的个体物理端口;以及
部分地基于在来自所述至少一个SMA的所述捕获消息传递中所指示的改变,经由所述配置信息使能所述主机和所述至少一个交换机的改变。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US18/162,174 US20240259298A1 (en) | 2023-01-31 | 2023-01-31 | Link aggregation in infiniband networks |
US18/162,174 | 2023-01-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118433092A true CN118433092A (zh) | 2024-08-02 |
Family
ID=91852992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410134617.6A Pending CN118433092A (zh) | 2023-01-31 | 2024-01-30 | 无限带宽网络中的链路聚合 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240259298A1 (zh) |
CN (1) | CN118433092A (zh) |
DE (1) | DE102024200867A1 (zh) |
-
2023
- 2023-01-31 US US18/162,174 patent/US20240259298A1/en active Pending
-
2024
- 2024-01-30 CN CN202410134617.6A patent/CN118433092A/zh active Pending
- 2024-01-31 DE DE102024200867.2A patent/DE102024200867A1/de active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240259298A1 (en) | 2024-08-01 |
DE102024200867A1 (de) | 2024-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210243076A1 (en) | Advanced link tracking for virtual cluster switching | |
US10270658B2 (en) | Zero touch configuration and synchronization of a service appliance in a network environment | |
US9515922B2 (en) | Distributed fibre channel forwarder | |
CN110535760B (zh) | 聚合接口的转发检测 | |
CN103997414B (zh) | 生成配置信息的方法和网络控制单元 | |
US7068667B2 (en) | Method and system for path building in a communications network | |
US11398956B2 (en) | Multi-Edge EtherChannel (MEEC) creation and management | |
US10348847B2 (en) | System and method for supporting proxy based multicast forwarding in a high performance computing environment | |
US8891536B2 (en) | Layer-3 services for united router farm | |
CN113746760B (zh) | 通信方法、网络控制器和计算机可读存储介质 | |
JP2004537881A (ja) | ネットワーク管理のための方法とシステム | |
CN103986638B (zh) | Advpn隧道绑定多公网链路的方法和装置 | |
US9407547B2 (en) | Fibre channel over ethernet (FCoE) over virtual port channel (vPC) | |
US8787396B2 (en) | Centralized control and management planes for different independent switching domains | |
CN112491984B (zh) | 基于虚拟网桥的容器编排引擎集群管理系统 | |
JP7336521B2 (ja) | 信号中継局(stp)のメッセージプロセッサ間でsigtran接続を分散させる方法、システム、およびコンピュータ読み取り可能なプログラム | |
RU2740035C1 (ru) | Шлюз прямых межсоединений | |
CN114553707B (zh) | 网络的拓扑信息的生成和网络故障的定界方法、装置 | |
US9686210B2 (en) | Controller based fibre channel over ethernet (FCoE) fabric | |
CN104994019B (zh) | 一种用于sdn控制器的水平方向接口系统 | |
US11582067B2 (en) | Systems and methods for providing network connectors | |
CN118433092A (zh) | 无限带宽网络中的链路聚合 | |
CN104639417B (zh) | 一种advpn隧道绑定公网链路的方法和装置 | |
US20240259233A1 (en) | Slim ethernet communication over infiniband | |
CN113556694B (zh) | 信息的发送方法、装置、系统、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |