Nothing Special   »   [go: up one dir, main page]

CN102742251A - 一种实现对称多处理系统的节点聚合系统 - Google Patents

一种实现对称多处理系统的节点聚合系统 Download PDF

Info

Publication number
CN102742251A
CN102742251A CN2011800017844A CN201180001784A CN102742251A CN 102742251 A CN102742251 A CN 102742251A CN 2011800017844 A CN2011800017844 A CN 2011800017844A CN 201180001784 A CN201180001784 A CN 201180001784A CN 102742251 A CN102742251 A CN 102742251A
Authority
CN
China
Prior art keywords
node
computing
interface
computing node
crowd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800017844A
Other languages
English (en)
Inventor
雕峻峰
王少勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN102742251A publication Critical patent/CN102742251A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/505Clust

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了一种实现对称多处理系统的节点聚合系统,以实现灵活配置SMP系统的规模和输入输出资源的全局共享。所述系统包括至少一个节点聚合模块、至少一个业务网络接口模块和至少一个计算节点群,所述计算节点群包括至少一个计算节点;所述计算节点群组成计算资源池,用于处理数据业务;所述节点聚合模块构成聚合网络平面,通过第一接口与所述计算节点群中的所有计算节点相连;所述业务网络接口模块构成业务网络平面,通过第二接口与所述计算节点群中的所有计算节点相连,通过若干不同于所述第二接口的接口与外部输入输出设备相连。所述系统减少了计算节点访问IO资源时的时延,提高了系统的整体性能。

Description

一种实现对称多处理系统的节点聚合系统
技术领域
本发明实施例涉及通信领域,尤其涉及一种实现对称多处理系统的节点聚合系统。
背景技术
对称多处理(Symmetric Multi-Processing,SMP)系统作为云计算中的胖节点和进入数据中心的节点,是一个重要的演进趋势,目前IT主流厂商都提供大型SMP系统。从产品形态、架构上来看,这些大型SMP系统都比较独特,主要表现在:整个系统从计算节点到非一致存储访问(Non Uniform MemoryAccess,NUMA)网络硬件都和某个厂家的产品捆绑,采购成本高,系统可扩展性有限(最多32路至64路),所从事的业务类型比较单一、固定等。
如附图1-a所示,是现有技术提供的一种SMP系统中计算节点的连接示意图。该SMP系统包括8个计算节点,从图中可以看出,8个计算节点相互之间采用全互联拓扑,即,每个计算节点与其他的7个计算节点两两直接相连。该系统的每个计算节点包含4个中央处理单元(Central Processing Unit,CPU),这些CPU都是同一厂商出品,并且相互之间采用全互联拓扑(因此,该系统最大支持32路处理器),如附图1-b所示,每个CPU采用一条CPU输入输出(Input/Output,IO)总线与CPU IO总线适配器(Adaptor)相连,通过CPU IO总线适配器连接外部的IO扩展框(IO扩展框有多种规格,主要是外接PCI-E卡、硬盘)。附图1-b示例的计算节点的IO结构不是全局共享的,即,每个CPU都对应自己的IO设备,若其他CPU需要访问CPU对应的IO设备,必须要经过该CPU。例如,若CPU2需要访问CPU1的IO设备(例如,IO扩展框1),则数据或信息需要先通过CPU1,经由CPU1与IO扩展框1之间的CPU IO总线,到达与CPU1连接的CPU IO总线适配器,然后,才能实现对IO扩展框1的访问。
由于CPU相互之间采用全互联拓扑,因此,上述现有技术提供的SMP系统的CPU必然具有很多互联接口,如此带来了设计难度较大、且系统规模难以扩大的问题;另一方面,由于现有技术提供的SMP系统中CPU的IO结构不是全局共享的,因此,若其他节点要访问一个IO设备,则需要通过该IO设备对应的节点,这样就增加了延时,影响系统的整体性能。从操作系统(Operating System,OS)的层面而言,若OS需要访问某个IO设备的资源,就需要知道这个IO设备所对应的节点,如此,OS的设计就需要和具体设备的硬件紧耦合,难以做到通用。
发明内容
本发明实施例提供了一种实现对称多处理系统的节点聚合系统,以实现灵活配置SMP系统的规模和输入输出资源的全局共享。
本发明实施例提供一种实现对称多处理系统的节点聚合系统,所述系统包括至少一个节点聚合模块、至少一个业务网络接口模块和至少一个计算节点群,所述计算节点群包括至少一个计算节点;
所述计算节点群组成计算资源池,用于处理数据业务;
所述节点聚合模块构成聚合网络域,通过第一接口Interf1与所述计算节点群中的所有计算节点相连;
所述业务网络接口模块构成业务网络域,通过第二接口Interf2与所述计算节点群中的所有计算节点相连,通过若干不同于所述第二接口Interf2的接口与外部输入输出设备相连。
本发明实施例提供一种实现对称多处理系统的节点聚合系统,所述系统包括至少一个节点聚合模块、输入输出设备和至少一个计算节点群,所述计算节点群包括至少一个计算节点;
所述计算节点群组成计算资源池,用于处理数据业务;
所述节点聚合模块构成聚合网络域,通过同一个接口与所述计算节点群中的所有计算节点相连,通过所述同一个接口或者不同于所述统一接口的其它接口与所述输入输出设备相连。
从上述示例的实现对称多处理系统的节点聚合系统可知,由于聚合网络平面和业务平面分离,并且分别通过统一接口与计算节点群中的所有计算节点相连,即,聚合网络平面、业务网络平面的接口归为一个接口,如此,通过聚合网络平面可以组合多个计算节点组成一个较大的SMP系统,实现一个大的计算资源池,而业务平面分离只通过一个统一接口与计算节点群中的所有计算节点相连,也实现了IO资源的全局共享,减少了计算节点访问IO资源时的时延,因而提高了系统的整体性能。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对现有技术或实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,还可以如这些附图获得其他的附图。
图1-a所示是现有技术提供的一种SMP系统中计算节点的连接示意图;
图1-b所示是现有技术提供的一种SMP系统结构示意图;
图2-a是本发明实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图2-b是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图3-a是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图3-b是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图3-c是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图3-d是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图4-a是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图4-b是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图4-c是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图4-d是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图;
图4-e是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图。
具体实施方式
本发明实施例提供了一种实现对称多处理系统的节点聚合系统,以实现灵活配置SMP系统的规模和输入输出资源的全局共享。
请参阅附图2-a,本发明实施例提供的实现对称多处理系统的节点聚合系统结构示意图。为了便于说明,仅仅示出了与本发明实施例相关的部分。
图2-a示例的实现对称多处理系统的节点聚合系统02a包括至少一个节点聚合模块203、至少一个业务网络接口模块202和计算节点群2011、计算节点群2012、......、计算节点群201N,即,所述实现对称多处理系统的节点聚合系统02至少包括一个计算节点群,而计算节点群至少包括一个计算节点。可以理解的是,每个计算节点包括处理器和内存资源。计算节点群组成计算资源池,用于处理数据业务;所述节点聚合模块203构成聚合网络平面,通过一个统一的第一接口Interf1与所述计算节点群中的所有计算节点相连,即,计算节点群中的所有计算节点只通过一个接口Interf1与节点聚合模块203相连;所述业务网络接口模块202构成业务网络平面,通过一个统一的第二接口Interf2与所述计算节点群中的所有计算节点相连,计算节点群中的所有计算节点只通过一个接口Interf2与业务网络接口模块202相连,而业务网络接口模块202通过所述统一接口Interf2或若干不同于所述统一接口Interf2的接口与外部输入输出设备相连。在本发明提供的实施例中,业务网络接口模块202所起作用与业务平面的交换机(Switch)、网桥(Bridge)的作用类似。业务网络接口模块202能够一侧通过统一接口Interf2连接各个计算节点,对外一侧则根据需求出各种接口,以连接外部的IO设备,包括但不限于数据中心核心交换机、光纤通道(Fibre Channel,FC)阵列等。由于业务网络接口模块202连接计算节点一侧的统一接口Interf2和对外一侧连接FC阵列、PCI-E及以太网等的接口是不同的,因此,业务网络接口模块202必然具备有网桥的接口转换功能。
在本发明实施中,聚合网络域又称为聚合网络平面,所谓“聚合网络平面”是对节点聚合模块的一种“层”或“面”的抽象,用于处理器紧耦合连接多个计算节点、从而聚合成一个大系统。聚合网络平面一般不对节点聚合系统之外出接口,并且要求高带宽、低延时。业务网络域又称为业务网络平面,“业务网络平面”是对节点聚合模块的一种“层”或“面”的抽象,业务网络平面用于节点聚合系统对外出IO链路,通过业务网络平面,节点聚合系统和系统外部进行业务数据的IO交互,例如,业务网络平面连接至数据中心的交换机,可以使得节点聚合系统和外界通信,或者,业务网络平面连接至磁盘阵列等。与聚合网络平面不同,业务网络平面一般对延时要求不高。
需要说明的是,在本实施例以及本发明其他实施例中,当节点聚合模块203或业务网络接口模块202不只一个时,可以将一个节点聚合模块203或一个业务网络接口模块202当作主用节点聚合模块或主用业务网络接口模块使用,其余的节点聚合模块或业务网络接口模块当作备用节点聚合模块或备用业务网络接口模块。
在本发明实施例中,计算资源池是核心模块,计算节点群的划分,主要从物理安装地点(例如,数据中心中的机柜位置)来划分,或者按照综合功能和物理安装地点来划分。节点聚合模块203构成的聚合网络平面,用于紧耦合连接多个计算节点。一般地,每个计算节点包含2至少4个中央处理器,节点中的中央处理器通过节点控制器(Node Controller,NC)和聚合网络平面连接。与现有技术提供的CPU相互之间采用全互联拓扑结构的SMP系统最大只能支持32路处理器相比,本发明实施例提供的SMP系统通过节点聚合模块203,聚合计算节点中的中央处理器,可以组成一个较大的系统,例如,32路、64路系统等,如此,可以实现一个大的计算资源池,也可以根据需求灵活配置SMP系统的规模。业务网络接口模块202的构成业务网络平面,用于计算节点对外出输入输出(Input Output,IO)链路,通过业务平面的交换设备,可以实现与系统外部进行业务数据的IO交互,例如,连接到数据中心的交换机,和外界通信。
在图2-a示例的实现对称多处理系统的节点聚合系统02a中,外部输入输出设备可以包括数据交换中心核心交换机204、光纤通道阵列205和输入输出扩展框206等等,如附图2-b另一实施例提供的实现对称多处理系统的节点聚合系统02b。其中,光纤通道(Fibre Channel,FC)阵列205主要用于存储区域网络(Storage Area Network,SAN)。
需要说明的是,从系统角度看,聚合网络平面一般不对外出接口,业务网络平面需要和外部进行IO数据交互,例如,和以太网交换机连接进行IO数据交互;聚合网络平面要求高带宽、低延时,而业务网络平面要求高带宽,对延时要求不高。
在图2-a或图2-b示例的实现对称多处理系统的节点聚合系统中,计算节点群中的第一计算节点包括类型相同的至少一个第一中央处理器,计算节点群中的第二计算节点包括类型相同的至少一个第二中央处理器,即,计算节点群2011中的一个计算节点包括类型相同的至少一个中央处理器(例如,Intel的x86处理器),计算节点群2011中的另一个计算节点包括类型相同的至少一个中央处理器(例如,ARM处理器)。换言之,计算节点群2011中的各个计算节点之间可以包含不同类型的中央处理器,其他计算节点群也类似。由于计算节点的中央处理器并不绑定一种类型,因此,本发明实施例提供的对称多处理系统可以满足多种业务需求。
在图2-a或图2-b示例的实现对称多处理系统的节点聚合系统中,节点聚合模块203与计算节点群中的所有计算节点之间的统一接口Interf1为私有接口或InfiniBand接口。
从上述图2-a或图2-b示例的实现对称多处理系统的节点聚合系统可知,由于聚合网络平面和业务平面分离,并且分别通过统一接口与计算节点群中的所有计算节点相连,即,聚合网络平面、业务网络平面的接口归为一个接口,如此,通过聚合网络平面可以组合多个计算节点组成一个较大的SMP系统,实现一个大的计算资源池,而业务平面分离只通过一个统一接口与计算节点群中的所有计算节点相连,也实现了IO资源的全局共享,减少了计算节点访问IO资源时的时延,因而提高了系统的整体性能。
请参阅图3-a,是本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图。为了便于说明,仅仅示出了与本发明实施例相关的部分。
图3-a示例的实现对称多处理系统的节点聚合系统03a除了包括图2-a或图2-b示例的至少一个节点聚合模块203、至少一个业务网络接口模块202和计算节点群2011、计算节点群2012、......、计算节点群201N之外,还包括若干特性节点,例如,包括特性节点3011、特性节点3012、......、和特性节点301N等等。与图2-a或图2-b实施例类似,所述实现对称多处理系统的节点聚合系统03a至少包括一个计算节点群,而计算节点群至少包括一个计算节点。计算节点群组成计算资源池,用于处理数据业务;所述节点聚合模块203构成聚合网络平面,通过一个统一接口Interf1与所述计算节点群中的所有计算节点相连,即,计算节点群中的所有计算节点只通过一个接口Interf1与节点聚合模块203相连;所述业务网络接口模块202构成业务网络平面,通过一个统一的第二接口Interf2与所述计算节点群中的所有计算节点相连,计算节点群中的所有计算节点只通过一个接口Interf2与业务网络接口模块202相连,而业务网络接口模块202通过所述统一的第二接口Interf2或若干不同于所述统一的第二接口Interf2的接口与外部输入输出设备相连。在本发明提供的实施例中,业务网络接口模块202所起作用与业务平面的交换机(Switch)、网桥(Bridge)的作用类似。业务网络接口模块202能够一侧通过统一接口Interf2连接各个计算节点,对外一侧则根据需求出各种接口,以连接外部的IO设备,包括但不限于数据中心核心交换机、FC阵列等。由于业务网络接口模块202连接计算节点一侧的统一接口Interf2和对外一侧连接FC阵列、PCI-E及以太网等的接口不一定相同,因此,业务网络接口模块202可以具备有网桥的接口转换功能。
在图3-a示例的实现对称多处理系统的节点聚合系统03a中,计算资源池是核心模块,计算节点群的划分,主要从物理安装地点(例如,数据中心中的机柜位置)来划分,或者按照综合功能和物理安装地点来划分。节点聚合模块203构成的聚合网络平面,用于紧耦合连接多个计算节点。一般地,每个计算节点包含2至少4个中央处理器,节点中的中央处理器通过节点控制器(NodeController,NC)和聚合网络平面连接。与现有技术提供的CPU相互之间采用全互联拓扑结构的SMP系统最大只能支持32路处理器相比,本发明实施例提供的SMP系统通过节点聚合模块203,聚合计算节点中的中央处理器,可以组成一个较大的系统,例如,32路、64路系统等,如此,可以实现一个大的计算资源池,也可以根据需求灵活配置SMP系统的规模。业务网络接口模块202的构成业务网络平面,用于计算节点对外出输入输出(Input Output,IO)链路,通过业务平面的交换设备,可以实现与系统外部进行业务数据的IO交互,例如,连接到数据中心的交换机,和外界通信。
特性节点3011、特性节点3012、......、和特性节点301N等用于实现对称多处理系统的节点聚合系统03a中计算节点群的计算节点加速对数据业务的处理过程或增加所述节点聚合系统的额外功能。换言之,计算节点完成系统基本的数据处理功能,同时为了增强系统特性,引入特性节点这样的模块。在本发明实施例中,特性节点可以有“数据库加速”、“全局镜像”等功能,用于系统的计算加速或增值,在计算节点群所提供的功能之外,增加一些系统功能,也体现了灵活性、可扩展性。所谓‘额外功能’就是指上述特性节点所提供的这些功能,可以根据客户需求而不断的演进和扩展。节点聚合模块203通过通过所述统一的第一接口Interf1或若干不同于所述统一的第一接口Interf1的接口与所述实现对称多处理系统的节点聚合系统03a中的特性节点相连。
在本发明一个实施例中,图3-a示例的对称多处理系统中的若干特性节点可以组成一个节点域301,如附图3-b所示本发明实施例提供的实现对称多处理系统的节点聚合系统03b。所谓节点域,可以是多个特性节点组合起来构成的一个域,这个域也能够完成某种特定的功能,节点域不限于一种特性节点。换言之,节点域是由多个特性节点组合起来的功能模块,同样可用于加速所述节点聚合系统中的所述计算节点对数据业务的处理过程或增加所述系统的功能,与特性节点不同之处在于,它对外呈现为一个功能比单个特性节点功能更加强大的功能模块。例如,数据库加速节点(是一种“特性节点”)的应用,可能随着系统的扩容,针对某一个应用软件,一个数据库加速节点已经不够用,需要多个数据库加速节点来组成一个“数据库加速节点域”(是一种“节点域”)来支持这个应用。
在本发明一个实施例中,图3-a或图3-b示例的实现对称多处理系统的节点聚合系统中的特性节点可以是固态硬盘(Solid State Disk,SSD)节点、数据库(DataBase,DB)加速节点和安全加速节点等中的一种或多种。如附图3-c所示本发明实施例提供的实现对称多处理系统的节点聚合系统,包括固态硬盘节点304、数据库加速节点305和安全加速节点306。其中,固态硬盘节点304的功能可以根据客户需求来定,例如,用于系统镜像、系统高速缓存(Cache)等,数据库加速节点305可用于处理数据库业务时,协助计算节点处理一些特定的计算功能,例如,十进制加速计算等,而安全加速节点305可协助计算节点群中的计算节点处理一些安全算法,例如,密匙算法加速等。在本发明实施例中,特性节点不限于上述SSD节点、DB加速节点和安全加速节点等这几种节点,原则上,只要起到系统增值部件、计算加速功能的节点都可以连接至节点聚合模块203。
可以理解,图3-c示例的固态硬盘节点304、数据库加速节点305和安全加速节点306等等中的几个可以组成一个或多个节点域,以完成某种特定的功能。
在图3-a、图3-b或图3-c示例的实现对称多处理系统的节点聚合系统中,外部输入输出设备可以包括数据交换中心核心交换机307、光纤通道阵列308和输入输出扩展框309等等,如附图3-d另一实施例提供的实现对称多处理系统的节点聚合系统03d。其中,光纤通道(Fibre Channel,FC)阵列308主要用于存储区域网络(Storage Area Network,SAN)。
在图3-a至图3-d示例的的实现对称多处理系统的节点聚合系统中,计算节点群中的第一计算节点包括类型相同的至少一个第一中央处理器,计算节点群中的第二计算节点包括类型相同的至少一个第二中央处理器,即,计算节点群2011中的一个计算节点包括类型相同的至少一个中央处理器(例如,Intel的x86处理器),计算节点群2011中的另一个计算节点包括类型相同的至少一个中央处理器(例如,ARM处理器)。换言之,计算节点群2011中的各个计算节点之间可以包含不同类型的中央处理器,其他计算节点群也类似。由于计算节点的中央处理器并不绑定一种类型,因此,本发明实施例提供的对称多处理系统可以满足多种业务需求。
在图3-a至图3-d示例的实现对称多处理系统的节点聚合系统中,节点聚合模块203与计算节点群中的所有计算节点之间的统一接口Interf1为私有接口或InfiniBand接口。
从上述图3-a至图3-d示例的实现对称多处理系统的节点聚合系统可知,由于聚合网络平面和业务平面分离,并且分别通过统一接口与计算节点群中的所有计算节点相连,即,聚合网络平面、业务平面的接口归为一个接口,如此,通过聚合网络平面可以组合多个计算节点组成一个较大的SMP系统,实现一个大的计算资源池;业务平面分离只通过一个统一接口与计算节点群中的所有计算节点相连,也实现了IO资源的全局共享,减少了计算节点访问IO资源时的时延,因而提高了系统的整体性能;而特性节点的加入,也可以为本发明实施例提供的对称多处理系统实现计算节点计算加速和协助计算节点处理安全算法等特殊功能。
请参阅图4-a,本发明另一实施例提供的实现对称多处理系统的节点聚合系统结构示意图。为了便于说明,仅仅示出了与本发明实施例相关的部分。
图4-a示例的实现对称多处理系统的节点聚合系统04a包括至少一个节点聚合模块402、输入输出设备403和计算节点群4011、计算节点群4012、......、计算节点群401N,即,所述实现对称多处理系统的节点聚合系统04a至少包括一个计算节点群,而计算节点群至少包括一个计算节点。计算节点群组成计算资源池,用于处理数据业务;所述节点聚合模块402构成聚合网络平面,通过同一个接口与所述计算节点群中的所有计算节点相连,通过若干不同于所述统一接口的接口与所述输入输出设备403相连,即,计算节点群中的所有计算节点只通过一个接口与节点聚合模块402相连,而节点聚合模块402通过所述同一个接口或不同于所述统一接口的其它接口与输入输出设备403相连。
需要说明的是,在本实施例以及本发明其他实施例中,当节点聚合模块402不只一个时,可以将一个节点聚合模块402当作主用节点聚合模块使用,其余的节点聚合模块当作备用节点聚合模块。
在图4-a所示实施例中,计算资源池是核心模块,计算节点群的划分,主要从物理安装地点(例如,数据中心中的机柜位置)来划分,或者按照综合功能和物理安装地点来划分。节点聚合模块402构成的聚合网络平面,用于紧耦合连接多个计算节点。一般地,每个计算节点包含2至少4个中央处理器,节点中的中央处理器通过节点控制器(Node Controller,NC)和聚合网络平面连接。与现有技术提供的CPU相互之间采用全互联拓扑结构的SMP系统最大只能支持32路处理器相比,本发明实施例提供的SMP系统通过节点聚合模块402,聚合计算节点中的中央处理器,可以组成一个较大的系统,例如,32路、64路系统等,如此,可以实现一个大的计算资源池,也可以根据需求灵活配置SMP系统的规模。
在图4-a示例的实现对称多处理系统的节点聚合系统中,计算节点群中的第一计算节点包括类型相同的至少一个第一中央处理器,计算节点群中的第二计算节点包括类型相同的至少一个第二中央处理器,即,计算节点群4011中的一个计算节点包括类型相同的至少一个中央处理器(例如,Intel的x86处理器),计算节点群4011中的另一个计算节点包括类型相同的至少一个中央处理器(例如,ARM处理器)。换言之,计算节点群4011中的各个计算节点之间可以包含不同类型的中央处理器,其他计算节点群也类似。由于计算节点的中央处理器并不绑定一种类型,因此,本发明实施例提供的对称多处理系统可以满足多种业务需求。
在图4-a示例的实现对称多处理系统的节点聚合系统中,节点聚合模块402与计算节点群中的所有计算节点之间的统一接口为私有接口或InfiniBand接口。
在图4a示例的实现对称多处理系统的节点聚合系统中,输入输出设备403可以包括数据交换中心核心交换机、光纤通道阵列和输入输出扩展框等等,其中,光纤通道(Fibre Channel,FC)阵列主要用于存储区域网络(Storage AreaNetwork,SAN)
从上述图4-a示例的实现对称多处理系统的节点聚合系统可知,由于聚合网络平面的接口归为一个接口,如此,通过聚合网络平面可以组合多个计算节点组成一个较大的SMP系统,实现一个大的计算资源池,而聚合网络平面只通过一个统一接口与计算节点群中的所有计算节点相连,也实现了IO资源的全局共享,减少了计算节点访问IO资源时的时延,因而提高了系统的整体性能。
图4-a示例的实现对称多处理系统的节点聚合系统04a除了包括节点聚合模块402、输入输出设备403和计算节点群4011、计算节点群4012、......、计算节点群401N之外,还包括若干特性节点,例如,包括特性节点4041、特性节点4042、......、和特性节点404N等等,如附图4-b所示本发明实施例提供的实现对称多处理系统的节点聚合系统04b。与图4-a实施例类似,所述实现对称多处理系统的节点聚合系统04b至少包括一个计算节点群,而计算节点群至少包括一个计算节点。计算节点群组成计算资源池,用于处理数据业务;所述节点聚合模块402构成聚合网络平面,构成聚合网络平面,通过同一个接口与所述计算节点群中的所有计算节点相连,通过若干不同于所述同一个接口的接口与所述输入输出设备403相连,即,计算节点群中的所有计算节点只通过一个接口与节点聚合模块402相连,而节点聚合模块402通过若干不同于所述统一接口的接口与输入输出设备403相连。
在图4-b示例的实现对称多处理系统的节点聚合系统04b中,计算资源池是核心模块,计算节点群的划分,主要从物理安装地点(例如,数据中心中的机柜位置)来划分,或者按照综合功能和物理安装地点来划分。节点聚合模块402构成的聚合网络平面,用于紧耦合连接多个计算节点。一般地,每个计算节点包含2至少4个中央处理器,节点中的中央处理器通过节点控制器(NodeController,NC)和聚合网络平面连接。与现有技术提供的CPU相互之间采用全互联拓扑结构的SMP系统最大只能支持32路处理器相比,本发明实施例提供的SMP系统通过节点聚合模块402,聚合计算节点中的中央处理器,可以组成一个较大的系统,例如,32路、64路系统等,如此,可以实现一个大的计算资源池,也可以根据需求灵活配置SMP系统的规模。
特性节点4041、特性节点4042、......、和特性节点404N等用于对称多处理系统04a中计算节点群的计算节点加速对数据业务的处理过程和增加所述节点聚合系统的额外功能。节点聚合模块402通过若干不同于所述统一接口的接口与所述实现对称多处理系统的节点聚合系统04a中的特性节点相连。
在图4-b示例的实现对称多处理系统的节点聚合系统中,计算节点群中的第一计算节点包括类型相同的至少一个第一中央处理器,计算节点群中的第二计算节点包括类型相同的至少一个第二中央处理器,即,计算节点群4011中的一个计算节点包括类型相同的至少一个中央处理器(例如,Intel的x86处理器),计算节点群4011中的另一个计算节点包括类型相同的至少一个中央处理器(例如,ARM处理器)。换言之,计算节点群4011中的各个计算节点之间可以包含不同类型的中央处理器,其他计算节点群也类似。由于计算节点的中央处理器并不绑定一种类型,因此,本发明实施例提供的对称多处理系统可以满足多种业务需求。
在本发明一个实施例中,图4-b示例的实现对称多处理系统的节点聚合系统中的若干特性节点可以组成一个节点域404,如附图4-c所示本发明实施例提供的实现对称多处理系统的节点聚合系统04c。所谓节点域,可以是多个特性节点组合起来构成的一个域,这个域能够完成某种特定的功能,节点域不限于一种特性节点。换言之,节点域是由多个特性节点组合起来的功能模块,同样可用于加速所述节点聚合系统中的所述计算节点对数据业务的处理过程或增加所述系统的功能,与特性节点不同之处在于,它对外呈现为一个功能比单个特性节点功能更加强大的功能模块。
在本发明一个实施例中,图4-b或图4-c示例的实现对称多处理系统的节点聚合系统中的特性节点可以是固态硬盘(Solid State Disk,SSD)节点、数据库(DataBase,DB)加速节点和安全加速节点等中的一种或多种。如附图4-d所示本发明实施例提供的实现对称多处理系统的节点聚合系统04d,包括固态硬盘节点405、数据库加速节点406和安全加速节点407。其中,固态硬盘节点405的功能可以根据客户需求来定,例如,用于系统镜像、系统高速缓存(Cache)等,数据库加速节点406可用于处理数据库业务时,协助计算节点处理一些特定的计算功能,例如,十进制加速计算等,而安全加速节点407可协助计算节点群中的计算节点处理一些安全算法,例如,密匙算法加速等。在本发明实施例中,特性节点不限于上述SSD节点、DB加速节点和安全加速节点等这几种节点,原则上,只要起到系统增值部件、计算加速功能的节点都可以连接至节点聚合模块402。
可以理解,图4-d示例的固态硬盘节点405、数据库加速节点406和安全加速节点407等等中的几个可以组成一个或多个节点域,以完成某种特定的功能。
在图4-b至图4-d示例的实现对称多处理系统的节点聚合系统中,输入输出设备403可以包括数据交换中心核心交换机408、光纤通道阵列409和输入输出扩展框410等等,如附图4-e另一实施例提供的实现对称多处理系统的节点聚合系统04e。其中,光纤通道(Fibre Channel,FC)阵列409主要用于存储区域网络(Storage Area Network,SAN)。
在图4-b至图4-e示例的的实现对称多处理系统的节点聚合系统中,计算节点群中的第一计算节点包括类型相同的至少一个第一中央处理器,计算节点群中的第二计算节点包括类型相同的至少一个第二中央处理器,即,计算节点群4011中的一个计算节点包括类型相同的至少一个中央处理器(例如,Intel的x86处理器),计算节点群4011中的另一个计算节点包括类型相同的至少一个中央处理器(例如,ARM处理器)。换言之,计算节点群4011中的各个计算节点之间可以包含不同类型的中央处理器,其他计算节点群也类似。由于计算节点的中央处理器并不绑定一种类型,因此,本发明实施例提供的对称多处理系统可以满足多种业务需求。
在图4-b至图4-e示例的实现对称多处理系统的节点聚合系统中,节点聚合模块402与计算节点群中的所有计算节点之间的统一接口为私有接口或InfiniBand接口。
从上述图4-b至图4-e示例的实现对称多处理系统的节点聚合系统可知,由于聚合网络平面的接口归为一个接口,如此,通过聚合网络平面可以组合多个计算节点组成一个较大的SMP系统,实现一个大的计算资源池,而聚合网络平面只通过一个统一接口与计算节点群中的所有计算节点相连,也实现了IO资源的全局共享,减少了计算节点访问IO资源时的时延,因而提高了系统的整体性能;而特性节点的加入,也可以为本发明实施例提供的对称多处理系统实现计算节点计算加速和协助计算节点处理安全算法等特殊功能。
以上对本发明所提供的一种实现对称多处理系统的节点聚合系统进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,因此,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种实现对称多处理系统的节点聚合系统,其特征在于,所述系统包括至少一个节点聚合模块、至少一个业务网络接口模块和至少一个计算节点群,所述计算节点群包括至少一个计算节点;
所述计算节点群组成计算资源池,用于处理数据业务;
所述节点聚合模块构成聚合网络域,通过第一接口Interf1与所述计算节点群中的其它所有计算节点相连;
所述业务网络接口模块构成业务网络域,通过第二接口Interf2与所述计算节点群中的所有计算节点相连,通过所述第二接口Interf2或若干不同于所述第二接口Interf2的接口与外部输入输出设备相连。
2.根据权利要求1所述的系统,其特征在于,所述系统还包括特性节点,所述节点聚合模块与所述系统中的特性节点相连,所述特性节点用于加速所述系统中的所述计算节点对数据业务的处理过程或增加所述系统的功能。
3.根据权利要求2所述的系统,其特征在于,若干所述特性节点组成节点域,通过接口与所述节点聚合模块相连,所述节点域用于加速所述系统中的所述计算节点对数据业务的处理过程或增加所述系统的功能。
4.根据权利要求2或3所述的系统,其特征在于,所述特性节点包括固态硬盘节点,用于系统镜像和系统高速缓存。
5.根据权利要求2或3所述的系统,其特征在于,所述特性节点包括数据库加速节点,用于处理数据库业务时,协助计算节点处理特定的计算功能。
6.根据权利要求2或3所述的系统,其特征在于,所述特性节点包括安全加速节点,用于协助计算节点群中的计算节点处理安全算法。
7.根据权利要求1所述的装置,其特征在于,所述统一接口Interf1包括私有接口或InfiniBand接口。
8.一种实现对称多处理系统的节点聚合系统,其特征在于,所述系统包括至少一个节点聚合模块、输入输出设备和至少一个计算节点群,所述计算节点群包括至少一个计算节点;
所述计算节点群组成计算资源池,用于处理数据业务;
所述节点聚合模块构成聚合网络域,通过同一个接口与所述计算节点群中的所有计算节点相连,通过所述同一个接口或不同于所述同一个接口的其它接口与所述输入输出设备相连。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括若干特性节点,所述节点聚合模块与所述系统中的特性节点相连,所述特性节点用于所述系统中的计算节点加速对数据业务的过程或增加所述系统的功能。
10.根据权利要求9所述的系统,其特征在于,所述若干特性节点组成节点域,通过接口与所述节点聚合模块相连,所述节点域用于加速所述系统中的所述计算节点对数据业务的处理过程或增加所述系统的功能。
11.根据权利要求9或10所述的系统,其特征在于,所述特性节点包括固态硬盘节点,用于系统镜像和系统高速缓存。
12.根据权利要求9或10所述的系统,其特征在于,所述特性节点包括数据库加速节点,用于处理数据库业务时,协助计算节点处理特定的计算功能。
13.根据权利要求9或10所述的系统,其特征在于,所述特性节点包括安全加速节点,用于协助计算节点群中的计算节点处理安全算法。
14.根据权利要求8所述的系统,其特征在于,所述统一接口包括私有接口或InfiniBand接口。
15.根据权利要求8所述的系统,其特征在于,所述外部输入输出设备包括数据交换中心核心交换机、光纤通道阵列和输入输出扩展框。
CN2011800017844A 2011-08-11 2011-08-11 一种实现对称多处理系统的节点聚合系统 Pending CN102742251A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/078240 WO2012083705A1 (zh) 2011-08-11 2011-08-11 一种实现对称多处理系统的节点聚合系统

Publications (1)

Publication Number Publication Date
CN102742251A true CN102742251A (zh) 2012-10-17

Family

ID=46313107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800017844A Pending CN102742251A (zh) 2011-08-11 2011-08-11 一种实现对称多处理系统的节点聚合系统

Country Status (3)

Country Link
US (1) US20130124597A1 (zh)
CN (1) CN102742251A (zh)
WO (1) WO2012083705A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105378672A (zh) * 2013-07-18 2016-03-02 联想企业解决方案(新加坡)有限公司 对称多处理器(smp)域的动态形成
CN106233277A (zh) * 2014-02-19 2016-12-14 斯诺弗雷克计算公司 资源管理系统及方法
CN110647399A (zh) * 2019-09-22 2020-01-03 南京信易达计算技术有限公司 一种基于人工智能网络的高性能计算系统及方法
US11307943B2 (en) 2017-03-21 2022-04-19 Huawei Technologies Co., Ltd. Disaster recovery deployment method, apparatus, and system

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150338447A1 (en) 2014-05-20 2015-11-26 Allied Telesis Holdings Kabushiki Kaisha Sensor based detection system
PH12013000136A1 (en) 2013-05-23 2015-01-21 De Antoni Ferdinand Evert Karoly A domain agnostic method and system for the capture, storage, and analysis of sensor readings
US10084871B2 (en) 2013-05-23 2018-09-25 Allied Telesis Holdings Kabushiki Kaisha Graphical user interface and video frames for a sensor based detection system
US9779183B2 (en) 2014-05-20 2017-10-03 Allied Telesis Holdings Kabushiki Kaisha Sensor management and sensor analytics system
US9693386B2 (en) 2014-05-20 2017-06-27 Allied Telesis Holdings Kabushiki Kaisha Time chart for sensor based detection system
WO2015179560A1 (en) * 2014-05-20 2015-11-26 Allied Telesis Holdings Kabushiki Kaisha Sensor grouping for a sensor based detection system
US10419365B2 (en) * 2015-04-20 2019-09-17 Hillstone Networks Corp. Service insertion in basic virtual network environment
CN105760341A (zh) * 2016-01-29 2016-07-13 浪潮(北京)电子信息产业有限公司 一种获取系统处理器内存资源拓扑方式的方法及装置
DK3523723T3 (da) * 2016-10-05 2021-09-20 Partec Ag Højtydende computersystem og fremgangsmåde

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101272281A (zh) * 2008-04-22 2008-09-24 北京邮电大学 一种涉及四方的提供网络服务的系统和方法
CN101443750A (zh) * 2006-01-17 2009-05-27 思科技术公司 用于订户知晓应用服务器集群上的负载平衡的技术
US20110153936A1 (en) * 2009-12-21 2011-06-23 International Business Machines Corporation Aggregate Symmetric Multiprocessor System

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010082529A (ko) * 1998-11-19 2001-08-30 추후제출 통합형 컴퓨팅 및 통신 아키텍쳐(ucca)
KR100537582B1 (ko) * 2001-02-24 2005-12-20 인터내셔널 비지네스 머신즈 코포레이션 신규의 초병렬 수퍼컴퓨터
US20030229590A1 (en) * 2001-12-12 2003-12-11 Byrne Shannon Lee Global integrated payment system
US7843906B1 (en) * 2004-02-13 2010-11-30 Habanero Holdings, Inc. Storage gateway initiator for fabric-backplane enterprise servers
US7843907B1 (en) * 2004-02-13 2010-11-30 Habanero Holdings, Inc. Storage gateway target for fabric-backplane enterprise servers
US7940648B1 (en) * 2004-03-02 2011-05-10 Cisco Technology, Inc. Hierarchical protection switching framework
US8713295B2 (en) * 2004-07-12 2014-04-29 Oracle International Corporation Fabric-backplane enterprise servers with pluggable I/O sub-system
US8510280B2 (en) * 2009-06-30 2013-08-13 Teradata Us, Inc. System, method, and computer-readable medium for dynamic detection and management of data skew in parallel join operations
US20110103391A1 (en) * 2009-10-30 2011-05-05 Smooth-Stone, Inc. C/O Barry Evans System and method for high-performance, low-power data center interconnect fabric
US8619627B2 (en) * 2010-02-24 2013-12-31 Cisco Technology, Inc. Automatic determination of groupings of communications interfaces
US9171079B2 (en) * 2011-01-28 2015-10-27 Cisco Technology, Inc. Searching sensor data
US20120197856A1 (en) * 2011-01-28 2012-08-02 Cisco Technology, Inc. Hierarchical Network for Collecting, Aggregating, Indexing, and Searching Sensor Data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101443750A (zh) * 2006-01-17 2009-05-27 思科技术公司 用于订户知晓应用服务器集群上的负载平衡的技术
CN101272281A (zh) * 2008-04-22 2008-09-24 北京邮电大学 一种涉及四方的提供网络服务的系统和方法
US20110153936A1 (en) * 2009-12-21 2011-06-23 International Business Machines Corporation Aggregate Symmetric Multiprocessor System

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105378672A (zh) * 2013-07-18 2016-03-02 联想企业解决方案(新加坡)有限公司 对称多处理器(smp)域的动态形成
CN105378672B (zh) * 2013-07-18 2019-02-15 联想企业解决方案(新加坡)有限公司 对称多处理器(smp)域的动态形成
CN106233277A (zh) * 2014-02-19 2016-12-14 斯诺弗雷克计算公司 资源管理系统及方法
US11269919B2 (en) 2014-02-19 2022-03-08 Snowflake Inc. Resource management systems and methods
US11782950B2 (en) 2014-02-19 2023-10-10 Snowflake Inc. Resource management systems and methods
US11868369B2 (en) 2014-02-19 2024-01-09 Snowflake Inc. Resource management systems and methods
US11928129B1 (en) 2014-02-19 2024-03-12 Snowflake Inc. Cloning catalog objects
US11307943B2 (en) 2017-03-21 2022-04-19 Huawei Technologies Co., Ltd. Disaster recovery deployment method, apparatus, and system
CN110647399A (zh) * 2019-09-22 2020-01-03 南京信易达计算技术有限公司 一种基于人工智能网络的高性能计算系统及方法

Also Published As

Publication number Publication date
WO2012083705A1 (zh) 2012-06-28
US20130124597A1 (en) 2013-05-16

Similar Documents

Publication Publication Date Title
CN102742251A (zh) 一种实现对称多处理系统的节点聚合系统
CN102141975B (zh) 计算机系统
ES2743469T3 (es) Disposición de ordenadores en racimo para el tratamiento de una tarea de cálculo y procedimiento correspondiente
CN109242754B (zh) 一种基于OpenVPX平台的多GPU高性能处理系统
Reed et al. Cost-performance bounds for multimicrocomputer networks
KR20160048886A (ko) 컴퓨터 네트워크에서 직접 상호 연결 스위치 배선과 증가를 관리하는 방법 및 장치
Won et al. Astra-sim2. 0: Modeling hierarchical networks and disaggregated systems for large-model training at scale
DE112014000442T5 (de) Auf Einzelmikroregler beruhendes Management mehrerer Rechenknoten
US20160292115A1 (en) Methods and Apparatus for IO, Processing and Memory Bandwidth Optimization for Analytics Systems
CN110275850A (zh) 天基超算平台的计算方法和装置
CN104601684A (zh) 云服务器系统
Mishra et al. MONet: heterogeneous Memory over Optical Network for large-scale data center resource disaggregation
JPH06325005A (ja) 再構成可能なトーラス・ネットワーク方式
US9830283B2 (en) Multi-mode agent
Syrivelis et al. A software-defined architecture and prototype for disaggregated memory rack scale systems
CN100432972C (zh) 输入/输出集线器、输入/输出系统和使用它们的计算机系统
CN103336756A (zh) 一种数据计算节点的生成装置
US10936403B2 (en) Symmetry management in multiprocessor systems
Grice et al. Breaking the petaflops barrier
CN105224496A (zh) 一种动态可重构系统
US20100257294A1 (en) Configurable provisioning of computer system resources
CN105589830B (zh) 一种刀片式服务器架构
CN104579786A (zh) 一种基于融合和2D Torus网络拓扑架构的服务器设计方法
CN103019743A (zh) 一种模块化的信号处理流图与多处理器硬件平台建模方法
CN107239432A (zh) 一种具有新型拓扑结构的服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20121017