Nothing Special   »   [go: up one dir, main page]

CN108769254A - 基于抢占式调度的资源共享使用方法、系统及设备 - Google Patents

基于抢占式调度的资源共享使用方法、系统及设备 Download PDF

Info

Publication number
CN108769254A
CN108769254A CN201810659298.5A CN201810659298A CN108769254A CN 108769254 A CN108769254 A CN 108769254A CN 201810659298 A CN201810659298 A CN 201810659298A CN 108769254 A CN108769254 A CN 108769254A
Authority
CN
China
Prior art keywords
task
physical node
resource
priority
queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810659298.5A
Other languages
English (en)
Other versions
CN108769254B (zh
Inventor
孙宏健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Transwarp Technology Shanghai Co Ltd
Original Assignee
Star Link Information Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Star Link Information Technology (shanghai) Co Ltd filed Critical Star Link Information Technology (shanghai) Co Ltd
Priority to CN201810659298.5A priority Critical patent/CN108769254B/zh
Publication of CN108769254A publication Critical patent/CN108769254A/zh
Priority to CA3104806A priority patent/CA3104806C/en
Priority to PCT/CN2018/123464 priority patent/WO2020000944A1/zh
Priority to JP2020573022A priority patent/JP7060724B2/ja
Priority to SG11202013049XA priority patent/SG11202013049XA/en
Priority to EP18924598.8A priority patent/EP3799390B1/en
Application granted granted Critical
Publication of CN108769254B publication Critical patent/CN108769254B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • H04L41/5022Ensuring fulfilment of SLA by giving priorities, e.g. assigning classes of service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1012Server selection for load balancing based on compliance of requirements or conditions with available server resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/61Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources taking into account QoS or priority requirements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/504Resource capping
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了基于抢占式调度的资源共享使用方法、系统及设备,其中,该方法包括:API服务器创建任务;当调度器处理当前任务时,基于优先级筛选出最符合预设筛选条件的目标物理节点,将当前任务与目标物理节点绑定信息发送到API服务器;当物理节点处理任务队列中待运行的目标任务时,获取物理节点上正在运行的任务列表;若物理节点检测其剩余资源没有满足目标任务运行所需的资源;将任务列表中的优先级低于目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至物理节点执行任务列表中的任务所得到的剩余资源满足目标任务运行所需的资源,抢占待移除队列中的任务。本发明实施例可以提高资源的利用率。

Description

基于抢占式调度的资源共享使用方法、系统及设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于抢占式调度的资源共享使用方法系统及设备。
背景技术
在资源共享的分布式系统中,各租户共享使用资源;同时租户使用的资源又需要有一定的限制,以保证每个租户都能够有资源使用,不出现租户资源“饿死”。分布式系统中的调度器是通过有效地调度各个租户的作业或任务,从而保证租户的作业或任务得到稳定而又快速地执行,同时分布式系统内的资源得到充分利用。
现有技术中的分布式管理系统,提供了多个调度策略保证租户的任务可以在分布式系统中均衡分配到物理节点,再由物理节点运行分配的任务。但是现有技术中任务的处理方式存在资源没有充分利用的现象。
发明内容
本发明实施例提供一种基于抢占式调度的资源共享使用方法系统及设备,可以提高资源的利用率。
第一方面,本发明实施例提供了一种任务创建方法,包括:
API服务器获取任务的创建请求;
当API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
第二方面,本发明实施例还提供了一种任务调度方法,包括:
调度器从任务调度队列获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
第三方面,本发明实施例还提供了一种任务抢占方法,包括:
当物理节点处理待运行的目标任务时,获取所述物理节点上正在运行的任务列表;
所述物理节点检测其剩余资源是否满足所述目标任务运行所需的资源;
若否,所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用所述目标任务抢占所述待移除队列中的任务;
所述物理节点调用执行环境,运行所述目标任务。
第四方面,本发明实施例还提供了一种基于抢占式调度的资源共享使用方法,包括:
API服务器获取任务的创建请求;
当所述API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务;
调度器获取所述API服务器创建的任务,并形成任务调度队列;
所述调度器从所述任务调度队列获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器;
物理节点监听所述API服务器中任务与物理节点的绑定信息,基于监听到的所述绑定信息获取对应的任务,并形成任务队列;
当所述物理节点处理所述任务队列中待运行的目标任务时,获取所述物理节点上正在运行的任务列表;
所述物理节点检测其剩余资源是否满足所述目标任务运行所需的资源;
若否,所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用目标任务抢占所述待移除队列中的任务;
所述物理节点调用执行环境,运行所述目标任务。
第五方面,本发明实施例还提供了一种API服务器,包括:
请求获取模块,用于获取任务的创建请求;
任务创建模块,用于当检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
第六方面,本发明实施例还提供了一种调度器,包括:
映射表形成模块,用于从任务调度队列中获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
筛选模块,用于根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
绑定模块,用于将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
第七方面,本发明实施例还提供了一种任务抢占装置,包括:
任务列表获取模块,用于当处理待运行的目标任务时,获取所述物理节点上正在运行的任务列表;
检测模块,用于检测物理节点上的剩余资源是否满足所述目标任务运行所需的资源;
抢占模块,用于若否,所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用所述目标任务抢占所述待移除队列中的任务;
任务执行模块,用于调用执行环境,运行所述目标任务。
第八方面,本发明实施例还提供了一种基于抢占式调度的资源共享使用系统,包括本发明实施例提供的API服务器、本发明实施例提供的调度器以及本发明实施例提供的任务抢占装置。
第九方面,本发明实施例提供了一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例提供的任务创建方法,或者实现本发明实施例提供的任务调度方法,或者实现本发明实施例提供的任务抢占方法。
第十方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例提供的任务创建方法,或者实现本发明实施例提供的任务调度方法,或者实现本发明实施例提供的任务抢占方法。
本发明实施例提供的技术方案,通过对租户的资源配额进行优先级的设置,并通过将任务的优先级与所属租户下各优先级的资源进行匹配,从而确定是否创建任务,可以让租户在资源紧张时优先使用资源,防止租户滥用高优先级的资源,导致低优先级的任务持续获取不了资源出现的“饿死”现象;调度器通过任务的优先级以及预设筛选条件对物理节点进行筛选,筛选出最合适的物理节点,将待调度的当前任务调度到最合适的物理节点,当资源紧张时,只进行逻辑上的资源抢占,并没有立即抢占资源,这种延后抢占的调度方法,可以在逻辑上为高优先级的任务腾出资源,在资源没有被充分利用时,继续运行被抢占的任务,可以提高资源的利用率;当物理节点处理待运行的目标任务时,若物理节点的剩余资源不满足目标任务运行的所需的条件,基于将低优先级的任务进行抢占,可以使物理节点优先处理重要任务,可以提高资源的利用率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例提供的一种任务创建方法流程图;
图2是本发明实施例提供的一种任务调度方法流程图;
图3是本发明实施例提供的一种任务调度方法流程图;
图4是本发明实施例提供的一种任务抢占方法流程图;
图5是本发明实施例提供的一种任务抢占方法流程图;
图6是本发明实施例提供的一种基于抢占式调度的资源共享使用方法流程图;
图7是本发明实施例提供的一种API服务器的结构框图;
图8a是本发明实施例提供的一种调度器的结构框图;
图8b是本发明实施例提供的一种调度系统的结构示意图;
图9是本发明实施例提供的一种任务抢占装置的结构框图;
图10是本发明实施例提供的一种基于抢占式调度的资源共享使用系统结构框图;
图11是本发明实施例提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
图1是本发明实施例提供的一种任务创建方法流程图,所述方法可应用于API服务器,由应用编程接口(Application Programming Interface,API)服务器来执行,该API服务器可以是集群管理平台中的一个组件,并采用软件和/硬件的方式来实现,集群管理平台可以是对集群中的大量的资源进行管理的平台,集群管理平台包括但不限于Kubernetes和Mesos,并可集成在多个计算机设备中。如图1所示,本发明实施例提供的任务创建方法包括:
S110:API服务器获取任务的创建请求。
本发明实施例提供的方法可以应用在集群中,在集群中可以包含多个物理节点,各物理节点上的资源可以是各个租户的共享资源,多个物理节点可以由集群管理平台进行管理,将任务分配给物理节点以使物理节点执行相应的任务。集群管理平台可以集成在多个计算机设备中,多个计算机设备可以由用户进行操作,用户可以登录集群管理平台,并递交任务的创建请求,集群管理平台中的API服务器获取用户提交的任务的创建请求,创建任务,由集群管理平台中的调度器进行任务调度,合理分配给对应的物理节点,由物理节点执行该任务。
其中,API服务器(API Server)可以集群管理平台的一个组件,可以完成任务的创建;提供丰富的功能性插件,完善对集群的管理等。
其中,API服务器可以获取用户提交的一个任务的创建请求,例如,可以是获取用户提交的创建一个应用的请求。其中,当用户提交任务的创建请求时,可以对任务的优先级进行设置。
S120:当API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
其中,用户在管理粒度上被分到若干组内,每组成为一个租户,可以根据需要为每个租户预先设置配额,配额可以是一组资源,例如,可以包括处理器Cpu、内存、图形处理器GPU、现场可编程门阵列FPGA、AI芯片、处理器的优先级以及内存的优先级、GPU优先级、FPGA优先级、AI芯片优先级等,可以为每个租户预先设置资源配额。通过合理的设置配额,可以授权给租户使用合适优先级的资源,能够让租户在资源紧张的时候优先使用资源;还可以也限制租户滥用高优先级的资源,导致低优先级的任务持续获取不了资源,出现“饿死”的现象。
当用户通过集群管理平台提交任务的创建请求时,每个任务携带标识信息,API服务器可以识别每个任务所属的租户,并判断该租户的配额里是否包含与该任务的优先级匹配的资源,并且判断匹配资源是否满足任务的创建条件,当两者均符合,则创建任务。其中,创建条件可以是Cpu的数量和/或内存的占有率,还可以是其他条件。例如,当用户提交任务的创建请求时,可以通过集群管理平台设置该任务的优先级为高优先级,该任务所需资源的优先级也为高优先级,如,该任务所需10个高优先级的CPU。若该任务所属的租户的存在高优先级的CPU,且高优先级的CPU的数量大于或等于10,则创建该任务。
在本发明的一个具体实施方式中,可选的,本发明实施例提供的方法可以在Kubernetes环境下。可选的,所述服务器获取任务创建请求包括:API服务器获取pod的创建请求。当API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务,包括:当所述API服务器检测到所述pod所属的namespace的quota里包含与所述pod匹配的优先级,且优先级匹配的quota值满足所述pod的创建条件,根据所述创建请求创建pod。
其中,pod是kubernetes中可以创建和部署的最小,也是最简的单位,一个pod代表着集群中运行的一个进程。pod是Kubernetes中的组件,例如,可以创建一个应用,可以启动一个进程等。pod中封装着应用的容器(有的情况下是好几个容器),存储、独立的网络IP,管理容器如何运行的策略选项。其中,pod代表着部署的一个单位:kubernetes中应用的一个实例,可能由一个或者多个容器组合在一起共享资源。其中,创建一个pod可以是创建一个应用等。
其中,Namespace是对一组资源和对象的抽象集合,比如可以用来将kubernetes系统内部的对象划分为不同的项目组或用户组,namespace常用来隔离不同的租户或者用户。在kubernetes中,quota可以用来进行资源管理和资源限制,quota值的大小可以代表资源的多少,例如,在一个租户下设置的资源是20个高优先级的CPU,namespace中的quota值可以是20,即quota值可以代表资源的数量。
本发明实施例提供的一种任务创建方法,当获取到任务的创建请求时,首先通过检测任务所属租户的配额里是否包含与任务优先级匹配的资源,再检测匹配资源的是否满足任务的创建条件,当两个条件均满足时创建任务,本实施例通过对租户的资源配额进行优先级的设置,并通过将任务的优先级与所属租户下各优先级的资源进行匹配,从而确定是否创建任务,可以让租户在资源紧张时优先使用资源,防止租户滥用高优先级的资源,导致低优先级的任务持续获取不了资源出现的“饿死”现象。
图2是本发明实施例提供的一种任务调度方法流程图,所述方法可应用于调度器,调度器可以是集群管理平台的组件,并采用软件和/硬件的方式来实现,集群管理平台可以是对集群中的大量的硬件资源进行管理的平台,集群管理平台包括但不限于Kubernetes和Mesos,并可集成在多个计算机设备中。本发明实施例提供的方法可以应用在该环境下:在集群中可以包含多个物理节点,各物理节点上的资源可以是各个租户的共享资源,多个物理节点可以由集群管理平台进行管理,将任务分配给物理节点以使物理节点执行相应的任务。集群管理平台可以集成在多个计算机设备中,多个计算机设备可以由用户进行操作,用户可以登录集群管理平台,并递交任务的创建请求,集群管理平台中的API服务器获取用户提交的任务的创建请求,创建任务,由集群管理平台中的调度器进行任务调度,合理分配给对应的物理节点,由物理节点执行该任务。其中,本发明实施例应用在调度器进行任务调度的阶段。
如图2所示,本发明实施例提供的技术方案包括:
S210:调度器从任务调度队列获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级任务,形成节点-任务映射表。
其中,调度器可以是集群管理平台的组件,可以从API服务中监听API服务器中创建的任务,并从API服务器中读取任务,读取的任务形成任务调度队列。其中,调度器按照任务调度队列中任务的顺序,对任务进行调度。
物理节点可以是各个物理机,调度器可以各个物理节点获取资源信息(包括全部资源和可用资源),和在各个物理节点上正在运行的任务队列。其中,各个任务均有优先级。当调度器从任务调度队列获取待调度的当前任务时,获取各个物理节点上大于等于当前任务指定优先级的任务,并形成节点-任务映射表。例如,当前任务的优先级为高优先级,物理节点1上大于或等于高优先级的任务有任务1、任务2和任务3,则获取物理节点1上的任务1、任务2和任务3、并形成节点-任务映射表。其中,物理节点上大于等于当前任务指定优先级的任务包括物理节点上正在运行的,且大于等于当前任务优先级的任务以及物理节点上任务调度队列中待运行的,且大于等于当前任务优先级的任务。S220:所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点。
其中,调度器从节点-任务映射表中根据预设筛选条件进行筛选,筛选出最符合预设筛选条件的目标物理节点。其中,预设筛选条件可以包括可以当前任务所需的资源与物理节点上的剩余资源之间的匹配条件、当前任务所需的端口与物理节点上的端口之间的匹配条件等。在本发明一个具体实施方式中,可选的,所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点,包括:所述调度器从映射表筛选出符合第一阶段筛选条件的物理节点,形成节点组;根据映射表以及第二阶段优选条件,对所述节点组的物理节点进行评分,并筛选出分数最高的物理节点作为目标物理节点。
其中,第一阶段筛选条件和第二阶段优选条件并不相同。例如,第一阶段筛选条件可以是当前任务所需的端口与物理节点上的端口之间的匹配条件、是否有特殊标签等,第二阶段优选条件可以是当前任务所需的资源与物理节点上的剩余资源之间的匹配条件,并且第二阶段优选条件中可以包括一个条件,也可以包含多个条件。当第二阶段优选条件中包含多个条件时,也可以为每个条件设置权重,根据权重确定物理节点的评分。
对该实施方式进行举例说明,若第一阶段筛选条件为需要有GPU的标签,第二预设当前任务所需的资源与物理节点上的剩余资源之间的匹配条件,则对照节点-任务映射表,以及获取的物理节点的信息,选取具有GPU的物理节点,形成节点组。判断节点组中当物理节点上的剩余资源是否当前任务所需的资源条件,将不满足条件的物理节点去除,并将满足当前任务所需的资源条件的物理节点进行打分,剩余资源越多,可以打分越多,则剩余资源分数最高的物理节点可以是目标物理节点。其中,筛选目标物理节点的方法包括但并不限于上述的方法。
通过上述两次筛选,筛选出分数最高的物理节点作为目标物理节点,即筛选出分数最高的物理节点作为最合适的物理节点,相对于一次筛选的情况,可以减少筛选时数据的处理量,提高任务调度的效率。
S230:所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
在本步骤中,调度器通过将当前任务与筛选出的最符合预设筛选条件的物理节点进行绑定,将绑定的信息发送到API服务器,以使各物理节点可以从API服务器读取各自执行的任务。
本发明实施例调度器基于任务的优先级以及预设筛选条件对物理节点进行筛选,筛选出最合适的物理节点,将待调度的当前任务调度到最合适的物理节点,当资源紧张时,只进行逻辑上的资源抢占,并没有立即抢占资源,这种延后抢占的调度方法,可以在逻辑上为高优先级的任务让出资源,在资源没有被充分利用时,继续保留被抢占的任务,可以提高资源的利用率。
图3是本发明实施例提供的一种任务调度方法流程图,其中,该实施例提供的方法可以应用于kubernetes系统中,如图3所示,本实施例提供的技术方案包括:
S310:调度器从pod调度队列中获取待调度的当前pod,并获取各个物理节点上大于等于所述当前pod指定优先级的pod,形成节点-pod映射表。
S320:所述调度器从映射表筛选出符合第一阶段筛选条件的物理节点,形成节点组。
S330:根据映射表以及第二阶段优选条件,对所述节点组的物理节点进行评分,并筛选出分数最高的物理节点作为目标物理节点。
S340:所述调度器将所述当前pod与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
由此,调度器基于任务的优先级以及预设筛选条件对物理节点进行筛选,筛选出最合适的物理节点,将待调度的当前任务调度到最合适的物理节点,当资源紧张时,只进行逻辑上的资源抢占,并没有立即抢占资源,这种延后抢占的调度方法,可以在逻辑上为高优先级的任务让出资源,在资源没有被充分利用时,继续保留被抢占的任务,可以提高资源的利用率。
图4是本发明实施例提供的一种任务抢占方法流程图,所述方法可由任务抢占装置来执行,所述装置由软件和/或硬件来实现,所述装置可集成在计算机设备中。本发明实施例提供的任务抢占方法适用于物理节点处理任务的场景下。如图4所示,本发明实施例提供的技术方案包括:
S410:当物理节点处理待运行的目标任务时,获取所述物理节点上正在运行的任务列表。
其中,物理节点可以是计算机设备,例如,物理机等。物理节点可以通过监听API服务器中任务与物理节点的绑定信息,获取对应的任务,由获取的任务形成任务队列。物理节点根据任务队列中的各个任务的顺序依次进行处理,当物理节点处理待运行的目标任务时,获取物理节点上正在运行的任务列表。其中,任务列表记载了物理节点上正在运行的任务的信息。物理节点上正在运行的任务可以有一个,也可以有多个。
S420:所述物理节点检测其剩余资源是否满足所述目标任务运行所需的资源。
若否,执行S430,若是,执行S440。
在本步骤中,目标任务运行所需的资源可以包括CPU、内存等。物理节点的剩余资源可以理解为物理节点上的可用资源。例如,若物理节点剩余CPU的数量为10个,内存为1G。目标任务运行所需的CPU为10,内存为2G,则物理节点上的剩余资源并不能满足目标任务运行所需的资源。
S430:所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用所述目标任务抢占所述待移除队列中的任务。
在本步骤中,若物理节点检测其剩余资源可以满足目标任务运行所需的资源,直接调用执行环境,运行目标任务。若物理节点检测其剩余资源并不能满足目标任务运行所需的资源,将任务列表中的任务按照优先级由低到高的顺序移入待移除队列,并将优先级低于目标任务的任务按照优先级从低到高的顺序移除到待移除队列,直至物理节点执行任务列表中的任务所得到的剩余资源满足目标任务运行所需的资源,采用目标任务抢占待移除队列中的任务,即停止运行待移除队列中的任务。
在将任务列表中的任务移入待移除的队列过程中,若物理节点上的剩余资源不满足目标任务的运行条件,则拒绝执行目标任务。
需要说明的是,当将任务列表中优先级低于目标任务的任务移入待移除队列的过程中,并不停止待移除队列中的任务,当判断物理节点执行任务列表中的任务所得到的剩余资源满足目标任务运行所需的资源时,才停止待移除队列中的任务。
对本步骤进行举例说明,若任务列表中共有5个任务(物理节点上正在运行的任务有5个),分别是A,B,C,D和E,优先级分别为1,2,3,4和5,其中,任务列表中的任务按照优先级由低到高的顺序分别是A,B,C,D和E。待处理的目标任务的优先级为4。若物理节点上的剩余资源并不能满足目标任务运行所需的资源条件,则将物理节点上正在运行的任务列表中的优先级低于目标任务的任务(分别是A,B和C),按照优先级从低到高的顺序移入待移除队列,即先将A移入待移除队列,判断物理节点运行任务列表中的B,C,D和E所得到的剩余资源是否满足目标任务运行所需的资源条件,。若两者均满足,采用目标任务将正在运行的A抢占,即将A停止。
若将A移入待移除队列后,物理节点上运行任务列表中的B,C,D和E所得到的剩余资源不满足目标任务运行所需的资源条件,则将B移入到待移除队列中,重复上述的判断步骤,若直至任务列表中的任务的优先级不低于目标任务的优先级时(即任务列表中有D和E时),物理节点上运行任务列表中的人D和E所得到的剩余资源不满足目标任务运行所需的资源条件,则拒绝运行目标任务。
S440:所述物理节点调用执行环境,运行所述目标任务。
本发明实施例当物理节点处理待运行的目标任务时,若物理节点的剩余资源不满足目标任务运行的所需的条件,将低优先级的任务进行抢占,可以使物理节点优先处理重要任务,可以提高资源的利用率。
在上述实施例的基础上,所述的任务抢占方法还包括:所述物理节点每间隔设定时间获取资源使用信息;所述物理节点若确定所述资源使用信息达到预设限制条件,将所述任务列表中的任务按照优先级由低到高的顺序移入到所述待移除队列,直至所述物理节点执行所述任务列表中的任务时所确定的资源使用信息没有达到预设限制条件,并停止所述待移除队列中的任务。
具体的,任务列表中的任务为当前物理节点上正在运行的任务。其中,每个物理节点间隔设定时间获取资源使用信息,判断资源的使用信息是否达到预设限制条件,来判断是否需要触发任务抢占。若资源的使用信息达到预设限制条件,则触发任务抢占,否则,不需要触发任务抢占。其中具体任务抢占的过程是:将任务列表中的任务按照优先级进行排序,并将任务列表中任务按照优先级由低到高的顺序移入到待移除队列,直至所述物理节点执行任务列表中的任务时所确定的资源使用信息没有达到预设限制条件,并停止待移除队列中的任务
其中,预设限制条件可以是资源使用达到设置值,也可以是其他限制条件。例如,若物理节点的资源使用达到设定值,则触发任务抢占。
由此,物理节点通过根据资源使用信息触发任务抢占,可以提高资源利用率以及当资源紧张时,可以从低优先级任务中抢占资源,优先处理重要任务。
图5是本发明实施例提供的一种任务抢占方法流程图,本发明实施例提供的方法运行在Kubernetes系统中。如图5所示,本发明实施例提供的方法包括:
S510:当物理节点通过kubelet处理待运行的目标pod时,获取所述物理节点上正在运行的pod列表。
其中,kubelet是Kubernetes系统的组件,可以监视pod,挂载pod所需要的volumes,下载pod的secret,通过docker/rkt来运行pod中的容器,周期的执行pod中为容器定义的liveness探针,上报pod的状态给系统的其他组件,以及节点的状态。
S520:所述物理节点通过kubelet检测其剩余资源是否满足所述目标pod运行所需的资源。
若是,执行S530,若否,执行S540。
S530:所述物理节点通过kubelet将所述pod列表中的优先级低于所述目标pod的pod,按照优先级由低到高的顺序移入待移除队列,直至所述物理节点执行所述pod列表中的pod所得到的剩余资源满足所述目标pod运行所需的资源,并采用所述目标pod抢占所述待移除队列中的pod。
S540:所述物理节点通过kubelet调用执行环境,运行所述目标pod。
由此,当物理节点处理待运行的目标pod时,若物理节点的剩余资源不满足目标pod运行的所需的条件,将低优先级的pod进行抢占,可以使物理节点优先处理重要任务,可以提高资源的利用率。
图6是本发明实施例提供的一种基于抢占式调度的资源共享使用方法流程图,所述方法由基于抢占式调度的资源共享使用系统来执行,所述系统可通过软件和/或硬件来实现。本发明实施例提供的方法可以应用在集群中,在集群中可以包含多个物理节点,各物理节点上的资源可以是各个租户的共享资源,多个物理节点可以由集群管理平台进行管理,将任务分配给物理节点以使物理节点执行相应的任务。集群管理平台可以集成在多个计算机设备中,多个计算机设备可以由用户进行操作,用户可以登录集群管理平台,并递交任务的创建请求,集群管理平台中的API服务器获取用户提交的任务的创建请求,创建任务,由集群管理平台中的调度器进行任务调度,合理分配给对应的物理节点,由物理节点执行该任务。
如图6所示,本发明实施例提供的技术方案具体包括:
S610:API服务器获取任务的创建请求。
S620:当所述API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
S630:调度器获取所述API服务器创建的任务,并形成任务调度队列。
S640:所述调度器从所述任务调度队列获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表。
S650:所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点。
S660:所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
S670:物理节点通过监听所述API服务器中任务与物理节点的绑定信息,获取对应的任务,并形成任务队列。
S680:当所述物理节点处理所述任务队列中待运行的目标任务时,获取所述物理节点上正在运行的任务列表。
S690:所述物理节点检测其剩余资源是否满足所述目标任务运行所需的资源。
若是,执行S691,若否,执行S692。
S691:所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级由低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用目标任务抢占所述待移除队列中的任务。
S692:所述物理节点调用执行环境,运行所述目标任务。
在现有技术中,Kubernetes 1.3版本基于服务质量(Quality Of Service)的资源共享方案,用来进行管理共享资源,服务质量从高到低分别是Guarantee,Burstable以及Best Effort。其中,Best Effort的任务可以集群资源没有充分使用的时,进行调度并运行。当集群资源紧张时,Best Effort的任务优先被抢占。现有技术中这种方案,并没有考虑任务调度的环节,当集群调度满时,不能为高服务质量的任务腾出资源,并且无法限制租户内Best Effort任务的数目,以及无法进一步地区分Best Effort任务被抢占的顺序。
现有技术中的Kubernetes 1.8版本引入的基于优先级的调度方案,任务可以设置优先级,当资源紧张的时,调度器会将低优先级的任务抢占,为高优先级的任务。但该种方案,任务的抢占发生在调度器,即在集群逻辑调度满的时候发生,集群中会有资源没有充分利用的情况,资源的利用率并不高,并且无法精确限制各种优先级任务的数目。
相对于现有技术,本发明实施例提供的方法,对租户的资源配额进行优先级的设置,可以精确限制各租户下各种优先级任务的数目,通过对任务优先级的设置,当任务被抢占时,可以进一步区分任务被抢占的顺序。本发明实施例中基于优先级的任务抢占发生在物理节点,并没有发生在调度器,可以在逻辑上为高优先级的任务腾出资源,在资源没有充分利用时,继续运行被抢占的任务,可以提高资源的利用率。
本发明实施例提供的方法,通过对租户的资源配额进行优先级的设置,并通过将任务的优先级与所属租户下各优先级的资源进行匹配,从而确定是否创建任务,可以让租户在资源紧张时优先使用资源,防止租户滥用高优先级的资源,导致低优先级的任务持续获取不了资源,出现“饿死”现象;调度器基于任务的优先级以及预设筛选条件对物理节点进行筛选,筛选出最合适的物理节点,将待调度的当前任务调度到最合适的物理节点,当资源紧张时,只进行逻辑上的资源抢占,并没有立即抢占资源,这种延后抢占的调度方法,可以在逻辑上为高优先级的任务让出资源,在资源没有被充分利用时,继续运行被抢占的任务,可以提高资源的利用率;当物理节点处理待运行的目标任务时,若物理节点的剩余资源不满足目标任务运行的所需的条件,基于将低优先级的任务进行抢占,可以使物理节点优先处理重要任务,可以提高资源的利用率。
图7是本发明实施例提供的一种API服务器结构框图,如图7所示,所述API服务器包括:请求获取模块710和任务创建模块720。
请求获取模块710,用于获取任务的创建请求;
任务创建模块720,用于当检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
进一步的,所述装置应用于Kubernetes系统中,请求获取模块710,用于获取pod的创建请求。
任务创建模块720,用于当检测到所述pod所属的namespace的quota里包含与所述pod匹配的优先级,且优先级匹配的quota值满足所述pod的创建条件,根据所述创建请求创建pod。
上述任务创建装置可执行本发明任意实施例所提供的任务创建方法,具备执行任务创建方法相应的功能模块和有益效果。
图8a是本发明实施例提供的一种调度器的结构框图,如图8a所示,所述调度器包括:映射表形成模块810、筛选模块820和绑定模块830。
映射表形成模块810,用于从任务调度队列获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
筛选模块820,用于根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
绑定模块830,用于将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
进一步的,筛选模块820,用于所述调度器从所述映射表筛选出符合第一阶段筛选条件的物理节点,形成节点组;
根据所述映射表以及第二阶段优选条件,对所述节点组的物理节点进行评分,并筛选出分数最高的物理节点作为目标物理节点。
进一步的,所述装置应用于Kubernetes系统中,映射表形成模块810,用于从pod调度队列中获取待调度的当前pod,并获取各个物理节点上大于等于所述当前pod指定优先级的pod,形成节点-pod映射表;
相应的,绑定模块830,用于将所述当前pod与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
其中,调度器结构还可以是其他的结构形式,以可以执行任务调度方法即可。例如,调度器中可包括调度系统,如图8b所示,调度系统可以包括四个部分,分别是节点信息列表840,筛选算法库850、优选算法库860和未调度队列870。
其中,节点信息列表840,记载当前可用的物理节点信息,包括物理节点上的资源信息(全部资源和可用资源),以及已经在物理节点上运行的任务队列。这部分信息是调度方法指定时关键的信息,需要实时同步,以保证调度系统对资源以及任务有全面的认知。
筛选算法库850,预先定义了各种筛选物理节点的算法,保证去除不满足任务执行条件的物理节点。
优选算法库860,预先定义了各种优选节点的算法以及算法的权重,优选算法计算出打分最高的物理节点会被选为调度节点,即目标物理节点。
调度队列870,未调度的任务形成的队列,是一个优先级队列以保证高优先级的任务先调度。
上述装置可执行本发明任意实施例所提供的任务调度方法,具备执行任务调度方法相应的功能模块和有益效果。
图9是本发明实施例提供的一种任务抢占装置的结构框图,如图9所示,所述任务抢占装置包括:任务列表获取模块910、检测模块920、抢占模块930和任务执行模块940。
其中,任务列表获取模块910,用于当处理待运行的目标任务时,获取所述物理节点上正在运行的任务列表;
检测模块920,用于检测物理节点上的剩余资源是否满足所述目标任务运行所需的资源;
抢占模块930,用于若否,所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级由低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用所述目标任务抢占所述待移除队列中的任务;
任务执行模块940,用于所述物理节点调用执行环境,运行所述目标任务。
进一步的,所述抢占模块,还用于每间隔设定时间获取资源使用信息;
若确定所述资源使用信息达到预设限制条件,将所述任务列表中的任务按照优先级由低到高的顺序移入到所述待移除队列,直至所述物理节点执行所述任务列表中的任务时所确定的资源使用信息没有达到预设限制条件,并停止所述待移除队列中的任务。
进一步的,所述装置应用于Kubernetes系统中,所述目标任务为目标pod,所述任务列表为pod列表,所述任务列表中的任务为所述物理节点上正在运行的pod。
上述装置可执行本发明任意实施例所提供的任务抢占方法,具备执行任务抢占方法相应的功能模块和有益效果。
图10是本发明实施例提供的一种任务抢占系统的结构示意图,如图10所示,所述任务抢占系统包括上述实施例提供的API服务器1010、上述实施例提供的调度器1020以及上述实施例提供的任务抢占装置1030。
具体的,API服务器1010和调度器1020分别是集群管理平台的组件,集群管理平台集成在用户所用的计算机设备上。任务抢占装置1030可集成在物理节点中的物理机上。
图11是本发明实施例提供的一种设备结构示意图,如图11所示,该设备包括:
一个或多个处理器1110,图11中以一个处理器1110为例;
存储器1120;
所述设备还可以包括:输入装置1130和输出装置1140。
所述设备中的处理器1110、存储器1120、输入装置1130和输出装置1140可以通过总线或者其他方式连接,图11中以通过总线连接为例。
存储器1120作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种任务创建方法对应的程序指令/模块(例如,附图7所示的请求获取模块710和任务创建模块720)或者如本发明实施例中的一种任务调度方法对应的程序指令/模块(例如,附图8所示的映射表形成模块810、筛选模块820和绑定模块830),或者如本发明实施例中的一种任务抢占方法对应的程序指令/模块(例如,附图9所示的任务列表获取模块910、检测模块920、抢占模块930和任务执行模块940)。处理器1110通过运行存储在存储器1120中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述方法实施例的一种任务创建方法,即:
API服务器获取任务的创建请求;
当API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
或者实现上述方法实施例的一种任务调度方法,即:
调度器从任务调度队列中获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
或者实现上述方法实施例的一种任务抢占方法,即:
当物理节点处理待运行的目标任务时,获取所述物理节点上正在运行的任务列表;
所述物理节点检测其剩余资源是否满足所述目标任务运行所需的资源;
若否,所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用所述目标任务抢占所述待移除队列中的任务;
所述物理节点调用执行环境,运行所述目标任务。
存储器1120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器1120可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器1120可选包括相对于处理器1110远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置1130可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置1140可包括显示屏等显示设备。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例提供的一种任务创建方法:
获取任务的创建请求;
当检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
或者实现上述方法实施例的一种任务调度方法,即:
调度器从任务调度队列中获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
或者实现上述方法实施例的一种任务抢占方法,即:
当物理节点处理待运行的目标任务时,获取所述物理节点上正在运行的任务列表;
所述物理节点检测其剩余资源是否满足所述目标任务运行所需的资源;
若否,所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用所述目标任务抢占所述待移除队列中的任务;
所述物理节点调用执行环境,运行所述目标任务。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (15)

1.一种任务创建方法,其特征在于,包括:
API服务器获取任务的创建请求;
当API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
2.根据权利要求1所述的方法,其特征在于,
所述服务器获取任务的创建请求包括:
API服务器获取pod的创建请求;
相应的,当API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务,包括:
当所述API服务器检测到所述pod所属的namespace的quota里包含与所述pod匹配的优先级,且优先级匹配的quota值满足所述pod的创建条件,根据所述创建请求创建pod。
3.一种任务调度方法,其特征在于,包括:
调度器从任务调度队列中获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
4.根据权利要求3所述的方法,其特征在于,所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点,包括:
所述调度器从所述映射表筛选出符合第一阶段筛选条件的物理节点,形成节点组;
根据所述映射表以及第二阶段优选条件,对所述节点组的物理节点进行评分,并筛选出分数最高的物理节点作为目标物理节点。
5.根据权利要求3或4所述的方法,其特征在于,所述调度器从任务调度队列中获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表,包括:
所述调度器从pod调度队列中获取待调度的当前pod,并获取各个物理节点上大于等于所述当前pod指定优先级的pod,形成节点-pod映射表;
相应的,所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器,包括:
所述调度器将所述当前pod与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
6.一种任务抢占方法,其特征在于,包括:
当物理节点处理待运行的目标任务时,获取所述物理节点上正在运行的任务列表;
所述物理节点检测其剩余资源是否满足所述目标任务运行所需的资源;
若否,所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用所述目标任务抢占所述待移除队列中的任务;
所述物理节点调用执行环境,运行所述目标任务。
7.根据权利要求6所述的方法,其特征在于,还包括:
所述物理节点每间隔设定时间获取资源使用信息;
所述物理节点若确定所述资源使用信息达到预设限制条件,将所述任务列表中的任务按照优先级由低到高的顺序移入到所述待移除队列,直至所述物理节点执行所述任务列表中的任务时所确定的资源使用信息没有达到预设限制条件,并停止所述待移除队列中的任务。
8.根据权利要求6或者7所述的方法,其特征在于,所述目标任务为目标pod,所述任务列表为pod列表,所述任务列表中的任务为所述物理节点上正在运行的pod。
9.一种基于抢占式调度的资源共享使用方法,其特征在于,包括:
API服务器获取任务的创建请求;
当所述API服务器检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务;
调度器获取所述API服务器创建的任务,并形成任务调度队列;
所述调度器从所述任务调度队列获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
所述调度器根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
所述调度器将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器;
物理节点监听所述API服务器中任务与物理节点的绑定信息,基于监听到的所述绑定信息获取对应的任务,并形成任务队列;
当所述物理节点处理所述任务队列中待运行的目标任务时,获取所述物理节点上正在运行的任务列表;
所述物理节点检测其剩余资源是否满足所述目标任务运行所需的资源;
若否,所述物理节点将所述任务列表中的优先级低于所述目标任务的任务,按照优先级从低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,并采用目标任务抢占所述待移除队列中的任务;
所述物理节点调用执行环境,运行所述目标任务。
10.一种API服务器,其特征在于,包括:
请求获取模块,用于获取任务的创建请求;
任务创建模块,用于当检测到所述任务所属租户的配额里包含与所述任务的优先级匹配的资源,且匹配资源满足所述任务的创建条件,根据所述创建请求创建所述任务。
11.一种调度器,其特征在于,包括:
映射表形成模块,用于从任务调度队列中获取待调度的当前任务,并获取各个物理节点上大于等于所述当前任务指定优先级的任务,形成节点-任务映射表;
筛选模块,用于根据所述映射表以及预设筛选条件确定最符合所述预设筛选条件的目标物理节点;
绑定模块,用于将所述当前任务与所述目标物理节点绑定,并将绑定的信息发送到API服务器。
12.一种任务抢占装置,其特征在于,包括:
任务列表获取模块,用于当处理待运行的目标任务时,获取物理节点上正在运行的任务列表;
检测模块,用于检测物理节点上的剩余资源是否满足所述目标任务运行所需的资源;
抢占模块,用于若否,所述物理节点将所述任务列表中的任务按照优先级由低到高的顺序移入待移除队列,直至所述物理节点执行所述任务列表中的任务所得到的剩余资源满足所述目标任务运行所需的资源,且所述待移除队列中任务的优先级小于所述目标任务的优先级,并采用所述目标任务抢占所述待移除队列中的任务;
任务执行模块,用于调用执行环境,运行所述目标任务。
13.一种基于抢占式调度的资源共享使用系统,其特征在于,包括如权利要求10所述的API服务器、权利要求11所述的调度器以及权利要求12所述的任务抢占装置。
14.一种设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1或2所述的任务创建方法,或者实现如权利要求3-5中任一所述的任务调度方法,或者实现如权利要求6-8中任一所述的任务抢占方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1或2所述的任务创建方法,或者实现如权利要求3-5中任一所述的任务调度方法,或者实现如权利要求6-8中任一所述的任务抢占方法。
CN201810659298.5A 2018-06-25 2018-06-25 基于抢占式调度的资源共享使用方法、系统及设备 Active CN108769254B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201810659298.5A CN108769254B (zh) 2018-06-25 2018-06-25 基于抢占式调度的资源共享使用方法、系统及设备
CA3104806A CA3104806C (en) 2018-06-25 2018-12-25 Method for scheduling a task, resource sharing use method and system based on preemptive scheduling, scheduler, device, and storage medium
PCT/CN2018/123464 WO2020000944A1 (zh) 2018-06-25 2018-12-25 基于抢占式调度的资源共享使用方法、系统及设备
JP2020573022A JP7060724B2 (ja) 2018-06-25 2018-12-25 タスクスケジューリング方法、リソース共有使用方法、スケジューラ、コンピュータ可読記憶媒体および装置
SG11202013049XA SG11202013049XA (en) 2018-06-25 2018-12-25 Method for scheduling a task, resource sharing use method and system based on preemptive scheduling, scheduler, device, and storage medium
EP18924598.8A EP3799390B1 (en) 2018-06-25 2018-12-25 Preemptive scheduling based resource sharing use method, system and

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810659298.5A CN108769254B (zh) 2018-06-25 2018-06-25 基于抢占式调度的资源共享使用方法、系统及设备

Publications (2)

Publication Number Publication Date
CN108769254A true CN108769254A (zh) 2018-11-06
CN108769254B CN108769254B (zh) 2019-09-20

Family

ID=63977138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810659298.5A Active CN108769254B (zh) 2018-06-25 2018-06-25 基于抢占式调度的资源共享使用方法、系统及设备

Country Status (6)

Country Link
EP (1) EP3799390B1 (zh)
JP (1) JP7060724B2 (zh)
CN (1) CN108769254B (zh)
CA (1) CA3104806C (zh)
SG (1) SG11202013049XA (zh)
WO (1) WO2020000944A1 (zh)

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109656716A (zh) * 2018-12-13 2019-04-19 郑州云海信息技术有限公司 一种Slurm作业调度方法及系统
CN109933420A (zh) * 2019-04-02 2019-06-25 深圳市网心科技有限公司 节点任务调度方法、电子设备及系统
CN109960585A (zh) * 2019-02-02 2019-07-02 浙江工业大学 一种基于kubernetes的资源调度方法
CN110362407A (zh) * 2019-07-19 2019-10-22 中国工商银行股份有限公司 计算资源调度方法及装置
CN110457135A (zh) * 2019-08-09 2019-11-15 重庆紫光华山智安科技有限公司 一种资源调度方法、装置及共享gpu显存的方法
CN110515704A (zh) * 2019-08-30 2019-11-29 广东浪潮大数据研究有限公司 基于Kubernetes系统的资源调度方法及装置
CN110515730A (zh) * 2019-08-22 2019-11-29 北京宝兰德软件股份有限公司 基于kubernetes容器编排系统的资源二次调度方法及装置
CN110532082A (zh) * 2019-09-04 2019-12-03 厦门商集网络科技有限责任公司 一种基于任务预分配的任务申请装置和方法
WO2020000944A1 (zh) * 2018-06-25 2020-01-02 星环信息科技(上海)有限公司 基于抢占式调度的资源共享使用方法、系统及设备
CN110716809A (zh) * 2019-10-21 2020-01-21 北京百度网讯科技有限公司 用于调度云资源的方法和装置
CN110727512A (zh) * 2019-09-30 2020-01-24 星环信息科技(上海)有限公司 集群资源调度方法、装置、设备及储存介质
CN110737572A (zh) * 2019-08-31 2020-01-31 苏州浪潮智能科技有限公司 大数据平台资源抢占测试方法、系统、终端及存储介质
CN110851236A (zh) * 2019-11-11 2020-02-28 星环信息科技(上海)有限公司 一种实时资源调度方法、装置、计算机设备及存储介质
CN110990154A (zh) * 2019-11-28 2020-04-10 曙光信息产业股份有限公司 一种大数据应用优化方法、装置及存储介质
CN111381956A (zh) * 2018-12-28 2020-07-07 杭州海康威视数字技术股份有限公司 一种任务处理的方法、装置及云分析系统
CN111399989A (zh) * 2020-04-10 2020-07-10 中国人民解放军国防科技大学 一种面向容器云的任务抢占调度方法及系统
CN111459666A (zh) * 2020-03-26 2020-07-28 北京金山云网络技术有限公司 任务派发方法、装置、任务执行系统和服务器
CN111464659A (zh) * 2020-04-27 2020-07-28 广州虎牙科技有限公司 节点的调度、节点的预选处理方法、装置、设备及介质
CN111506404A (zh) * 2020-04-07 2020-08-07 上海德拓信息技术股份有限公司 一种基于Kubernetes的共享GPU调度方法
CN111641678A (zh) * 2020-04-29 2020-09-08 深圳壹账通智能科技有限公司 任务调度方法、装置、电子设备及介质
CN111694646A (zh) * 2020-05-29 2020-09-22 北京百度网讯科技有限公司 资源调度方法、装置、电子设备及计算机可读存储介质
CN111736965A (zh) * 2019-12-11 2020-10-02 西安宇视信息科技有限公司 任务调度方法、装置、调度服务器和机器可读存储介质
CN111800446A (zh) * 2019-04-12 2020-10-20 北京沃东天骏信息技术有限公司 调度处理方法、装置、设备和存储介质
CN112015549A (zh) * 2020-08-07 2020-12-01 苏州浪潮智能科技有限公司 一种基于服务器集群的调度节点的选择抢占方法及系统
CN112114958A (zh) * 2019-06-21 2020-12-22 上海哔哩哔哩科技有限公司 资源隔离方法、分布式平台、计算机设备和存储介质
CN112162865A (zh) * 2020-11-03 2021-01-01 中国工商银行股份有限公司 服务器的调度方法、装置和服务器
CN112181517A (zh) * 2020-09-24 2021-01-05 北京达佳互联信息技术有限公司 一种应用软件的启动方法、装置、设备和介质
CN112214288A (zh) * 2019-07-10 2021-01-12 中国移动通信集团上海有限公司 基于Kubernetes集群的Pod调度方法、装置、设备和介质
CN112230936A (zh) * 2020-09-15 2021-01-15 北京金山云网络技术有限公司 容器组的部署方法、装置及服务器
CN112486642A (zh) * 2020-11-25 2021-03-12 广州虎牙科技有限公司 资源调度方法、装置、电子设备及计算机可读存储介质
CN112528450A (zh) * 2021-01-15 2021-03-19 博智安全科技股份有限公司 网络拓扑结构构建方法、终端设备和计算机可读存储介质
CN112685158A (zh) * 2020-12-29 2021-04-20 杭州海康威视数字技术股份有限公司 一种任务调度方法、装置、电子设备及存储介质
CN112799787A (zh) * 2021-02-07 2021-05-14 北京华如科技股份有限公司 一种在仿真运行中改进的并行行为执行冲突消解方法及其存储介质
CN113051064A (zh) * 2019-12-26 2021-06-29 中移(上海)信息通信科技有限公司 任务调度方法、装置、设备及存储介质
JP2021099879A (ja) * 2020-09-30 2021-07-01 北京百度網訊科技有限公司 開発マシン操作タスクの処理方法、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
CN113127178A (zh) * 2019-12-30 2021-07-16 医渡云(北京)技术有限公司 资源抢占方法及装置、计算机可读存储介质、电子设备
CN113783797A (zh) * 2021-09-13 2021-12-10 京东科技信息技术有限公司 云原生容器的网络流量控制方法、装置、设备及存储介质
CN114138500A (zh) * 2022-01-29 2022-03-04 阿里云计算有限公司 资源调度系统及方法
CN114153581A (zh) * 2021-11-29 2022-03-08 北京金山云网络技术有限公司 数据处理方法、装置、计算机设备和存储介质
CN114461384A (zh) * 2021-12-28 2022-05-10 浙江大华技术股份有限公司 任务执行方法、装置、计算机设备和存储介质
CN114610465A (zh) * 2022-03-21 2022-06-10 阿里巴巴(中国)有限公司 任务处理方法、装置及存储介质
WO2022179486A1 (zh) * 2021-02-23 2022-09-01 阿里巴巴集团控股有限公司 多核处理器任务调度方法、装置及设备、存储介质
CN115658332A (zh) * 2022-12-28 2023-01-31 摩尔线程智能科技(北京)有限责任公司 一种gpu共享方法及装置、电子设备和存储介质
WO2023071172A1 (zh) * 2021-10-26 2023-05-04 上海商汤智能科技有限公司 任务调度方法、装置、设备、存储介质、计算机程序及计算机程序产品
CN111831390B (zh) * 2020-01-08 2024-04-16 北京嘀嘀无限科技发展有限公司 服务器的资源管理方法、装置及服务器
US12014202B2 (en) 2020-02-13 2024-06-18 Samsung Electronics Co., Ltd. Method and apparatus with accelerator

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113076188B (zh) * 2020-01-03 2024-05-14 阿里巴巴集团控股有限公司 一种分布式系统的调度方法及装置
CN111488206A (zh) * 2020-03-08 2020-08-04 苏州浪潮智能科技有限公司 一种深度学习任务调度方法、系统、终端及存储介质
CN113742036B (zh) * 2020-05-28 2024-01-30 阿里巴巴集团控股有限公司 指标处理方法、装置及电子设备
CN113760480A (zh) * 2020-06-16 2021-12-07 北京沃东天骏信息技术有限公司 任务调度的方法、装置和系统
CN111796933B (zh) * 2020-06-28 2023-11-21 北京小米松果电子有限公司 资源调度方法、装置、存储介质和电子设备
CN113918270B (zh) * 2020-07-08 2024-07-23 电科云(北京)科技有限公司 基于Kubernetes的云资源调度方法及系统
CN111831450B (zh) * 2020-07-20 2023-07-28 北京百度网讯科技有限公司 用于分配服务器资源的方法、装置、电子设备及存储介质
CN113301087B (zh) * 2020-07-21 2024-04-02 阿里巴巴集团控股有限公司 资源调度方法、装置、计算设备和介质
CN114513547B (zh) * 2020-10-29 2024-02-13 浙江宇视科技有限公司 模块的节点调度方法、装置、电子设备及存储介质
CN112445591A (zh) * 2020-11-03 2021-03-05 北京电子工程总体研究所 一种面向复杂任务集的任务调度系统及方法
CN112328403B (zh) * 2020-11-25 2024-06-25 北京中天孔明科技股份有限公司 一种SparkContext的配置方法、装置及服务端
CN112486648A (zh) * 2020-11-30 2021-03-12 北京百度网讯科技有限公司 任务调度方法、装置、系统、电子设备和存储介质
CN112749221A (zh) * 2021-01-15 2021-05-04 长鑫存储技术有限公司 数据任务调度方法、装置、存储介质及调度工具
CN112749000B (zh) * 2021-01-31 2024-06-11 云知声智能科技股份有限公司 基于k8s自动拓展强化学习任务调度方法、装置及系统
CN112783659B (zh) * 2021-02-01 2023-08-04 北京百度网讯科技有限公司 一种资源分配方法、装置、计算机设备及存储介质
US11861397B2 (en) 2021-02-15 2024-01-02 Kyndryl, Inc. Container scheduler with multiple queues for special workloads
CN115080197A (zh) * 2021-03-12 2022-09-20 天翼云科技有限公司 计算任务调度方法、装置、电子设备和存储介质
CN113110927B (zh) * 2021-04-19 2024-08-09 上海商汤科技开发有限公司 一种任务调度方法、装置、计算机设备和存储介质
CN113434270B (zh) * 2021-06-15 2023-06-23 北京百度网讯科技有限公司 数据资源调度方法、装置、电子设备及存储介质
CN113419831B (zh) * 2021-06-23 2023-04-11 上海观安信息技术股份有限公司 一种沙箱任务调度方法和系统
CN113485838A (zh) * 2021-07-26 2021-10-08 北京沃东天骏信息技术有限公司 服务器分配方法及装置、电子设备和计算机可读存储介质
CN113626188B (zh) * 2021-08-02 2024-09-20 北京金山云网络技术有限公司 任务推送方法、装置、计算机设备和存储介质
CN113608852B (zh) * 2021-08-03 2024-07-16 中国科学技术大学 任务调度方法、调度模块、推理节点和协同作业系统
CN113672391B (zh) * 2021-08-23 2023-11-28 烽火通信科技股份有限公司 一种基于Kubernetes的并行计算任务调度方法与系统
CN113835865B (zh) * 2021-09-30 2024-09-13 北京金山云网络技术有限公司 一种任务部署方法和装置、电子设备和存储介质
CN114265676B (zh) * 2021-12-08 2024-08-27 中国联合网络通信集团有限公司 集群资源调度方法、装置、设备及介质
CN114443241A (zh) * 2021-12-22 2022-05-06 天翼云科技有限公司 一种任务动态调度方法、任务下发方法及其装置
CN114416315A (zh) * 2022-01-18 2022-04-29 上海金融期货信息技术有限公司 持续集成系统中的任务动态调度方法和系统
CN114064296B (zh) * 2022-01-18 2022-04-26 北京建筑大学 一种Kubernetes调度方法、装置和存储介质
CN114610480A (zh) * 2022-02-09 2022-06-10 阿里巴巴(中国)有限公司 一种弹性资源调度方法、控制设备、装置及可读存储介质
FR3133934B1 (fr) * 2022-03-24 2024-08-09 Vitesco Technologies Procédé de gestion d’exécution d’une pluralité de fonctions
CN114860403B (zh) * 2022-05-11 2023-07-07 科东(广州)软件科技有限公司 一种任务调度方法、装置、设备和存储介质
CN115277579B (zh) * 2022-07-25 2024-03-19 广州品唯软件有限公司 仓库视频调取方法及云平台
CN115145711B (zh) * 2022-09-02 2022-12-23 北京睿企信息科技有限公司 一种获取有向无环图任务结果的数据处理系统
CN115915457B (zh) * 2023-01-30 2023-05-23 阿里巴巴(中国)有限公司 资源调度方法、车辆控制方法、设备及系统
CN116192222B (zh) * 2023-04-27 2023-08-29 中国西安卫星测控中心 面向天线组阵需求的资源调度方法、装置和计算机设备
CN116719628B (zh) * 2023-08-09 2024-04-19 东莞信宝电子产品检测有限公司 一种并发任务抢占式调度方法、系统及介质
CN117435142B (zh) * 2023-12-12 2024-03-01 苏州元脑智能科技有限公司 Io请求调度方法及存储装置
CN118760525A (zh) * 2024-09-02 2024-10-11 北京稀宇极智科技有限公司 一种资源的分配方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101227713A (zh) * 2007-01-19 2008-07-23 华为技术有限公司 一种用户接入控制的方法及其装置
US20140068624A1 (en) * 2012-09-04 2014-03-06 Microsoft Corporation Quota-based resource management
CN106133642A (zh) * 2014-04-08 2016-11-16 高通股份有限公司 在移动设备中通过执行行为分析操作推断应用状态的方法和系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8782047B2 (en) * 2009-10-30 2014-07-15 Hitachi Data Systems Corporation Fixed content storage within a partitioned content platform using namespaces
US8458712B2 (en) * 2008-04-30 2013-06-04 International Business Machines Corporation System and method for multi-level preemption scheduling in high performance processing
CN102073546B (zh) * 2010-12-13 2013-07-10 北京航空航天大学 一种云计算环境中分布式计算模式下的任务动态调度方法
CN104737517B (zh) * 2012-09-07 2018-08-31 甲骨文国际公司 用于提供云服务集合的系统和方法
CN103810046A (zh) * 2012-11-15 2014-05-21 百度在线网络技术(北京)有限公司 一种单机资源管理方法及系统
CN107491351B (zh) * 2016-06-13 2021-07-27 阿里巴巴集团控股有限公司 一种基于优先级的资源分配方法、装置和设备
AU2018100381A4 (en) * 2018-03-27 2018-05-10 Chongqing University Of Posts And Telecommunications A physical resource scheduling method in cloud cluster
CN108769254B (zh) * 2018-06-25 2019-09-20 星环信息科技(上海)有限公司 基于抢占式调度的资源共享使用方法、系统及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101227713A (zh) * 2007-01-19 2008-07-23 华为技术有限公司 一种用户接入控制的方法及其装置
US20140068624A1 (en) * 2012-09-04 2014-03-06 Microsoft Corporation Quota-based resource management
CN104838360A (zh) * 2012-09-04 2015-08-12 微软技术许可有限责任公司 基于配额的资源管理
CN106133642A (zh) * 2014-04-08 2016-11-16 高通股份有限公司 在移动设备中通过执行行为分析操作推断应用状态的方法和系统

Cited By (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020000944A1 (zh) * 2018-06-25 2020-01-02 星环信息科技(上海)有限公司 基于抢占式调度的资源共享使用方法、系统及设备
CN109656716B (zh) * 2018-12-13 2020-12-01 苏州浪潮智能科技有限公司 一种Slurm作业调度方法及系统
CN109656716A (zh) * 2018-12-13 2019-04-19 郑州云海信息技术有限公司 一种Slurm作业调度方法及系统
CN111381956A (zh) * 2018-12-28 2020-07-07 杭州海康威视数字技术股份有限公司 一种任务处理的方法、装置及云分析系统
CN111381956B (zh) * 2018-12-28 2024-02-27 杭州海康威视数字技术股份有限公司 一种任务处理的方法、装置及云分析系统
CN109960585A (zh) * 2019-02-02 2019-07-02 浙江工业大学 一种基于kubernetes的资源调度方法
CN109933420A (zh) * 2019-04-02 2019-06-25 深圳市网心科技有限公司 节点任务调度方法、电子设备及系统
CN111800446B (zh) * 2019-04-12 2023-11-07 北京沃东天骏信息技术有限公司 调度处理方法、装置、设备和存储介质
CN111800446A (zh) * 2019-04-12 2020-10-20 北京沃东天骏信息技术有限公司 调度处理方法、装置、设备和存储介质
CN112114958A (zh) * 2019-06-21 2020-12-22 上海哔哩哔哩科技有限公司 资源隔离方法、分布式平台、计算机设备和存储介质
CN112214288B (zh) * 2019-07-10 2023-04-25 中国移动通信集团上海有限公司 基于Kubernetes集群的Pod调度方法、装置、设备和介质
CN112214288A (zh) * 2019-07-10 2021-01-12 中国移动通信集团上海有限公司 基于Kubernetes集群的Pod调度方法、装置、设备和介质
CN110362407A (zh) * 2019-07-19 2019-10-22 中国工商银行股份有限公司 计算资源调度方法及装置
CN110457135A (zh) * 2019-08-09 2019-11-15 重庆紫光华山智安科技有限公司 一种资源调度方法、装置及共享gpu显存的方法
CN110515730A (zh) * 2019-08-22 2019-11-29 北京宝兰德软件股份有限公司 基于kubernetes容器编排系统的资源二次调度方法及装置
CN110515704A (zh) * 2019-08-30 2019-11-29 广东浪潮大数据研究有限公司 基于Kubernetes系统的资源调度方法及装置
CN110515704B (zh) * 2019-08-30 2023-08-04 广东浪潮大数据研究有限公司 基于Kubernetes系统的资源调度方法及装置
CN110737572A (zh) * 2019-08-31 2020-01-31 苏州浪潮智能科技有限公司 大数据平台资源抢占测试方法、系统、终端及存储介质
CN110737572B (zh) * 2019-08-31 2023-01-10 苏州浪潮智能科技有限公司 大数据平台资源抢占测试方法、系统、终端及存储介质
CN110532082A (zh) * 2019-09-04 2019-12-03 厦门商集网络科技有限责任公司 一种基于任务预分配的任务申请装置和方法
CN110727512A (zh) * 2019-09-30 2020-01-24 星环信息科技(上海)有限公司 集群资源调度方法、装置、设备及储存介质
WO2021063339A1 (zh) * 2019-09-30 2021-04-08 星环信息科技(上海)股份有限公司 集群资源调度方法、装置、设备及储存介质
CN110716809A (zh) * 2019-10-21 2020-01-21 北京百度网讯科技有限公司 用于调度云资源的方法和装置
CN110716809B (zh) * 2019-10-21 2022-06-21 北京百度网讯科技有限公司 用于调度云资源的方法和装置
CN110851236A (zh) * 2019-11-11 2020-02-28 星环信息科技(上海)有限公司 一种实时资源调度方法、装置、计算机设备及存储介质
CN110990154A (zh) * 2019-11-28 2020-04-10 曙光信息产业股份有限公司 一种大数据应用优化方法、装置及存储介质
CN110990154B (zh) * 2019-11-28 2024-02-23 曙光信息产业股份有限公司 一种大数据应用优化方法、装置及存储介质
CN111736965A (zh) * 2019-12-11 2020-10-02 西安宇视信息科技有限公司 任务调度方法、装置、调度服务器和机器可读存储介质
CN113051064A (zh) * 2019-12-26 2021-06-29 中移(上海)信息通信科技有限公司 任务调度方法、装置、设备及存储介质
CN113051064B (zh) * 2019-12-26 2024-05-24 中移(上海)信息通信科技有限公司 任务调度方法、装置、设备及存储介质
CN113127178B (zh) * 2019-12-30 2024-03-29 医渡云(北京)技术有限公司 资源抢占方法及装置、计算机可读存储介质、电子设备
CN113127178A (zh) * 2019-12-30 2021-07-16 医渡云(北京)技术有限公司 资源抢占方法及装置、计算机可读存储介质、电子设备
CN111831390B (zh) * 2020-01-08 2024-04-16 北京嘀嘀无限科技发展有限公司 服务器的资源管理方法、装置及服务器
US12014202B2 (en) 2020-02-13 2024-06-18 Samsung Electronics Co., Ltd. Method and apparatus with accelerator
CN111459666A (zh) * 2020-03-26 2020-07-28 北京金山云网络技术有限公司 任务派发方法、装置、任务执行系统和服务器
CN111506404A (zh) * 2020-04-07 2020-08-07 上海德拓信息技术股份有限公司 一种基于Kubernetes的共享GPU调度方法
CN111399989A (zh) * 2020-04-10 2020-07-10 中国人民解放军国防科技大学 一种面向容器云的任务抢占调度方法及系统
CN111464659A (zh) * 2020-04-27 2020-07-28 广州虎牙科技有限公司 节点的调度、节点的预选处理方法、装置、设备及介质
CN111641678A (zh) * 2020-04-29 2020-09-08 深圳壹账通智能科技有限公司 任务调度方法、装置、电子设备及介质
CN111694646B (zh) * 2020-05-29 2023-11-07 北京百度网讯科技有限公司 资源调度方法、装置、电子设备及计算机可读存储介质
CN111694646A (zh) * 2020-05-29 2020-09-22 北京百度网讯科技有限公司 资源调度方法、装置、电子设备及计算机可读存储介质
CN112015549B (zh) * 2020-08-07 2023-01-06 苏州浪潮智能科技有限公司 一种基于服务器集群的调度节点的选择抢占方法及系统
CN112015549A (zh) * 2020-08-07 2020-12-01 苏州浪潮智能科技有限公司 一种基于服务器集群的调度节点的选择抢占方法及系统
WO2022028059A1 (zh) * 2020-08-07 2022-02-10 苏州浪潮智能科技有限公司 一种基于服务器集群的调度节点的选择抢占方法及系统
CN112230936B (zh) * 2020-09-15 2024-10-08 北京金山云网络技术有限公司 容器组的部署方法、装置及服务器
CN112230936A (zh) * 2020-09-15 2021-01-15 北京金山云网络技术有限公司 容器组的部署方法、装置及服务器
CN112181517A (zh) * 2020-09-24 2021-01-05 北京达佳互联信息技术有限公司 一种应用软件的启动方法、装置、设备和介质
JP2021099879A (ja) * 2020-09-30 2021-07-01 北京百度網訊科技有限公司 開発マシン操作タスクの処理方法、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
JP7170768B2 (ja) 2020-09-30 2022-11-14 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 開発マシン操作タスクの処理方法、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
CN112162865B (zh) * 2020-11-03 2023-09-01 中国工商银行股份有限公司 服务器的调度方法、装置和服务器
CN112162865A (zh) * 2020-11-03 2021-01-01 中国工商银行股份有限公司 服务器的调度方法、装置和服务器
CN112486642B (zh) * 2020-11-25 2024-01-19 广州虎牙科技有限公司 资源调度方法、装置、电子设备及计算机可读存储介质
CN112486642A (zh) * 2020-11-25 2021-03-12 广州虎牙科技有限公司 资源调度方法、装置、电子设备及计算机可读存储介质
CN112685158B (zh) * 2020-12-29 2023-08-04 杭州海康威视数字技术股份有限公司 一种任务调度方法、装置、电子设备及存储介质
CN112685158A (zh) * 2020-12-29 2021-04-20 杭州海康威视数字技术股份有限公司 一种任务调度方法、装置、电子设备及存储介质
CN112528450A (zh) * 2021-01-15 2021-03-19 博智安全科技股份有限公司 网络拓扑结构构建方法、终端设备和计算机可读存储介质
CN112799787B (zh) * 2021-02-07 2023-10-03 北京华如科技股份有限公司 一种在仿真运行中改进的并行行为执行冲突消解方法及其存储介质
CN112799787A (zh) * 2021-02-07 2021-05-14 北京华如科技股份有限公司 一种在仿真运行中改进的并行行为执行冲突消解方法及其存储介质
WO2022179486A1 (zh) * 2021-02-23 2022-09-01 阿里巴巴集团控股有限公司 多核处理器任务调度方法、装置及设备、存储介质
CN113783797A (zh) * 2021-09-13 2021-12-10 京东科技信息技术有限公司 云原生容器的网络流量控制方法、装置、设备及存储介质
CN113783797B (zh) * 2021-09-13 2023-11-07 京东科技信息技术有限公司 云原生容器的网络流量控制方法、装置、设备及存储介质
WO2023071172A1 (zh) * 2021-10-26 2023-05-04 上海商汤智能科技有限公司 任务调度方法、装置、设备、存储介质、计算机程序及计算机程序产品
CN114153581A (zh) * 2021-11-29 2022-03-08 北京金山云网络技术有限公司 数据处理方法、装置、计算机设备和存储介质
CN114461384A (zh) * 2021-12-28 2022-05-10 浙江大华技术股份有限公司 任务执行方法、装置、计算机设备和存储介质
CN114138500A (zh) * 2022-01-29 2022-03-04 阿里云计算有限公司 资源调度系统及方法
CN114610465A (zh) * 2022-03-21 2022-06-10 阿里巴巴(中国)有限公司 任务处理方法、装置及存储介质
CN115658332A (zh) * 2022-12-28 2023-01-31 摩尔线程智能科技(北京)有限责任公司 一种gpu共享方法及装置、电子设备和存储介质

Also Published As

Publication number Publication date
EP3799390A4 (en) 2022-06-22
CN108769254B (zh) 2019-09-20
JP7060724B2 (ja) 2022-04-26
JP2021522621A (ja) 2021-08-30
SG11202013049XA (en) 2021-02-25
CA3104806A1 (en) 2020-01-02
EP3799390B1 (en) 2024-09-04
CA3104806C (en) 2021-05-18
WO2020000944A1 (zh) 2020-01-02
EP3799390A1 (en) 2021-03-31

Similar Documents

Publication Publication Date Title
CN108769254B (zh) 基于抢占式调度的资源共享使用方法、系统及设备
CN105511954B (zh) 一种报文处理方法及装置
CA3043198C (en) Selecting threads for concurrent processing of data
US8595722B2 (en) Preprovisioning virtual machines based on request frequency and current network configuration
WO2019153973A1 (zh) 事件驱动方法及装置
CN103197968A (zh) 一种融合同步异步特点的线程池处理方法及系统
CN105335229B (zh) 一种业务资源的调度方法和装置
CN111464659A (zh) 节点的调度、节点的预选处理方法、装置、设备及介质
US20090282413A1 (en) Scalable Scheduling of Tasks in Heterogeneous Systems
US8365172B2 (en) Horizontal scaling of stream processing
CN108337275A (zh) 用于分发服务器的任务分发方法、装置以及设备
KR101639797B1 (ko) 가상머신 패킷을 처리하는 네트워크 인터페이스 장치 및 그 방법
CN112631766A (zh) 项目环境资源的动态调整方法及装置
CN113886069A (zh) 一种资源分配方法、装置、电子设备及存储介质
EP2912811B1 (en) Traffic engineering system for preventing demand deadlock and achieving uniform link utilization
CN108028806A (zh) 网络功能虚拟化nfv网络中分配虚拟资源的方法和装置
CA2631255A1 (en) Scalable scheduling of tasks in heterogeneous systems
CN107741873A (zh) 业务处理方法及装置
US20140047454A1 (en) Load balancing in an sap system
CN110752994B (zh) 一种流量分类处理方法、装置、设备及可读存储介质
CN110336823A (zh) 基于rtt的任务分配方法、电子设备、系统及介质
CN116112355B (zh) 一种测控基带云化的资源部署及编排管理方法
JPH1027167A (ja) 並列計算機の負荷分散方法
JP2016081495A (ja) 高負荷経路に基づく複合イベントの処理装置及びその方法
CN112685158B (zh) 一种任务调度方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 200233 11th floor, building B, 88 Hongcao Road, Xuhui District, Shanghai

Patentee after: Star link information technology (Shanghai) Co.,Ltd.

Address before: 200233 11th floor, building B, 88 Hongcao Road, Xuhui District, Shanghai

Patentee before: TRANSWARP TECHNOLOGY (SHANGHAI) Co.,Ltd.