Nothing Special   »   [go: up one dir, main page]

CN107231558A - 一种基于cuda的h.264并行编码器的实现方法 - Google Patents

一种基于cuda的h.264并行编码器的实现方法 Download PDF

Info

Publication number
CN107231558A
CN107231558A CN201710368717.5A CN201710368717A CN107231558A CN 107231558 A CN107231558 A CN 107231558A CN 201710368717 A CN201710368717 A CN 201710368717A CN 107231558 A CN107231558 A CN 107231558A
Authority
CN
China
Prior art keywords
encoder
thread
gpu
cuda
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710368717.5A
Other languages
English (en)
Other versions
CN107231558B (zh
Inventor
杨振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Fire Interactive Technology Co Ltd
Original Assignee
Jiangsu Fire Interactive Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Fire Interactive Technology Co Ltd filed Critical Jiangsu Fire Interactive Technology Co Ltd
Priority to CN201710368717.5A priority Critical patent/CN107231558B/zh
Publication of CN107231558A publication Critical patent/CN107231558A/zh
Application granted granted Critical
Publication of CN107231558B publication Critical patent/CN107231558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种基于CUDA的H.264并行编码器的实现方法,该方法包括编码器总体结构优化和各个功能模块在CUDA上的并行化处理。所述总体结构优化包括对编码器功能模块进行帧级分隔,并对CPU和GPU进行任务划分。GPU在模块级对编码器的功能模块分别进行帧间预测、帧内预测编码、熵编码、去块滤波4个过程,从并行模型设计和存储模型等方面实现编码器在CUDA上的并行化。

Description

一种基于CUDA的H.264并行编码器的实现方法
【技术领域】
本发明属于视频编码领域,尤其涉及一种基于CUDA的H.264并行编码器的实现方法。
【背景技术】
现在,H.264/AVC作为当今最流行的视频编码标准,以其高图像质量和高压缩比的性能而受到广泛欢迎,但是提高了图像质量和编码效率,同时也大大增加了H.264的计算复杂度,而现有的基于通用处理器的串行结构编码器无法达到高清实时编码的性能,而专用硬件的开发成本高,周期长,通用性差,不适合大规模使用,所以亟需为H.264编码器寻找一种高效的实现方法。
【发明内容】
为了解决现有技术中的上述问题,本发明提出了一种基于CUDA的H.264并行编码器的实现方法。
本发明采用的技术方案具体如下:
一种基于CUDA的H.264并行编码器的实现方法,该方法包括以下步骤:
(1)对H.264编码器结构进行调整,包括对编码器功能模块进行帧级分隔,以及对该编码器在CPU和GPU上的任务进行划分;
(2)所述编码器的各个功能模块在CUDA上并行化运行,即在模块级对H.264编码器的功能模块分别进行帧间预测、帧内预测编码、熵编码、去块滤波4个过程。
进一步地,功能模块的帧级分隔包括如下步骤:
(1.1)按照编码器核心函数的功能,将核心函数中的各个功能函数分隔成独立的循环体,使每个功能函数在帧一级进行独立循环;
(1.2)将编码器中的大型数据结构按照其生命周期划分成多个简单数据结构,并且根据其实际的生命周期进行本地化。
进一步地,所述步骤1.2具体包括:
将所述大型数据结构分成局部变量、伪全局变量和真全局变量三种类型;
(a)如果所述大型数据结构是局部变量,则其不作变化;
(b)如果所述大型数据结构是伪全局变量,则通过重命名的方法,将该伪全局变量按照其实际生命周期划分成不同的变量;
(c)如果所述大型数据结构是真全局变量,则考察该真全局变量的数据结构中,是否有部分变量是伪全局变量或局部变量,如果有,则将这些变量从该真全局变量中分离出去,对分离出去的伪全局变量再进行如上述步骤b的处理。
进一步地,CPU和GPU的任务划分包括:
(2.1)由CPU完成视频文件的输入并对视频文件进行预处理;
(2.2)CPU将视频文件中的原始帧和参考帧传送给GPU,由GPU进行后续的编码操作;
(2.3)GPU进行帧间预测;
(2.4)GPU执行帧内预测编码;
(2.5)GPU进行并行化熵编码;
(2.6)GPU进行去块滤波。
进一步地,所述帧间预测采用多分辨率多窗口(MRMW)算法。
进一步地,在帧内预测编码过程中,采用一次读取多次处理的方式加载数据,即每个线程块向对应的共享存储器中加载处理多个宏块需要的数据,CUDA的kernel函数内部通过一层循环对这些数据进行预测编码,当此次读取的数据处理结束之后将重建数据写回,然后再加载新的数据进行处理;相应的kernel的组织为两重循环结构,外层循环控制变量对应加载的次数,内存循环控制变量对应每次加载的数据需处理的次数。
进一步地,kernel内部以宏块为单位进行处理,所述宏块包括多个子宏块,帧内预测编码包括三个阶段:
第一阶段:每个子宏块交由帧内预测线程块中的一个线程进行帧内预测处理;
第二阶段:由DCT线程块中的一个线程对一个子宏块中的一行或一列像素进行DCT处理;
第三阶段:由量化线程块中的一个线程对一个像素进行量化处理。
进一步地,在并行化熵编码过程中,每个CUDA线程块处理8个连续的宏块,每一个线程处理一个子宏块的熵编码。
进一步地,所述去块滤波以帧为单位,包括边界强度的计算和滤波。
进一步地,所述预处理包括对视频分量YUV的分离以及编码器基本参数设置。
本方法的有益效果为:提高了H.264编码器的执行效率,在不降低编码性能的前提下降低编码的计算复杂度,提高编码速度。
【附图说明】
此处所说明的附图是用来提供对本发明的进一步理解,构成本申请的一部分,但并不构成对本发明的不当限定,在附图中:
图1是本发明对核心函数的循环体分割示意图。
图2是本发明数据结构简单化和局部化的示意图。
图3是本发明CPU-GPU上的任务划分图。
图4是本发明帧间预测编码存储模型。
图5是本发明CAVLC编码阶段CUDA并行模型。
图6是去块滤波函数分离示意图。
【具体实施方式】
下面将结合附图以及具体实施例来详细说明本发明,其中的示意性实施例以及说明仅用来解释本发明,但并不作为对本发明的限定。
本发明基于H.264的串行程序X264,基于对此程序的分析,根据CUDA架构提出了并行H.264编码器框架并且在CUDA上实现并行H.264编码器的方法。该方法包括以下两个方面:
(1)总体结构优化
总体结构优化是对H.264编码器结构进行调整,对基于CUDA的H.264并行编码器的框架进行设计,该调整和设计主要包括两个方面:对编码器功能模块进行帧级分隔;以及对CPU和GPU进行任务划分。
(2)各个功能模块在CUDA上的并行化,即在模块级对H.264编码器的功能模块分别进行帧间预测、帧内预测编码、熵编码、去块滤波4个过程,从并行模型设计和存储模型等方面实现编码器在CUDA上的并行化。
下面对该方法的这两个方面进行详细说明。
功能模块的帧级分隔:
功能模块的帧级分隔的具体步骤如下:
(1.1)松散函数耦合度
在H.264编码器中,其核心函数(main函数)是一个大的循环体,如图1上方所示,A为main函数,其包括下方的D1’,…,D5,D6,…,D7,E1,E2,E3,E4,E5所有的函数作为一个整个的大的循环体,main函数的每一次循环都执行一遍所有的函数,这种方式循环体路径长,如果直接进行并行程序的开发,函数负载太重。
因此本发明按照核心函数的功能,将核心函数的整个循环分割成多个相对独立的循环体,如图1下方所示,每个函数在帧一级进行独立循环,将D1’,…,D5,D6,…,D7,E1,E2,E3,E4,E5每个都分割成独立的循环体,例如D1’函数是个循环体,D5函数是个循环体,D7函数是个循环体,E1函数是个循环体等等。这样,每个函数独立集中处理一个任务,独立循环,在每个循环体执行的过程中,指令的局域性更好,失效次数低。
(1.2)将H.264编码器中的数据结构简单化和局部化
参见图2,为了减少数据传输的时间,本发明将编码器中的大型数据结构按照其生命周期划分成多个简单数据结构,并且根据其实际的生命周期进行本地化。具体地,所述大型数据结构可以分成局部变量、伪全局变量和真全局变量三种类型。
对于局部变量,例如图2中函数0中的本地变量A,不作变化。
对于伪全局变量B,即虽然是全局变量,但是该变量的作用范围可以拆分成多个实际生命周期,则通过重命名的方法,将该伪全局变量按照其实际生命周期分为不同的变量。如图2所示,对于伪全局变量B,其在函数0和函数1之间的变量值没有关系,可以拆分成2个生命周期,因此将函数1中的该伪全局变量重命名为B0,而函数2中没有使用到该变量B,则函数2中就可以不再定义该变量B。
对于真全局变量C,则需要考察该真全局变量的数据结构中,是否有部分变量是伪全局变量或局部变量,如果有,则将这些变量从C中分离出去,分离出去的伪全局变量再进行如上处理。如果图2所示,真全局变量C可以拆分成一个伪全局变量和一个局部变量,则限制该伪全局变量的作用范围在函数0和函数1,限制局部变量C0的作用范围只在函数2.
CPU和GPU的任务划分
参考图3,其示出了本发明H.264编码器各个功能模块在CPU和GPU上的任务划分以及CPU-GPU之间的数据流动情况。
(2.1)首先由CPU完成视频文件的输入并对视频文件进行预处理,包括对视频分量YUV的分离,以及编码器基本参数设置等。
(2.2)CPU将原始帧和参考帧传送给GPU,由GPU进行后续的编码操作。
GPU以帧为单位,通过执行四个模块对帧进行处理,基本流程是:对一帧的帧间预测结束之后,再进行相应的帧内预测编码,然后对得到的变量化系数进行熵编码,以此类推,直至整帧的熵编码和去块滤波结束之后再将结果数据传回CPU。
(2.3)GPU执行帧间预测。
帧间预测是H.264编码器中计算需求最大的部分,传统帧间预测所需的计算量约占整个编码器的70%,虽然图像质量较好但复杂。本发明采用现有技术中的多分辨率多窗口(MRMW)算法进行帧间预测。由于本发明对功能模块进行了帧级分隔,使用MRMW算法相对于现有技术可以大幅度减少帧间预测的时间。
(2.4)GPU执行帧内预测编码。
帧内预测并行度并不高,CUDA每个线程块能够同时处理最大的数据量为1个宏块(256像素),对于共享存储器的压力并不大,而相邻宏块之间存在生产者-消费者之间的关系,为了减少为全局存储中相关数据的访问次数,本发明采用一次读取多次处理的方式加载数据。即每个线程块向对应的共享存储器中加载处理多个宏块需要的数据,CUDA的kernel函数内部通过一层循环对这些数据进行预测编码,当此次读取的数据处理结束之后将重建数据写回,然后再加载新的数据进行处理。相应的kernel的组织为两重循环结构,外层循环控制变量对应加载的次数,内存循环控制变量对应每次加载的数据需处理的次数。
参见附图4,其示出了帧内预测编码的存储模型。图4左上部分由多个宏块(MB)组成的一个图像帧,每次读取帧数据时,都从原始图像帧中读取一个strip,并存储到共享存储器中(如图4右上所示),kernel内部以宏块为单位对该strip进行处理。
图4中部和下部示出了kernel对一个宏块的处理过程。图4的左中部分示出了一个4*4的宏块,其包括子宏块0到子宏块15,每个子宏块包括4*4个像素,其帧内预测编码包括三个阶段:
第一阶段:如图4左中和左下部分,每个子宏块交由帧内预测线程块(predictionThread block)中的一个线程进行帧内预测处理,共需要16个线程(线程0至线程15)。
第二阶段:如图4的正中和正下部分,由DCT线程块中的一个线程对一个子宏块中的一行或一列像素进行DCT处理,共需64个线程(线程0至线程63)。
第三阶段:如图4的右中和右下部分,由量化线程块(quant Thread block)中的一个线程对一个像素进行量化处理(以行优先的方式),共需256个线程(线程0值线程255)。
(2.5)GPU进行并行化熵编码。
参考附图5,其为CAVLC编码阶段CUDA并行模型,示出了亮度交流分量熵编码阶段数据与线程的映射关系。其中每个CUDA线程块处理8个连续的宏块,即线程块B0处理第0行中的MB0到MB7,线程块B14处理MB112到MB119,以此类推。线程块内连续的16个线程分别处理一个宏块中16个子宏块。图5中共有1200个线程块,每个线程块包含128个线程,线程数达到了130560个,每一个线程处理一个子宏块的熵编码,从而实现了130560个线程并行熵编码。虽然熵编码是一个分支密集型的组件,但是经过功能模块的帧级分隔,将各种分量分离,已经消除了一些分支路径,通过大量线程实现大规模的数据并行足以弥补分支操作带来的影响。
(2.6)GPU进行去块滤波,如图6所示,所述去块滤波以帧为单位,包括边界强度的计算和滤波。
通过上述过程,本发明从系统和模块级两个方面实现了H.264在CUDA上的并行化过程,在不降低编码性能的前提下降低编码的计算复杂度,提高编码速度。
以上所述仅是本发明的较佳实施方式,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请范围内。

Claims (10)

1.一种基于CUDA的H.264并行编码器的实现方法,其特征在于,该方法包括以下步骤:
(1)对H.264编码器结构进行调整,包括对编码器功能模块进行帧级分隔,以及对该编码器在CPU和GPU上的任务进行划分;
(2)所述编码器的各个功能模块在CUDA上并行化运行,即在模块级对H.264编码器的功能模块分别进行帧间预测、帧内预测编码、熵编码、去块滤波4个过程。
2.根据权利要求1所述的方法,其特征在于,功能模块的帧级分隔包括如下步骤:
(1.1)按照编码器核心函数的功能,将核心函数中的各个功能函数分隔成独立的循环体,使每个功能函数在帧一级进行独立循环;
(1.2)将编码器中的大型数据结构按照其生命周期划分成多个简单数据结构,并且根据其实际的生命周期进行本地化。
3.根据权利要求2所述的方法,其特征在于,所述步骤1.2具体包括:
将所述大型数据结构分成局部变量、伪全局变量和真全局变量三种类型;
(a)如果所述大型数据结构是局部变量,则其不作变化;
(b)如果所述大型数据结构是伪全局变量,则通过重命名的方法,将该伪全局变量按照其实际生命周期划分成不同的变量;
(c)如果所述大型数据结构是真全局变量,则考察该真全局变量的数据结构中,是否有部分变量是伪全局变量或局部变量,如果有,则将这些变量从该真全局变量中分离出去,对分离出去的伪全局变量再进行如上述步骤b的处理。
4.根据权利要求1-3任意一项所述的方法,其特征在于,CPU和GPU的任务划分包括:
(2.1)由CPU完成视频文件的输入并对视频文件进行预处理;
(2.2)CPU将视频文件中的原始帧和参考帧传送给GPU,由GPU进行后续的编码操作;
(2.3)GPU进行帧间预测;
(2.4)GPU执行帧内预测编码;
(2.5)GPU进行并行化熵编码;
(2.6)GPU进行去块滤波。
5.根据权利要求4所述的方法,其特征在于,所述帧间预测采用多分辨率多窗口(MRMW)算法。
6.根据权利要求4-5任意一项所述的方法,其特征在于,在帧内预测编码过程中,采用一次读取多次处理的方式加载数据,即每个线程块向对应的共享存储器中加载处理多个宏块需要的数据,CUDA的kernel函数内部通过一层循环对这些数据进行预测编码,当此次读取的数据处理结束之后将重建数据写回,然后再加载新的数据进行处理;相应的kernel的组织为两重循环结构,外层循环控制变量对应加载的次数,内存循环控制变量对应每次加载的数据需处理的次数。
7.根据权利要求6所述的方法,其特征在于,kernel内部以宏块为单位进行处理,所述宏块包括多个子宏块,帧内预测编码包括三个阶段:
第一阶段:每个子宏块交由帧内预测线程块中的一个线程进行帧内预测处理;
第二阶段:由DCT线程块中的一个线程对一个子宏块中的一行或一列像素进行DCT处理;
第三阶段:由量化线程块中的一个线程对一个像素进行量化处理。
8.根据权利要求4-7任意一项所述的方法,其特征在于,在并行化熵编码过程中,每个CUDA线程块处理8个连续的宏块,每一个线程处理一个子宏块的熵编码。
9.根据权利要求4-8任意一项所述的方法,其特征在于,所述去块滤波以帧为单位,包括边界强度的计算和滤波。
10.根据权利要求4-9任意一项所述的方法,其特征在于,所述预处理包括对视频分量YUV的分离以及编码器基本参数设置。
CN201710368717.5A 2017-05-23 2017-05-23 一种基于cuda的h.264并行编码器的实现方法 Active CN107231558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710368717.5A CN107231558B (zh) 2017-05-23 2017-05-23 一种基于cuda的h.264并行编码器的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710368717.5A CN107231558B (zh) 2017-05-23 2017-05-23 一种基于cuda的h.264并行编码器的实现方法

Publications (2)

Publication Number Publication Date
CN107231558A true CN107231558A (zh) 2017-10-03
CN107231558B CN107231558B (zh) 2019-10-22

Family

ID=59933794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710368717.5A Active CN107231558B (zh) 2017-05-23 2017-05-23 一种基于cuda的h.264并行编码器的实现方法

Country Status (1)

Country Link
CN (1) CN107231558B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108012156A (zh) * 2017-11-17 2018-05-08 深圳市华尊科技股份有限公司 一种视频处理方法及控制平台
CN110677646A (zh) * 2019-09-24 2020-01-10 杭州当虹科技股份有限公司 一种基于cpu+gpu混合编码的帧内编码预测方法
CN112385225A (zh) * 2019-09-02 2021-02-19 北京航迹科技有限公司 用于改进图像编码的方法和系统
CN114765684A (zh) * 2021-01-12 2022-07-19 四川大学 一种基于gpu的jpeg并行熵编码方法
CN115065825A (zh) * 2022-06-07 2022-09-16 北京邮电大学 一种基于gpu的移动视频编解码系统
CN115802055A (zh) * 2023-01-30 2023-03-14 孔像汽车科技(武汉)有限公司 基于fpga的图像去雾处理方法、装置、芯片和存储介质
CN116483545A (zh) * 2023-06-19 2023-07-25 支付宝(杭州)信息技术有限公司 一种多任务执行方法、装置以及设备
CN116600134A (zh) * 2023-05-04 2023-08-15 光线云(杭州)科技有限公司 一种适配图形引擎的并行视频压缩方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2192781A2 (en) * 2008-11-28 2010-06-02 Thomson Licensing Method for video decoding supported by graphics processing unit
CN102404561A (zh) * 2010-09-14 2012-04-04 盛乐信息技术(上海)有限公司 在cuda上实现mpeg4i帧编码的方法
CN104022756A (zh) * 2014-06-03 2014-09-03 西安电子科技大学 一种基于gpu架构的改进的粒子滤波方法
CN105491377A (zh) * 2015-12-15 2016-04-13 华中科技大学 一种计算复杂度感知的视频解码宏块级并行调度方法
CN105956021A (zh) * 2016-04-22 2016-09-21 华中科技大学 一种适用于分布式机器学习的自动化任务并行的方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2192781A2 (en) * 2008-11-28 2010-06-02 Thomson Licensing Method for video decoding supported by graphics processing unit
CN102404561A (zh) * 2010-09-14 2012-04-04 盛乐信息技术(上海)有限公司 在cuda上实现mpeg4i帧编码的方法
CN104022756A (zh) * 2014-06-03 2014-09-03 西安电子科技大学 一种基于gpu架构的改进的粒子滤波方法
CN105491377A (zh) * 2015-12-15 2016-04-13 华中科技大学 一种计算复杂度感知的视频解码宏块级并行调度方法
CN105956021A (zh) * 2016-04-22 2016-09-21 华中科技大学 一种适用于分布式机器学习的自动化任务并行的方法及其系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NAN WU,ET AL.: "A Parallel H.264 Encoder with CUDA:Mapping and Evaluation", 《2012 IEEE 18TH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS》 *
姜忠兵,等.: "基于TMS320DM8168的高清视频编码技术与实现", 《数据采集与处理》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108012156B (zh) * 2017-11-17 2020-09-25 深圳市华尊科技股份有限公司 一种视频处理方法及控制平台
CN108012156A (zh) * 2017-11-17 2018-05-08 深圳市华尊科技股份有限公司 一种视频处理方法及控制平台
CN112385225A (zh) * 2019-09-02 2021-02-19 北京航迹科技有限公司 用于改进图像编码的方法和系统
WO2021042232A1 (en) * 2019-09-02 2021-03-11 Beijing Voyager Technology Co., Ltd. Methods and systems for improved image encoding
CN110677646A (zh) * 2019-09-24 2020-01-10 杭州当虹科技股份有限公司 一种基于cpu+gpu混合编码的帧内编码预测方法
CN114765684B (zh) * 2021-01-12 2023-05-09 四川大学 一种基于gpu的jpeg并行熵编码方法
CN114765684A (zh) * 2021-01-12 2022-07-19 四川大学 一种基于gpu的jpeg并行熵编码方法
CN115065825A (zh) * 2022-06-07 2022-09-16 北京邮电大学 一种基于gpu的移动视频编解码系统
CN115802055A (zh) * 2023-01-30 2023-03-14 孔像汽车科技(武汉)有限公司 基于fpga的图像去雾处理方法、装置、芯片和存储介质
CN115802055B (zh) * 2023-01-30 2023-06-20 孔像汽车科技(武汉)有限公司 基于fpga的图像去雾处理方法、装置、芯片和存储介质
CN116600134A (zh) * 2023-05-04 2023-08-15 光线云(杭州)科技有限公司 一种适配图形引擎的并行视频压缩方法和装置
CN116600134B (zh) * 2023-05-04 2024-06-14 光线云(杭州)科技有限公司 一种适配图形引擎的并行视频压缩方法和装置
CN116483545A (zh) * 2023-06-19 2023-07-25 支付宝(杭州)信息技术有限公司 一种多任务执行方法、装置以及设备
CN116483545B (zh) * 2023-06-19 2023-09-29 支付宝(杭州)信息技术有限公司 一种多任务执行方法、装置以及设备

Also Published As

Publication number Publication date
CN107231558B (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
CN107231558A (zh) 一种基于cuda的h.264并行编码器的实现方法
CN108449603B (zh) 基于多核平台多层次任务级与数据级并行的hevc解码方法
CN105491377B (zh) 一种计算复杂度感知的视频解码宏块级并行调度方法
CN109495743B (zh) 一种基于异构多处理平台的并行化视频编码方法
CN101971633A (zh) 压缩参考帧的视频编码系统
CN104869398A (zh) 一种基于cpu+gpu异构平台实现hevc中的cabac的并行方法
CN1794814A (zh) 流水线化解块滤波器
CN1812576A (zh) 同时执行视频数据水平和垂直滤波的解块滤波器及其方法
CN102970531A (zh) Jpeg-ls近无损图像压缩编码器硬件实现方法
CN103414895A (zh) 一种适用于hevc标准的编码器帧内预测装置及方法
CN101115207B (zh) 基于预测点间相关性的帧内预测实现的方法及装置
CN103297777A (zh) 一种用于加速视频编码速度的方法及装置
CN103227919A (zh) 一种基于多核处理器Tilera的SVC编码方法
CN101383971A (zh) 一种基于图像编解码的帧内预测的处理方法
CN101252691B (zh) 一种多处理器并行实现高分辨率图像滤波的方法
CN101888554B (zh) 并行流水运动补偿滤波器vlsi结构设计方法
CN107483948A (zh) 一种webp压缩处理中像素宏块处理方法
CN105100799B (zh) 一种减少hevc编码器中帧内编码时延的方法
CN113242433B (zh) 图像压缩方法及基于arm多核异构处理器的图像压缩系统
CN112422986B (zh) 硬件解码器流水线优化方法及应用
CN104113759B (zh) 视频系统、视频帧缓存再压缩/解压缩方法与装置
CN110446043A (zh) 一种基于多核平台的hevc细粒度并行编码方法
CN102281441B (zh) 一种并行滤波的方法和装置
CN104780377B (zh) 一种基于分布式计算机系统的并行hevc编码系统及方法
CN107124608A (zh) 一种编码方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 307, 309 and 311, Room 959, Jiayuan Road, Yuanhe Street, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant after: Jiangsu fire Interactive Technology Co., Ltd.

Address before: High tech Zone Suzhou city Jiangsu province 215000 Chuk Yuen Road No. 209

Applicant before: Jiangsu fire Interactive Technology Co., Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant