Nothing Special   »   [go: up one dir, main page]

CN110581999B - 色度解码器侧运动矢量细化 - Google Patents

色度解码器侧运动矢量细化 Download PDF

Info

Publication number
CN110581999B
CN110581999B CN201910498116.5A CN201910498116A CN110581999B CN 110581999 B CN110581999 B CN 110581999B CN 201910498116 A CN201910498116 A CN 201910498116A CN 110581999 B CN110581999 B CN 110581999B
Authority
CN
China
Prior art keywords
motion
motion vector
block
chroma
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910498116.5A
Other languages
English (en)
Other versions
CN110581999A (zh
Inventor
刘鸿彬
张莉
张凯
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN110581999A publication Critical patent/CN110581999A/zh
Application granted granted Critical
Publication of CN110581999B publication Critical patent/CN110581999B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/543Motion estimation other than block-based using regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种对比特流进行解码的方法,包括使用一个或多个模板估计当前视频块的匹配成本。一个或多个模板中的每个包含亮度分量、第一色度分量C0和第二色度分量C1。该方法还包括使用具有最小匹配成本的模板来细化当前视频块的运动信息。

Description

色度解码器侧运动矢量细化
相关申请的交叉引用
根据适用的《专利法》和/或《巴黎公约》的规定,本申请是为了及时要求2018年6月7日提交的在先美国临时专利申请No.62/682,150的优先权和权益。出于美国法律的目的,美国临时专利申请No.62/682,150的全部公开以引用方式并入本公开,作为本申请的公开的一部分。
技术领域
本文档涉及视频编解码技术。
背景技术
尽管视频压缩技术取得了进步,但数字视频仍在互联网和其他数字通信网络上占最大的带宽使用量。随着能够接收和显示视频的连接用户设备的数量增加,预计数字视频使用所需的带宽将继续增长。
发明内容
公开了与视频编解码中的解码器侧运动矢量推导(Side Motion VectorDerivation,DMVD)相关的技术。该技术可以应用于现有的视频编解码标准,如高效视频编解码(High Efficiency Video Coding,HEVC)、或最终确定的标准多功能视频编解码(Versatile Video Coding,VVC)。该技术也可以应用于未来的视频编解码标准或视频编解码器。
在一个示例方面,公开了一种对包括视频的数字表示的比特流进行解码的方法。该方法包括使用一个或多个模板估计当前视频块的匹配成本。一个或多个模板中的每个包含亮度分量、第一色度分量C0和第二色度分量C1。该方法还包括使用具有最小匹配成本的模板来细化当前视频块的运动信息。
在又一示例方面,公开了一种装置,包括被配置为实施上述方法的处理器。
在再一示例方面,这些方法可以以计算机可运行指令的形式体现并存储在计算机可读程序介质上。
在本文档中进一步描述了这些和其他方面。
附图说明
图1示出了用于Merge候选列表建构的推导过程的示例。
图2示出了空间Merge候选的示例位置。
图3示出了考虑空间Merge候选的冗余校验的候选对的示例。
图4A和图4B示出了N×2N和2N×N个分区的第二预测单元(PU)的示例位置。
图5是用于时间Merge候选的运动矢量缩放的示例说明。
图6示出了时间Merge候选C0和C1的候选位置的示例。
图7示出了组合的双向预测Merge候选的示例。
图8示出了运动矢量预测候选的示例推导过程。
图9示出了用于空间运动矢量候选的运动矢量缩放的示例说明。
图10示出了用于编解码单元(CU)的可选时间运动矢量预测(ATMVP)运动预测的示例。
图11示出了具有四个子块及其相邻块(a-d)的一个CU的示例。
图12是应用重叠块运动补偿(OBMC)的子块的图示。
图13示出了用于推导IC参数的相邻样本的示例。
图14示出了简化的仿射运动模型的示例。
图15示出了每个子块的仿射运动矢量场(MVF)的示例。
图16示出了AF_INTER的运动矢量预测(MVP)的示例。
图17A和图17B示出了AF_MERGE的候选的示例。
图18示出了双边匹配的示例。
图19示出了模板匹配的示例。
图20示出了帧速率上转换(FRUC)中的单边运动估计(ME)的示例。
图21示出了光流轨迹的示例。
图22A示出了没有具有块外部的访问位置的块扩展的双向光流(BIO)。
图22B示出了没有块扩展的BIO,其中发出填充以避免额外的存储器访问和计算。
图23示出了基于双边模板匹配的解码器侧运动矢量细化(DMVR)的示例。
图24是视频解码的示例方法的流程图。
图25是视频解码装置的框图。
图26示出了视频编码器的示例实施方式。
具体实施方式
本文档提供了可由视频比特流的解码器使用的各种技术,以改善解压缩或解码的数字视频的质量。此外,视频编码器还可在编码处理期间实施这些技术,以便重建用于进一步编码的经解码的帧。
为了便于理解,在本文档中使用章节标题,并且不将实施例和技术限制于对应部分。这样,来自一个部分的实施例可以与来自其他部分的实施例组合。此外,虽然一些实施例详细描述了视频编解码步骤,但是应该理解,将由解码器实施解码撤消(undo)编解码的对应步骤。此外,术语视频处理包括视频编解码或压缩、视频解码或解压缩以及视频转码,其中视频像素从一种压缩格式表示为另一压缩格式或以不同的压缩比特率表示。
1.技术框架
视频编解码标准主要通过开发众所周知的ITU-T和ISO/IEC标准而发展。ITU-T产生了H.261和H.263,ISO/IEC产生了MPEG-1和MPEG-4Visual,两个组织联合产生了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(Advanced Video Coding,AVC)和H.265/HEVC标准。从H.262开始,视频编解码标准基于利用时间预测加变换编解码的混合视频编解码结构。为了探索HEVC之外的未来视频编解码技术,由VCEG和MPEG于2015年联合成立了联合视频探索团队(Joint Video Exploration Team,JVET)。从那时起,许多新方法被JVET采用并被引入名为联合搜索模型(Joint Exploration Model,JEM)的参考软件中。在2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家组(Joint VideoExpert Team,JVET)被创建用于VVC标准,目标是与HEVC相比降低50%的比特率。
2.HEVC/H.265中的帧间预测
每个帧间预测的预测单元(Prediction Unit,PU)具有用于一个或两个参考图片列表的运动参数。运动参数包括运动矢量和参考图片索引。也可以使用inter_pred_idc来信号通知两个参考图片列表中的一个的使用。可以将运动矢量明确地编解码为相对于预测器的增量。
当用跳过模式对编解码单元(Coding Unit,CU)进行编解码时,一个PU与CU相关联,并且不存在显著的残差系数、没有编解码的运动矢量增量或参考图片索引。指定Merge模式,从而从相邻PU获得当前PU的运动参数,包括空间和时间候选。Merge模式可以应用于任何帧间预测的PU,而不仅应用于跳过模式。Merge模式的替代是运动参数的显式传输,其中,对于每个PU,明确地用信号通知运动矢量(更准确地说,与运动矢量预测器相比的运动矢量差)、每个参考图片列表的对应参考图片索引和参考图片列表使用。在本文档中,这种模式被称为高级运动矢量预测(Advanced Motion Vector Prediction,AMVP)。
当信令指示将使用两个参考图片列表中的一个时,从一个样本块产生PU。这被称为“单向预测(uni-prediction)”。单向预测可用于P条带和B条带两者。
当信令指示将使用两个参考图片列表时,从两个样本块产生PU。这被称为“双向预测(bi-prediction)”。双向预测仅适用于B条带。
以下文本提供了HEVC中指定的帧间预测模式的详细信息。描述将从Merge模式开始。
2.1.1Merge模式
2.1.1.1Merge模式的候选推导
当使用Merge模式预测PU时,从比特流解析指向Merge候选列表中的条目的索引并将其用于检索运动信息。该列表的建构(construction)在HEVC标准中指定,并且可以根据以下步骤顺序进行总结:
·步骤1:初始候选推导
ο步骤1.1:空间候选推导
ο步骤1.2:空间候选的冗余校验
ο步骤1.3:时间候选推导
·步骤2:插入额外的候选
ο步骤2.1:创建双向预测候选
ο步骤2.2:插入零运动候选
这些步骤也在图1中示意性地描绘。对于空间Merge候选推导,在位于五个不同位置的候选当中选择最多四个Merge候选。对于时间Merge候选推导,在两个候选当中选择最多一个Merge候选。由于在解码器处假设恒定数量的候选用于每个PU,因此当从步骤1获得的候选的数量未达到在条带报头中用信号通知的最大Merge候选数量(MaxNumMergeCand)时,生成额外的候选。由于候选的数量是恒定的,因此使用截断的一元二值化(TruncatedUnary binarization,TU)来编码最佳Merge候选的索引。如果CU的尺寸等于8,则当前CU的所有PU共享单个Merge候选列表,其与2N×2N预测单元的Merge候选列表相同。
在下文中,详细描述了与上述步骤相关的操作。
2.1.1.2空间候选推导
在空间Merge候选的推导中,在位于图2描绘的位置的候选当中选择最多四个Merge候选。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一条带或区块)或者是帧内编解码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余校验,其确保具有相同运动信息的候选被排除在列表之外,使得编解码效率提高。为了降低计算复杂度,在所提到的冗余校验中并未考虑所有可能的候选对。相反,仅考虑图3中用箭头连接的对,并且仅在用于冗余校验的对应候选具有不一样的运动信息时,才将候选添加到列表。重复运动信息的另一来源是与不同于2N×2N的分区相关联的“第二PU”。作为示例,图4A和图4B描绘了分别针对N×2N和2N×N的情况的第二PU。当当前PU被分区为N×2N时,位置A1处的候选不被考虑用于列表建构。实际上,通过添加该候选将导致具有相同运动信息的两个预测单元,这对于在编解码单元中仅具有一个PU是多余的。类似地,当当前PU被分区为2N×N时,不考虑位置B1
2.1.1.3时间候选推导
在该步骤中,只有一个候选被添加到列表中。具体地,在该时间Merge候选的推导中,基于共同定位的PU来推导缩放的运动矢量,该共同定位的PU属于给定参考图片列表内与当前图片具有最小图片顺序计数(POC)差的图片。在条带报头中明确地用信号通知要用于推导共同定位的PU的参考图片列表。如图5中的虚线所示获得用于时间Merge候选的缩放的运动矢量,其是使用POC距离tb和td从共同定位的PU的运动矢量缩放的,其中tb被定义为当前图片的参考图片与当前图片之间的POC差,td被定义为是共同定位的图片的参考图片与共同定位的图片之间的POC差。时间Merge候选的参考图片索引被设置为等于零。HEVC规范中描述了缩放过程的实际实现。对于B条带,获得两个运动矢量,一个用于参考图片列表0,另一用于参考图片列表1,并且结合该两个运动矢量以获得双向预测Merge候选。
在属于参考帧的共同定位的PU(Y)中,在候选C0和C1之间选择时间候选的位置,如图6所示。如果位置C0处的PU不可用、是帧内编解码的、或者在当前CTU行之外,则使用位置C1。否则,位置C0用于时间Merge候选的推导。
2.1.1.4插入额外的候选
除了空间和时间Merge候选之外,还存在两种额外类型的Merge候选:组合的双向预测Merge候选和零Merge候选。通过利用空间和时间Merge候选来生成组合的双向预测Merge候选。组合的双向预测Merge候选仅用于B条带。通过将初始候选的第一参考图片列表运动参数与另一候选的第二参考图片列表运动参数组合来生成组合的双向预测候选。如果这两个元组提供不同的运动假设,它们将形成一个新的双向预测候选。作为示例,图7描绘了当原始列表(左侧)中具有mvL0和refIdxL0或mvL1和refIdxL1的两个候选被用于创建添加到最终列表(右侧)的组合的双向预测Merge候选的情况。关于被认为生成这些额外的Merge候选的组合有许多规则。
插入零运动候选以填充Merge候选列表中的剩余条目,从而达到MaxNumMergeCand容量。这些候选具有零空间位移和参考图片索引,该参考图片索引从零开始并且每当新的零运动候选被添加到列表时增加。这些候选使用的参考帧的数量是1和2,分别用于单向和双向预测。最后,不对这些候选执行冗余校验。
2.1.1.5用于并行处理的运动估计区域
为了加速编码处理,可以并行执行运动估计,从而同时推导给定区域内的所有预测单元的运动矢量。从空间邻域推导Merge候选可能干扰并行处理,因为一个预测单元直到其相关联的运动估计完成时才能从相邻PU推导运动参数。为了减轻编解码效率和处理等待时间之间的折衷,HEVC定义运动估计区域(Motion Estimation Region,MER),其尺寸在图片参数集中使用“log2_parallel_merge_level_minus2”语法元素信号通知。当定义MER时,落入同一区域的Merge候选被标记为不可用,因此在列表建构中不予考虑。
2.1.2AMVP
AMVP利用运动矢量与相邻PU的时空相关性,其用于运动参数的显式传输。对于每个参考图片列表,通过首先校验在时间上相邻的PU位置的上方,左侧的可用性,移除冗余候选并添加零矢量以使候选列表为恒定长度来建构运动矢量候选列表。然后,编码器可以从候选列表中选择最佳预测器,并发送指示所选候选的对应索引。与Merge索引信令类似,使用截断的一元来编码最佳运动矢量候选的索引。在这种情况下要编码的最大值是2(参见图8)。在以下部分中,提供了关于运动矢量预测候选的推导过程的细节。
2.1.2.1AMVP候选的推导
图8总结了运动矢量预测候选的推导过程。
在运动矢量预测中,考虑两种类型的运动矢量候选:空间运动矢量候选和时间运动矢量候选。对于空间运动矢量候选推导,最终基于位于图2所示的五个不同位置的每个PU的运动矢量推导两个运动矢量候选。
对于时间运动矢量候选推导,从两个候选中选择一个运动矢量候选,其是基于两个不同的共同定位的位置推导的。在产生时空候选的第一列表之后,移除列表中的重复的运动矢量候选。如果潜在候选的数量大于2,则从列表中移除相关联的参考图片列表内的其参考图片索引大于1的运动矢量候选。如果时空运动矢量候选的数量小于2,则将额外的零运动矢量候选添加到列表中。
2.1.2.2空间运动矢量候选
在空间运动矢量候选的推导中,在五个潜在候选当中考虑最多两个候选,其从位于如图2所示的位置的PU中推导,那些位置与运动Merge的位置相同。将当前PU的左侧的推导顺序定义为A0、A1,以及缩放的A0、缩放的A1。将当前PU的上侧的推导顺序定义为B0、B1、B2,缩放的B0、缩放的B1、缩放的B2。因此,对于每一侧,存在可以用作运动矢量候选的四种情况,其中两种情况不需要使用空间缩放,两种情况使用空间缩放。四种不同的情况总结如下:
·没有空间缩放
-(1)相同的参考图片列表,以及相同的参考图片索引(相同的POC)
-(2)不同的参考图片列表,但相同的参考图片(相同的POC)
·空间缩放
-(3)相同的参考图片列表,但不同的参考图片(不同的POC)
-(4)不同的参考图片列表,以及不同的参考图片(不同的POC)
首先校验无空间缩放的情况,然后校验空间缩放。当POC在相邻PU的参考图片与当前PU的参考图片之间不同而不管参考图片列表时,考虑空间缩放。如果左候选的所有PU都不可用或者是帧内编解码的,则允许对上述运动矢量进行缩放以帮助左和上MV候选的并行推导。否则,不允许对上述运动矢量进行空间缩放。
在空间缩放过程中,以与时间缩放类似的方式缩放相邻PU的运动矢量,如图9所示。主要区别是将参考图片列表和当前PU的索引作为输入给出;实际缩放过程与时间缩放过程相同。
2.1.2.3时间运动矢量候选
除了参考图片索引推导之外,用于推导时间Merge候选的所有过程与用于推导空间运动矢量候选的过程相同(参见图6)。将参考图片索引用信号通知给解码器。
2.2JEM中的新的帧间预测方法
2.2.1基于子CU的运动矢量预测
在具有QTBT的JEM中,每个CU可以针对每个预测方向具有至多一组运动参数。通过将大CU划分成子CU并且推导大CU的所有子CU的运动信息,在编码器中考虑两个子CU级运动矢量预测方法。可选时间运动矢量预测(Alternative Temporal Motion VectorPrediction,ATMVP)方法允许每个CU从比并置参考图片中的当前CU小的多个块中提取多组运动信息。在时空运动矢量预测(Spatial-Temporal Motion Vector Prediction,STMVP)方法中,通过使用时间运动矢量预测器和空间相邻运动矢量来递归地推导子CU的运动矢量。
为了保留用于子CU运动预测的更准确的运动场,当前禁用参考帧的运动压缩。
2.2.1.1可选时间运动矢量预测
在可选时间运动矢量预测(ATMVP)方法中,通过从小于当前CU的块中提取多组运动信息(包括运动矢量和参考索引)来修改运动矢量时间运动矢量预测(TMVP)。如图10所示,子CU是方形N×N块(默认地将N设置为4)。
ATMVP以两个步骤预测CU内的子CU的运动矢量。第一步是利用所谓的时间矢量识别参考图片中的对应块。参考图片被称为运动源图片。第二步是将当前CU划分成子CU,并从对应于每个子CU的块中获得运动矢量以及每个子CU的参考索引,如图10所示。
在第一步骤中,由当前CU的空间相邻块的运动信息确定参考图片和对应块。为了避免相邻块的重复扫描过程,使用当前CU的Merge候选列表中的第一Merge候选。第一可用运动矢量及其相关联的参考索引被设置为时间矢量和运动源图片的索引。这样,在ATMVP中,与TMVP相比,可以更准确地识别对应块,其中对应块(有时称为并置块)总是相对于当前CU位于右下或中心位置。
在第二步骤中,通过向当前CU的坐标添加时间矢量,通过运动源图片中的时间矢量来识别子CU的对应块。对于每个子CU,其对应块(覆盖中心样本的最小运动网格)的运动信息用于推导子CU的运动信息。在识别出对应的N×N块的运动信息之后,以与HEVC的TMVP相同的方式将其转换为当前子CU的参考索引和运动矢量,其中运动缩放和其他过程也适用。例如,解码器校验是否满足低延迟条件(即,当前图片的所有参考图片的POC小于当前图片的POC)并且可能使用运动矢量MVx(对应于参考图片列表X的运动矢量)来预测每个子CU的运动矢量MVy(其中X等于0或1并且Y等于1-X)。
2.2.1.2时空运动矢量预测
在该方法中,按照光栅扫描顺序递归地推导子CU的运动矢量。图11示出了这个概念。让我们考虑包含四个4×4子CU A,B,C和D的8×8CU。当前帧中的相邻4×4块被标记为a,b,c和d。
子CU A的运动推导通过识别其两个空间邻居开始。第一邻居是子CU A上方的N×N块(块c)。如果该块c不可用或者是帧内编解码,则(从块c开始,从左到右)校验子CU A上方的其他N×N个块。第二邻居是子CU A左侧的块(块b)。如果块b不可用或者是帧内编解码,则(从块b开始,从上到下)校验子CU A左侧的其他块。从每个列表的相邻块获得的运动信息被缩放到给定列表的第一参考帧。接下来,通过遵循与HEVC中指定的TMVP推导相同的过程来推导子块A的时间运动矢量预测器(Temporal Motion Vector Predictor,TMVP)。提取位置D处的并置块的运动信息并对应地缩放。最后,在检索和缩放运动信息之后,对于每个参考列表,所有可用的运动矢量(最多3个)被分别平均。平均运动矢量被指定为当前子CU的运动矢量。
2.2.1.3子CU运动预测模式信令
子CU模式被启用为额外的Merge候选,并且不需要额外的语法元素来信号通知该模式。将两个额外的Merge候选添加到每个CU的Merge候选列表以表示ATMVP模式和STMVP模式。如果序列参数集指示启用了ATMVP和STMVP,则最多使用七个Merge候选。额外的Merge候选的编码逻辑与HM中的Merge候选相同,这意味着,对于P或B条带中的每个CU,两个额外的Merge候选需要另外两个RD校验。
在JEM中,所有Merge索引的二进位(bin)都由CABAC进行上下文编解码。而在HEVC中,仅第一个二进位是上下文编解码的,而剩余的二进位是上下文旁路编解码的。
2.2.2自适应运动矢量差分分辨率
在HEVC中,当条带报头中的use_integer_mv_flag等于0时,以四分之一亮度样本为单位信号通知(PU的运动矢量和预测运动矢量之间的)运动矢量差(Motion VectorDifference,MVD)。在JEM中,引入了局部自适应运动矢量分辨率(Locally AdaptiveMotion Vector Resolution,LAMVR)。在JEM中,MVD可以以四分之一亮度样本、整数亮度样本或四亮度样本为单位进行编解码。在编解码单元(CU)级控制MVD分辨率,并且对于具有至少一个非零MVD分量的每个CU有条件地信号通知MVD分辨率标志。
对于具有至少一个非零MVD分量的CU,信号通知第一标记以指示在CU中是否使用四分之一亮度样本MV精度。当第一标志(等于1)指示不使用四分之一亮度样本MV精度时,信号通知另一标志以指示是使用整数亮度样本MV精度还是四亮度样本MV精度。
当CU的第一MVD分辨率标志为零或未针对CU编解码(意味着CU中的所有MVD均为零)时,对于CU使用四分之一亮度样本MV分辨率。当CU使用整数亮度样本MV精度或四亮度样本MV精度时,CU的AMVP候选列表中的MVP被取整到对应的精度。
在编码器中,CU级RD校验用于确定将哪个MVD分辨率用于CU。即,对于每个MVD分辨率,执行三次CU级RD校验。为了加快编码器速度,在JEM中应用以下编码方案。
·在具有正常四分之一亮度样本MVD分辨率的CU的RD校验期间,存储当前CU的运动信息(整数亮度样本准确度)。存储的运动信息(在取整之后)被用作在RD校验期间针对具有整数亮度样本和4亮度样本MVD分辨率的相同CU的进一步小范围运动矢量细化的起点,使得耗时的运动估计过程不重复三次。
·有条件地调用具有4亮度样本MVD分辨率的CU的RD校验。对于CU,当RD成本整数亮度样本MVD分辨率远大于四分之一亮度样本MVD分辨率时,跳过针对CU的4亮度样本MVD分辨率的RD校验。
2.2.3更高的运动矢量存储准确度
在HEVC中,运动矢量准确度是四分之一像素(4:2:0视频的四分之一亮度样本和八分之一色度样本)。在JEM中,内部运动矢量存储和Merge候选的准确度增加到1/16像素。更高的运动矢量准确度(1/16像素)用于以跳过/Merge模式编解码的CU的运动补偿帧间预测。对于使用正常AMVP模式编解码的CU,使用整数像素或四分之一像素运动,如2.2.2节所述。
具有与HEVC运动补偿插值滤波器相同的滤波器长度和归一化因子的SHVC上采样插值滤波器被用作额外的分数像素位置的运动补偿插值滤波器。在JEM中色度分量运动矢量准确度是1/32样本,通过使用两个相邻的1/16像素分数位置的滤波器的平均来推导1/32像素分数位置的额外的插值滤波器。
2.2.4重叠块运动补偿
重叠块运动补偿(Overlapped Block Motion Compensation OBMC)先前已在H.263中使用。在JEM中,与H.263不同,可以使用CU级的语法来打开和关闭OBMC。当在JEM中使用OBMC时,除了CU的右边界和下边界之外,对所有运动补偿(Motion Compensation,MC)块边界执行OBMC。此外,它还应用于亮度和色度分量。在JEM中,MC块对应于编解码块。当用子CU模式(包括子CU Merge、仿射和FRUC模式)编解码CU时,CU的每个子块是MC块。为了以统一的方式处理CU边界,针对所有MC块边界以子块级执行OBMC,其中子块尺寸被设置为等于4×4,如图12所示。
当OBMC应用于当前子块时,除了当前运动矢量之外,四个连接的相邻子块的运动矢量(如果可用且与当前运动矢量不同)也用于推导当前子块的预测块。组合基于多个运动矢量的这些多个预测块以生成当前子块的最终预测信号。
将基于相邻子块的运动矢量的预测块表示为PN,其中N指示相邻的上、下、左和右子块的索引,并且将基于当前子块的运动矢量的预测块表示为PC。当PN是基于包含与当前子块相同的运动信息的相邻子块的运动信息时,不从PN执行OBMC。否则,将每个PN样本添加到PC中的相同样本中,即将PN的四行/列添加到PC。将加权因子{1/4,1/8,1/16,1/32}用于PN,并且将加权因子{3/4,7/8,15/16,31/32}用于PC。例外是小MC块(即,当编解码块的高度或宽度等于4或用子CU模式编解码CU时),对其仅将PN的两行/列添加到PC。在这种情况下,将加权因子{1/4,1/8}用于PN,并且将加权因子{3/4,7/8}用于PC。对于基于垂直(水平)相邻子块的运动矢量生成的PN,将PN的相同行(列)中的样本添加到具有相同加权因子的PC
在JEM中,对于尺寸小于或等于256个亮度样本的CU,信号通知CU级标志以指示是否对当前CU应用OBMC。对于尺寸超过256个亮度样本或未使用AMVP模式进行编解码的CU,默认应用OBMC。在编码器处,当将OBMC应用于CU时,在运动估计阶段期间考虑其影响。由OBMC使用上侧相邻块和左侧相邻块的运动信息形成的预测信号用于补偿当前CU的原始信号的上边界和左边界,然后应用正常运动估计处理。
2.2.5局部光照补偿
局部光照补偿(Local Illumination Compensation,LIC)是基于用于光照变化的线性模型,使用缩放因子a和偏移b。并且针对每个帧间模式编解码的编解码单元(CU)自适应地启用或禁用它。
当LIC应用于CU时,采用最小平方误差方法来通过使用当前CU的相邻样本及其对应的参考样本来推导参数a和b。更具体地,如图13所示,使用CU的子采样(2:1子采样)的相邻样本和参考图片中的(由当前CU或子CU的运动信息识别的)对应样本。推导IC参数并将其分别应用于每个预测方向。
当用Merge模式编解码CU时,以类似于Merge模式中的运动信息复制的方式从相邻块复制LIC标志;否则,向CU信号通知LIC标志以指示是否应用LIC。
当针对图片启用LIC时,需要额外的CU级RD校验以确定是否将LIC应用于CU。当为CU启用LIC时,分别针对整数像素运动搜索和分数像素运动搜索,使用去均值绝对差之和(Mean-Removed Sum Of Absolute Difference,MR-SAD)和去均值绝对哈达玛变换差之和(Mean-Removed Sum Of Absolute Hadamard-Transformed Difference,MR-SATD),而不是SAD和SATD。
为了降低编码复杂度,在JEM中应用以下编码方案。
当当前图片与其参考图片之间没有明显的光照变化时,对于整个图片禁用LIC。为了识别这种情况,在编码器处计算当前图片和当前图片的每个参考图片的直方图。如果当前图片与当前图片的每个参考图片之间的直方图差小于给定阈值,则对当前图片禁用LIC;否则,对当前图片启用LIC。
2.2.6仿射运动补偿预测
在HEVC中,仅将平移运动模型应用于运动补偿预测(Motion CompensationPrediction,MCP)。在现实世界中,存在多种运动,例如放大/缩小、旋转、透视运动和其他不规则运动。在JEM中,应用简化的仿射变换运动补偿预测。如图14所示,块的仿射运动场由两个控制点运动矢量描述。
块的运动矢量场(Motion Vector Field,MVF)由以下等式描述:
Figure GDA0003199999690000131
其中(v0x,v0y)是左上角控制点的运动矢量,(v1x,v1y)是右上角控制点的运动矢量。
为了进一步简化运动补偿预测,应用基于子块的仿射变换预测。子块尺寸M×N如等式2中推导,其中MvPre是运动矢量分数准确度(在JEM中是1/16),(v2x,v2y)是根据等式1计算的左下控制点的运动矢量。
Figure GDA0003199999690000132
在通过等式2推导之后,如果需要,应该向下调整M和N,以使其分别为w和h的除数。
为了推导每个M×N子块的运动矢量,根据等式1计算每个子块的中心样本的运动矢量,如图15所示,并取整到1/16分数准确度。然后,应用2.2.3节中提到的运动补偿插值滤波器,以利用所推导的运动矢量生成每个子块的预测。
在MCP之后,对每个子块的高准确度运动矢量进行取整,并将其以与正常运动矢量相同的准确度保存。
在JEM中,存在两种仿射运动模式:AF_INTER模式和AF_MERGE模式。对于宽度和高度都大于8的CU,可以应用AF_INTER模式。在比特流中用信号通知CU级的仿射标志以指示是否使用AF_INTER模式。在该模式中,使用相邻块构造具有运动矢量对{(v0,v1)|v0={vA,vB,vc},v1={vD,vE}}的候选列表。如图16所示,从块A、B或C的运动矢量中选择v0。根据参考列表以及用于相邻块的参考的POC、用于当前CU的参考的POC和当前CU的POC之间的关系来缩放来自相邻块的运动矢量。从相邻块D和E中选择v1的方法是类似的。如果候选列表的数量小于2,则由通过复制每个AMVP候选而组成的运动矢量对来填充列表。当候选列表大于2时,首先根据相邻运动矢量的一致性(候选对中的两个运动矢量的相似性)对候选进行排序,并且仅保留前两个候选。用RD成本校验来确定将哪个运动矢量对候选选择为当前CU的控制点运动矢量预测(Control Point Motion Vector Prediction,CPMVP)。并且在比特流中用信号通知指示候选列表中的CPMVP的位置的索引。在确定当前仿射CU的CPMVP之后,应用仿射运动估计并找到控制点运动矢量(Control Point Motion Vector,CPMV)。然后在比特流中用信号通知CPMV和CPMVP的差。
当在AF_MERGE模式中应用CU时,它从有效的相邻重建块获得用仿射模式编解码的第一个块。并且候选块的选择顺序是从左、上、右上、左下到左上,如图17A所示。如果相邻左下块A以仿射模式进行编解码,如图17B所示,推导包含块A的CU的左上角、右上角和左下角的运动矢量v2、v3和v4。并且根据v2、v3和v4计算当前CU左上角的运动矢量v0。其次,计算当前CU的右上方的运动矢量。
在推导出当前CU的CPMV v0和v1之后,根据简化的仿射运动模型等式1生成当前CU的MVF。为了识别当前CU是否以AF_MERGE模式进行编解码,当至少有一个相邻块以仿射模式进行编解码时,在比特流中用信号通知仿射标志。
2.2.7模式匹配的运动矢量推导
模式匹配的运动矢量推导(Pattern Matched Motion Vector Derivation,PMMVD)模式是基于帧速率上转换(Frame-Rate Up Conversion,FRUC)技术的特殊Merge模式。利用该模式,在解码器侧推导块的运动信息,而不是发信号通知块的运动信息。
当CU的Merge标志为真时,向CU信号通知FRUC标志。当FRUC标志为假时,信号通知Merge索引并使用常规Merge模式。当FRUC标志为真时,信号通知额外的FRUC模式标志以指示将使用哪种方法(双边匹配或模板匹配)来推导该块的运动信息。
在编码器侧,关于是否对CU使用FRUC Merge模式的决定是基于对正常Merge候选所做的RD成本选择。即,通过使用RD成本选择来校验CU的两种匹配模式(双边匹配和模板匹配)两者。引起最小成本的匹配模式与其他CU模式进一步比较。如果FRUC匹配模式是最有效的模式,则对于CU将FRUC标志设置为真,并且使用相关的匹配模式。
FRUC Merge模式中的运动推导过程具有两个步骤:首先执行CU级运动搜索,然后进行子CU级运动细化。在CU级,基于双边匹配或模板匹配,推导整个CU的初始运动矢量。首先,生成MV候选列表,并且选择引起最小匹配成本的候选作为进一步CU级细化的起点。然后,在起点附近执行基于的双边匹配或模板匹配的局部搜索,并且将最小匹配成本的MV结果作为整个CU的MV。随后,以推导的CU运动矢量作为起点,进一步在子CU级细化运动信息。
例如,对于W×H CU运动信息推导执行以下推导过程。在第一阶段,推导整个W×HCU的MV。在第二阶段,该CU进一步被划分成M×M个子CU。M的值的计算方法如(3)所示,D是预定义的划分深度,在JEM中默认设置为3。然后推导每个子CU的MV。
Figure GDA0003199999690000151
如图18所示,通过在两个不同参考图片中沿当前CU的运动轨迹找到两个块之间的最接近匹配,使用双边匹配来推导当前CU的运动信息。在连续运动轨迹的假设下,指向两个参考块的运动矢量MV0和MV1应当与当前图片和两个参考图片之间的时间距离(即TD0和TD1)成比例。作为特殊情况,当当前图片在时间上在两个参考图片之间并且从当前图片到两个参考图片的时间距离相同时,双边匹配成为基于镜像的双向MV。
如图19所示,模板匹配用于通过找到当前图片中的模板(当前CU的顶部和/或左侧相邻块)与参考图片中的块(与模板的尺寸相同)之间的最接近匹配来推导当前CU的运动信息。除了上述FRUC Merge模式之外,模板匹配也应用于AMVP模式。在JEM中,正如在HEVC中所做的那样,AMVP有两个候选。通过模板匹配方法,新的候选被推导出。如果由模板匹配新推导的候选与第一现有AMVP候选不同,则将其插入AMVP候选列表的最开始处,然后将列表尺寸设置为2(意味着移除第二现有AMVP候选)。当应用于AMVP模式时,仅应用CU级搜索。
2.2.8CU级MV候选集
在CU级处设置的MV候选包括:
(i)如果当前CU处于AMVP模式,则为原始AMVP候选
(ii)所有Merge候选,
(iii)在2.2.10节中介绍的插值MV场中的几个MV。
(iv)顶部和左侧相邻运动矢量
当使用双边匹配时,将Merge候选的每个有效MV用作输入,以生成假设双边匹配的情况下的MV对。例如,在参考列表A中,Merge候选的一个有效MV是(MVa,refa)。然后,在其他参考列表B中找到其配对的双边MV的参考图片refb,使得refa和refb在时间上位于当前图片的不同侧。如果这样的refb在参考列表B中不可用,则refb被确定为与refa不同的参考,并且其到当前图片的时间距离是列表B中的最小值。在确定refb之后,通过基于当前图片refa和refb之间的时间距离来缩放MVa来推导MVb。
来自插值MV场的四个MV也被添加到CU级候选列表。更具体地,添加当前CU的位置(0,0)、(W/2,0)、(0,H/2)和(W/2,H/2)处的插值MV。
当FRUC应用于AMVP模式时,原始AMVP候选也被添加到CU级MV候选集。
在CU级,对于AMVP CU,最多将15个MV添加到候选列表,对于MergeCU,最多将13个MV添加到候选列表。
2.2.9子CU级MV候选集
在子CU级处设置的MV候选包括:
(i)从CU级搜索确定的MV,
(ii)顶部、左侧、左上角和右上角的相邻MV,
(iii)来自参考图片的并置MV的缩放版本,
(iv)最多4个ATMVP候选,
(v)最多4个STMVP候选
来自参考图片的缩放MV如下推导。遍历两个列表中的所有参考图片。参考图片中的子CU的并置位置处的MV被缩放到起始CU级MV的参考。
ATMVP和STMVP候选仅限于前四个。
在子CU级,最多将17个MV添加到候选列表中。
2.2.10插值MV场的生成
在对帧进行编解码之前,基于单边ME为整个图片生成插值运动场。然后,运动场可以稍后用作CU级或子CU级MV候选。
首先,两个参考列表中的每个参考图片的运动场以4×4块级遍历。对于每个4×4块,如果与块相关联的运动通过当前图片中的4×4块(如图20所示)并且块未被分配任何插值运动,则参考块的运动根据时间距离TD0和TD1(以与HEVC中的TMVP的MV缩放的方式相同的方式)被缩放到当前图片,并且将缩放的运动分配给当前帧中的块。如果没有缩放的MV被分配给4×4块,则在插值运动场中将块的运动标记为不可用。
2.2.11插值和匹配成本
当运动矢量指向分数样本位置时,需要运动补偿插值。为了降低复杂度,替代常规8抽头HEVC插值,将双线性插值用于双边匹配和模板匹配。
匹配成本的计算在不同步骤处有点不同。当从CU级的候选集中选择候选时,匹配成本是双边匹配或模板匹配的绝对和差(Absolute Sum Difference,SAD)。在确定起始MV之后,子CU级搜索的双边匹配的匹配成本计算如下:
Figure GDA0003199999690000171
其中w是根据经验设置为4的加权因子,MV和MVs分别指示当前MV和起始MV。SAD仍用作子CU级搜索的模板匹配的匹配成本。
在FRUC模式中,仅通过使用亮度样本来推导MV。推导的运动将用于MC帧间预测的亮度和色度两者。在确定MV之后,使用用于亮度的8抽头插值滤波器和用于色度的4抽头插值滤波器来执行最终MC。
2.2.12MV细化
MV细化是基于模式的MV搜索,以双边匹配成本或模板匹配成本为标准。在JEM中,支持两种搜索模式—无限制中心偏置菱形搜索(Unrestricted Center-Biased DiamondSearch,UCBDS)和自适应交叉搜索,分别在CU级和子CU级进行MV细化。对于CU和子CU级MV细化两者,以四分之一亮度样本MV精度直接搜索MV,并且接着是八分之一亮度样本MV细化。将用于CU和子CU步骤的MV细化的搜索范围设置为等于8个亮度样本。
2.2.13模板匹配FRUC Merge模式中预测方向的选择
在双边匹配Merge模式中,始终应用双向预测,因为CU的运动信息是基于在两个不同的参考图片中沿当前CU的运动轨迹的两个块之间的最近匹配推导的。对于模板匹配Merge模式没有这样的限制。在模板匹配Merge模式中,编码器可以从列表0中的单向预测、列表1中的单向预测或双向预测当中为CU选择。选择基于如下的模板匹配成本:
如果costBi<=factor*min(cost0,cost1)
则使用双向预测;
否则,如果cost0<=cost1
则使用列表0中的单向预测;
否则,
使用列表1中的单向预测;
其中cost0是列表0模板匹配的SAD,cost1是列表1模板匹配的SAD,costBi是双向预测模板匹配的SAD。factor的值等于1.25,这意味着选择过程偏向于双向预测。
帧间预测方向选择仅应用于CU级模板匹配过程。
2.2.14双向光流
双向光流(Bi-directional Optical flow,BIO)是样本方式的运动细化,其在用于双向预测的逐块运动补偿之上执行。样本级运动细化不使用信令。
设I(k)为块运动补偿之后参考k(k=0,1)的亮度值,并且
Figure GDA0003199999690000181
分别为I(k)梯度的水平分量和垂直分量。假设光流是有效的,则运动矢量场(vx,vy)由下式给出:
Figure GDA0003199999690000182
将此光流等式与每个样本运动轨迹的埃尔米特插值相结合,得到唯一的三阶多项式,该三阶多项式最后匹配函数值I(k)和其导数
Figure GDA0003199999690000183
两者。该三阶多项式在t=0时的值是BIO预测:
Figure GDA0003199999690000184
这里,τ0和τ1表示到参考帧的距离,如图21所示。基于Ref0和Ref1的POC计算距离τ0和τ1:τ0=POC(当前)-POC(Ref0),τ1=POC(Ref1)-POC(当前)。如果两个预测都来自相同的时间方向(两者都来自过去或都来自未来),则sign是不同的即,τ0·τ1<0。在这种情况下,仅当预测不是来自相同的时刻(即,τ0≠τ1)时才应用BIO,两个参考区域都具有非零运动(MVx0,MVy0,MVx1,MVy1≠0)并且块运动矢量与时间距离成比例(MVx0/MVx1=MVy0/MVy1=-τ01)。
通过最小化点A和B(图9中的运动轨迹和参考帧平面的交叉)中的值之间的差Δ来确定运动矢量场(vx,vy)。模型仅使用Δ的局部泰勒展开的第一线性项:
Figure GDA0003199999690000191
等式7中的所有值都取决于样本位置(i′,j′),到目前为止,符号表示中省略了该样本位置。假设运动在局部周围区域是一致的,我们在以当前预测点为中心的(2M+1)×(2M+1)的方形窗口Ω内最小化Δ,其中M等于2:
Figure GDA0003199999690000192
对于该优化问题,JEM使用简化方法,首先在垂直方向上进行最小化,然后在水平方向上进行最小化。由此产生:
Figure GDA0003199999690000193
Figure GDA0003199999690000194
其中,
Figure GDA0003199999690000195
为了避免除以零或非常小的值,在等式9和10中引入正则化参数r和m。
r=500·4d-8 (12)
m=700·4d-8 (13)
这里d是视频样本的比特深度。
为了使BIO的存储器访问与常规双向预测运动补偿保持相同,仅针对当前块内的位置计算所有预测和梯度值I(k),
Figure GDA0003199999690000201
在等式11中,以在预测块的边界上的当前预测点为中心的(2M+1)×(2M+1)方形窗口Ω需要访问块外部的位置(如图22A所示)。在JEM中,将块外部的I(k),
Figure GDA0003199999690000202
的值设置为等于块内最近的可用值。例如,这可以实施为填充,如图22B所示。
利用BIO,可以针对每个样本细化运动场。为了降低计算复杂度,在JEM中使用基于块的BIO设计。基于4×4的块计算运动细化。在基于块的BIO中,聚合4×4的块中的所有样本的等式11中的sn的值,然后将sn的聚合值用于推导4×4块的BIO运动矢量偏移。更具体地,以下公式用于基于块的BIO推导:
Figure GDA0003199999690000203
其中bk表示属于预测块的第k个4×4块的样本集。将等式9和10中的sn替换为((sn,bk)>>4),以推导相关联的运动矢量偏移。
在一些情况下,由于噪音或不规则运动,BIO的MV团(MV regiment)可能不可靠。因此,在BIO中,MV团的尺寸被阈值thBIO截顶。基于当前图片的参考图片是否都来自一个方向来确定阈值。如果当前图片的所有参考图片都来自一个方向,则将阈值的值设置为12×214 -d;否则,将其设置为12×213-d
利用使用与HEVC运动补偿过程(2D可分离FIR)一致的操作的运动补偿插值来同时计算BIO的梯度。根据块运动矢量的分数部分,该2D可分离FIR的输入是与运动补偿过程和分数位置(fracX,fracY)相同的参考帧样本。在水平梯度
Figure GDA0003199999690000204
的情况下,首先使用与具有去缩放偏移d-8的分数位置fracY相对应的BIOfilterS垂直插值信号,然后在水平方向上应用梯度滤波器BIOfilterG,该BIOfilterG与具有去缩放偏移18-d的分数位置fracX相对应。在垂直梯度
Figure GDA0003199999690000205
的情况下,首先使用与具有去缩放偏移d-8的分数位置fracY相对应的BIOfilterG垂直应用梯度滤波器,然后在水平方向上使用BIOfilterS执行信号位移,该BIOfilterS与具有去缩放偏移18-d的分数位置fracX相对应。用于梯度计算的插值滤波器BIOfilterG和用于信号位移的插值滤波器BIOfilterS的长度较短(6抽头),以保持合理的复杂度。表1示出了用于BIO中块运动矢量的不同分数位置的梯度计算的滤波器。表2示出了用于BIO中预测信号生成的插值滤波器。
表1:用于BIO中梯度计算的滤波器
分数像素位置 梯度的插值滤波器(BIOfilterG)
0 {8,-39,-3,46,-17,5}
1/16 {8,-32,-13,50,-18,5}
1/8 {7,-27,-20,54,-19,5}
3/16 {6,-21,-29,57,-18,5}
1/4 {4,-17,-36,60,-15,4}
5/16 {3,-9,-44,61,-15,4}
3/8 {1,-4,-48,61,-13,3}
7/16 {0,1,-54,60,-9,2}
1/2 {-1,4,-57,57,-4,1}
表2:用于BIO中预测信号生成的插值滤波器
分数像素位置 预测信号的插值滤波器(BIOfilterS)
0 {0,0,64,0,0,0}
1/16 {1,-3,64,4,-2,0}
1/8 {1,-6,62,9,-3,1}
3/16 {2,-8,60,14,-5,1}
1/4 {2,-9,57,19,-7,2}
5/16 {3,-10,53,24,-8,2}
3/8 {3,-11,50,29,-9,2}
7/16 {3,-11,44,35,-10,3}
1/2 {3,-10,35,44,-11,3}
在JEM中,当两个预测来自不同的参考图片时,BIO应用于所有双预测块。当为CU启用LIC时,禁用BIO。
在JEM中,OBMC在正常MC过程之后应用于块。为了降低计算复杂性,在OBMC过程中不应用BIO。这意味着BIO仅在使用其自身的MV时才应用于块的MC过程,并且在OBMC过程中使用相邻块的MV时不应用于MC过程。
2.2.15解码器侧运动矢量细化
在双向预测操作中,对于一个块区域的预测,将分别使用list0的运动矢量(MV)和list1的MV形成的两个预测块进行组合以形成单个预测信号。在解码器侧运动矢量细化(Decoder-Side Motion Vector Refinement,DMVR)方法中,通过双边模板匹配过程进一步细化双向预测的两个运动矢量。双边模板匹配应用在解码器中,以在双边模板和参考图片中的重建样本之间执行基于失真的搜索,以便获得细化的MV而无需传输附加的运动信息。
在DMVR中,分别从列表0的初始MV0和列表1的MV1,将双边模板生成为两个预测块的加权组合(即平均),如图23所示。模板匹配操作包括计算所生成的模板与参考图片中的(在初始预测块周围的)样本区域之间的成本度量。对于两个参考图片中的每个,将产生最小模板成本的MV考虑为该列表的更新MV以替换原始MV。在JEM中,对每个列表搜索九个MV候选。该九个MV候选包括原始MV和8个与原始MV在水平或垂直方向上或两个方向上具有一个亮度样本偏移的环绕的MV。最后,将两个新的MV,即如图23中所示的MV0'和MV1',用于生成最终的双向预测结果。将绝对差之和(SAD)用作成本度量。请注意,当计算由一个环绕的MV生成的预测块的成本时,实际上使用取整的MV(到整数像素)而不是真实MV来获得预测块。
将DMVR应用于双向预测的Merge模式,其中一个MV来自过去的参考图片,另一MV来自未来的参考图片,而无需传输额外的语法元素。在JEM中,当对CU启用LIC、仿射运动、FRUC或子CU Merge候选时,不应用DMVR。
2.2.16示例实施例
公开了来降低DMVD方法的复杂度并提高编解码性能的示例方面。所公开的方法可以应用于现有的DMVD方法,但也可以应用于解码器侧的运动/模式推导的未来方法。
以下列举的示例提供了一些方式,通过这些方式,可以将所公开的技术体现到视频解码过程中。
1.在现有的DMVD方法中,仅考虑亮度分量来推导或细化运动矢量。然而,也可以考虑色度分量。用Ci表示给定运动矢量的三个颜色分量的成本(其中i指示颜色分量索引)。
a.最终成本被定义为Wi*Ci,其中Wi指示第i个颜色分量的权重。
b.可替代地,最终成本定义为(W0*C0+W1*(C1+C2))。在一些示例中,W0或W1等于1。
c.在一个示例中,当将DMVR应用于色度分量时,可以应用运动矢量的取整,使得可以利用整数运动矢量,并且不需要对色度分量应用插值。
d.在一个示例中,当将DMVR应用于色度分量时,如果需要插值,则可以应用较短抽头的插值滤波器(诸如双线性滤波器)。
2.上述方法可以应用于某些颜色分量或所有颜色分量。
a.可以将不同的规则应用于不同的颜色分量,或者亮度和色度分量可以利用不同的规则。例如,色度分量可以具有不同的权重W1和W2,W1和W2是不同的。作为另一示例,可以针对不同的亮度/色度分量不同地执行运动矢量的细化。
b.可替代地,可以在序列参数集、图片参数集、条带报头等中进一步信号通知如何以及是否应用上述方法。
图24是在视频解码的示例方法2400的流程图。方法2400包括,在操作2402处,使用一个或多个模板估计当前视频块的匹配成本。一个或多个模板中的每个包含亮度分量、第一色度分量C0和第二色度分量C1。方法2400包括,在操作2404处,使用具有最小匹配成本的模板来细化当前视频块的运动信息。
在一些实施例中,通过使用亮度、C0和C1的成本的加权和来确定给定模板的成本。在一些实施例中,对于亮度分量给定亮度权重W0,对于第一色度分量C0和第二色度分量C1给定色度权重W1。在一些实施例中,W0等于1。在一些实施例中,W1等于1。
在一些实施例中,对于亮度分量给定亮度权重W0,对于第一色度分量C0给定第一色度权重W1,并且对于第二色度分量C1给定第二色度权重W2。在一些实施例中,第一色度权重W1不同于第二色度权重W2。
在一些实施例中,该方法包括将解码器侧运动矢量细化应用于第一和第二色度分量中的至少一个。通过使用取整到整数精度的运动矢量生成模板来执行该细化。在一些实施例中。该方法包括将解码器侧运动矢量细化应用于第一和第二色度分量中的至少一个,其中通过应用具有短抽头的插值滤波器来生成模板。在一些实施例中,插值滤波器包含双线性滤波器。
在一些实施例中,比特流包含关于第一色度分量C0和第二色度分量C1的参数,用于估计模板的成本。在序列参数集、图片参数集或条带报头中用信号通知该参数。
图25示出了可用以实施本发明所公开的技术的各个部分的硬件设备2500的示例实施例的框图。硬件设备2500可以是笔记本电脑、智能手机、平板电脑、摄像机或能够处理视频的其他类型的设备。设备2500包括处理数据的处理器或控制器2502,以及与处理器2502通信、存储和/或缓冲数据的存储器2504。例如,处理器2502可以包括中央处理单元(Central Processing Unit,CPU)或微控制器单元(Microcontroller Unit,MCU)。在一些实施方式中,处理器2502可包含现场可编程门阵列(Field-Programmable Gate-Array,FPGA)。在一些实施方式中,设备2500包括或与图形处理单元(Graphics Processing Unit,GPU)、视频处理单元(Video Processing Unit,VPU)和/或无线通信单元通信,以实现智能手机设备的各种视觉和/或通信数据处理功能。例如,存储器2504可以包括并存储处理器可运行代码,该代码在由处理器2502运行时,将设备2500配置为执行各种操作,例如诸如接收信息、命令和/或数据,处理信息和数据,以及将处理过的信息/数据发送或提供给另一设备,诸如执行器或外部显示器。为了支持设备2500的各种功能,存储器2504可以存储信息和数据,诸如指令、软件、值、图像以及处理器2502处理或引用的其他数据。例如,可以使用各种类型的随机存取存储器(Random Access Memory,RAM)设备、只读存储器(Read OnlyMemory,ROM)设备、闪存设备和其他合适的存储介质来实施存储器2504的存储功能。设备2500还可以包括专用视频处理电路2506,用于执行重复计算功能,诸如变换和解码。
图26是示出视频编码器的示例实施方式的框图。视频编码器对使用诸如变换、运动估计和残差误差编解码的编解码工具编解码的视频图片进行操作。在编码器处对编码的视频帧进行重构(运动补偿),并将其用作用于其他视频图片的帧间编解码的参考图片。本文档中描述的技术可以由视频编码器或视频解码器使用诸如关于图25所描述的硬件平台来实施。
从前述内容可以理解,本文已经出于说明的目的描述了当前所公开的技术的具体实施例,但是在不脱离本发明的范围的情况下可以做出各种修改。因此,除了所附权利要求之外,当前所公开的技术不受限制。
本文档中描述的公开的和其他实施例、模块和功能性操作可以在数字电子电路中实施,或者在计算机软件、固件或硬件中实施,包括本文档中公开的结构及其结构等同物,或者以他们的一个或多个的组合实施。所公开的和其他实施例可以被实施为一个或多个计算机程序产品,即,在计算机可读介质上编码的一个或多个计算机程序指令模块,用于由数据处理装置运行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的合成、或者它们中的一个或多个的组合。术语“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或者多个处理器或计算机。除了硬件之外,装置可以包括为所讨论的计算机程序创建运行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统及其一个或多个的组合的代码。传播信号是人工生成的信号,例如机器生成的电信号、光信号或电磁信号,其被生成以对信息进行编码以便传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件相对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于所讨论的程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点或分布在多个站点并通过通信网络互连。
本文档中描述的处理和逻辑流可以由一个或多个可编程处理器执行,该一个或多个处理器运行一个或多个计算机程序,通过对输入数据进行操作并生成输出来执行功能。处理和逻辑流也可以由专用逻辑电路来执行,并且装置也可以实施为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适用于运行计算机程序的处理器包括通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或可操作地耦合到一个或多个大容量存储设备,以从其接收数据或向其传送数据,或两者兼有。然而,计算机不一定需要具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD ROM和DVD-ROM光盘。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文档包含许多细节,但不应将其解释为对任何发明或要求保护的范围的限制,而应解释为特定于特定发明的特定实施例的特征的描述。本专利文档在分离的实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独地实施,或在任何合适的子组合中实施。此外,虽然特征可以被描述为在某些组合中起作用,甚至最初这样要求保护,但在某些情况下,可以从要求保护的组合中删除组合中的一个或多个特征,并且要求保护的组合可以指向子组合或子组合的变体。
同样,尽管在附图中以特定顺序描述了操作,但这不应理解为要获得期望的结果必须按照所示的特定顺序或次序顺序来执行这些操作,或执行所有示出的操作。此外,本专利文档所述实施例中的各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,其他实施方式、增强和变体可以基于本专利文档中描述和说明的内容做出。

Claims (14)

1.一种对包括视频的数字表示的比特流进行解码的方法,包括:
使用一个或多个模板估计当前视频块的匹配成本,其中所述一个或多个模板中的每个包含亮度分量、第一色度分量C0和第二色度分量C1;以及
使用具有最小匹配成本的模板来细化所述当前视频块的运动信息,
所述方法还包括以下中的至少一个:
将解码器侧运动矢量细化应用于所述第一和第二色度分量中的至少一个,其中通过使用取整到整数精度的运动矢量生成所述模板来执行所述细化,或
将解码器侧运动矢量细化应用于所述第一和第二色度分量中的至少一个,其中通过应用具有短抽头的插值滤波器来生成所述模板,或
所述比特流包含关于所述第一色度分量C0和所述第二色度分量C1的参数,用于估计模板的成本。
2.如权利要求1所述的方法,其中通过使用亮度、C0和C1的成本的加权和来确定给定模板的成本。
3.如权利要求2所述的方法,其中对于所述亮度分量给定亮度权重W0,其中对于所述第一色度分量C0和所述第二色度分量C1给定色度权重W1。
4.如权利要求3所述的方法,其中W0等于1。
5.如权利要求3所述的方法,其中W1等于1。
6.如权利要求2所述的方法,其中对于所述亮度分量给定亮度权重W0,其中对于所述第一色度分量C0给定第一色度权重W1,并且其中对于所述第二色度分量C1给定第二色度权重W2。
7.如权利要求6所述的方法,其中所述第一色度权重W1不同于所述第二色度权重W2。
8.如权利要求1所述的方法,其中所述插值滤波器包含双线性滤波器。
9.如权利要求1所述的方法,其中所述参数在序列参数集中信号通知。
10.如权利要求1所述的方法,其中所述参数在图片参数集中信号通知。
11.如权利要求1所述的方法,其中所述参数在条带报头中信号通知。
12.一种视频解码装置,包括被配置为实施如权利要求1至11中的任一项所述的方法的处理器。
13.一种视频编码装置,包括被配置为实施如权利要求1至11中的任一项所述的方法的处理器。
14.一种计算机可读存储介质,其上存储有计算机代码,当所述计算机代码由处理器运行时,使所述处理器实施如权利要求1至11中的任一项所述的方法。
CN201910498116.5A 2018-06-07 2019-06-10 色度解码器侧运动矢量细化 Active CN110581999B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862682150P 2018-06-07 2018-06-07
US62/682,150 2018-06-07

Publications (2)

Publication Number Publication Date
CN110581999A CN110581999A (zh) 2019-12-17
CN110581999B true CN110581999B (zh) 2022-03-25

Family

ID=67402974

Family Applications (8)

Application Number Title Priority Date Filing Date
CN201910498106.1A Active CN110581998B (zh) 2018-06-07 2019-06-10 视频处理方法、装置和计算机可读记录介质
CN201910498138.1A Active CN110581992B (zh) 2018-06-07 2019-06-10 整数运动补偿
CN202210453849.9A Pending CN114827626A (zh) 2018-06-07 2019-06-10 子块解码器侧运动矢量细化
CN201910498697.2A Active CN110581997B (zh) 2018-06-07 2019-06-10 运动矢量精度细化
CN201910498694.9A Active CN110581996B (zh) 2018-06-07 2019-06-10 子块解码器侧运动矢量细化
CN201910498116.5A Active CN110581999B (zh) 2018-06-07 2019-06-10 色度解码器侧运动矢量细化
CN201910498122.0A Active CN110582000B (zh) 2018-06-07 2019-06-10 改进的模式匹配的运动矢量推导
CN201910498169.7A Active CN110581994B (zh) 2018-06-07 2019-06-10 部分成本计算

Family Applications Before (5)

Application Number Title Priority Date Filing Date
CN201910498106.1A Active CN110581998B (zh) 2018-06-07 2019-06-10 视频处理方法、装置和计算机可读记录介质
CN201910498138.1A Active CN110581992B (zh) 2018-06-07 2019-06-10 整数运动补偿
CN202210453849.9A Pending CN114827626A (zh) 2018-06-07 2019-06-10 子块解码器侧运动矢量细化
CN201910498697.2A Active CN110581997B (zh) 2018-06-07 2019-06-10 运动矢量精度细化
CN201910498694.9A Active CN110581996B (zh) 2018-06-07 2019-06-10 子块解码器侧运动矢量细化

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201910498122.0A Active CN110582000B (zh) 2018-06-07 2019-06-10 改进的模式匹配的运动矢量推导
CN201910498169.7A Active CN110581994B (zh) 2018-06-07 2019-06-10 部分成本计算

Country Status (8)

Country Link
US (3) US11159816B2 (zh)
EP (2) EP4351140A1 (zh)
JP (2) JP7096373B2 (zh)
KR (2) KR102605638B1 (zh)
CN (8) CN110581998B (zh)
GB (1) GB2589222B (zh)
TW (7) TWI727338B (zh)
WO (7) WO2019234672A1 (zh)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2588004B (en) 2018-06-05 2023-03-01 Beijing Bytedance Network Tech Co Ltd Interaction between IBC and affine
KR102605638B1 (ko) 2018-06-07 2023-11-22 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 부분 코스트 계산
WO2019244118A1 (en) 2018-06-21 2019-12-26 Beijing Bytedance Network Technology Co., Ltd. Component-dependent sub-block dividing
WO2019244117A1 (en) 2018-06-21 2019-12-26 Beijing Bytedance Network Technology Co., Ltd. Unified constrains for the merge affine mode and the non-merge affine mode
EP3817387A4 (en) * 2018-06-22 2021-07-07 Sony Corporation IMAGE PROCESSING DEVICE AND METHOD
WO2020003265A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Conditions of usage of luts
TWI728390B (zh) 2018-06-29 2021-05-21 大陸商北京字節跳動網絡技術有限公司 查找表尺寸
CN114900696A (zh) 2018-06-29 2022-08-12 抖音视界(北京)有限公司 Lut中的运动候选的检查顺序
EP3797516A1 (en) 2018-06-29 2021-03-31 Beijing Bytedance Network Technology Co. Ltd. Interaction between lut and amvp
WO2020003283A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Conditions for updating luts
KR102680903B1 (ko) 2018-06-29 2024-07-04 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Hmvp 후보를 병합/amvp에 추가할 때의 부분/풀 프루닝
CN110662059B (zh) 2018-06-29 2021-04-20 北京字节跳动网络技术有限公司 使用查找表存储先前编码的运动信息并用其编码后续块的方法和装置
BR112020024202A2 (pt) 2018-06-29 2021-02-17 Beijing Bytedance Network Technology Co., Ltd. método de processamento de dados de vídeo, aparelho de processamento de vídeo e meios de armazenamento e gravação legíveis por computador não transitório
TWI719519B (zh) 2018-07-02 2021-02-21 大陸商北京字節跳動網絡技術有限公司 對於dmvr的塊尺寸限制
TWI748202B (zh) 2018-07-02 2021-12-01 大陸商北京字節跳動網絡技術有限公司 Lamvr中取整和修剪的順序
WO2020053798A1 (en) 2018-09-12 2020-03-19 Beijing Bytedance Network Technology Co., Ltd. Conditions for starting checking hmvp candidates depend on total number minus k
CN117768651A (zh) 2018-09-24 2024-03-26 北京字节跳动网络技术有限公司 处理视频数据的方法、装置、介质、以及比特流存储方法
WO2020084476A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Sub-block based prediction
WO2020084554A1 (en) 2018-10-24 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Searching based motion candidate derivation for sub-block motion vector prediction
WO2020094151A1 (en) 2018-11-10 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Rounding in pairwise average candidate calculations
CN111630865B (zh) 2018-11-12 2023-06-27 北京字节跳动网络技术有限公司 广义双向预测模式的线缓冲器减少
JP7241870B2 (ja) 2018-11-20 2023-03-17 北京字節跳動網絡技術有限公司 部分的な位置に基づく差分計算
CN113170097B (zh) 2018-11-20 2024-04-09 北京字节跳动网络技术有限公司 视频编解码模式的编解码和解码
JP7319365B2 (ja) 2018-11-22 2023-08-01 北京字節跳動網絡技術有限公司 サブブロックに基づくインター予測のための調整方法
CN111263152B (zh) 2018-11-30 2021-06-01 华为技术有限公司 视频序列的图像编解码方法和装置
KR102648159B1 (ko) 2019-01-10 2024-03-18 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut 업데이트의 호출
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
WO2020147772A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Motion candidates derivation
CN113383548A (zh) 2019-02-03 2021-09-10 北京字节跳动网络技术有限公司 Mv精度和mv差编解码之间的相互作用
WO2020164580A1 (en) * 2019-02-14 2020-08-20 Beijing Bytedance Network Technology Co., Ltd. Size selective application of decoder side refining tools
US11190797B2 (en) * 2019-03-01 2021-11-30 Qualcomm Incorporated Constraints on decoder-side motion vector refinement based on weights for bi-predicted prediction
KR102635518B1 (ko) 2019-03-06 2024-02-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 변환된 단예측 후보의 사용
HRP20231053T1 (hr) * 2019-03-12 2024-02-02 Lg Electronics Inc. Postupak i uređaj za provođenje međupredviđanja na temelju dmvr i bdof
CN113574880B (zh) 2019-03-13 2023-04-07 北京字节跳动网络技术有限公司 关于子块变换模式的分割
CN113615193B (zh) 2019-03-22 2024-06-25 北京字节跳动网络技术有限公司 Merge列表构建和其他工具之间的交互
CN113647099B (zh) 2019-04-02 2022-10-04 北京字节跳动网络技术有限公司 解码器侧运动矢量推导
JP7414843B2 (ja) 2019-04-24 2024-01-16 バイトダンス インコーポレイテッド 符号化映像の量子化残差差分パルス符号変調表現
CN117857783A (zh) * 2019-05-01 2024-04-09 字节跳动有限公司 使用量化残差差分脉冲码调制编解码的帧内编解码视频
WO2020223612A1 (en) 2019-05-02 2020-11-05 Bytedance Inc. Signaling in transform skip mode
JP7288083B2 (ja) 2019-05-02 2023-06-06 バイトダンス インコーポレイテッド 符号化ツリー構造タイプに基づく符号化モード
CN114208184A (zh) 2019-08-13 2022-03-18 北京字节跳动网络技术有限公司 基于子块的帧间预测中的运动精度
US11736720B2 (en) * 2019-09-03 2023-08-22 Tencent America LLC Motion vector refinement methods for video encoding
WO2021052504A1 (en) 2019-09-22 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Scaling method for sub-block based inter prediction
CN111050182B (zh) * 2019-12-27 2022-02-18 浙江大华技术股份有限公司 运动矢量的预测方法、视频编码方法及相关设备、装置
US12113987B2 (en) * 2020-12-22 2024-10-08 Qualcomm Incorporated Multi-pass decoder-side motion vector refinement
CN113014925B (zh) * 2021-01-27 2022-08-23 重庆邮电大学 一种h.266/vvc帧间编码cu快速划分方法及存储介质
US11671616B2 (en) 2021-03-12 2023-06-06 Lemon Inc. Motion candidate derivation
US11936899B2 (en) * 2021-03-12 2024-03-19 Lemon Inc. Methods and systems for motion candidate derivation
EP4320860A1 (en) * 2021-04-09 2024-02-14 InterDigital CE Patent Holdings, SAS Intra block copy with template matching for video encoding and decoding
CN117426095A (zh) * 2021-06-04 2024-01-19 抖音视界有限公司 用于视频处理的方法、设备和介质
WO2022253320A1 (en) * 2021-06-04 2022-12-08 Beijing Bytedance Network Technology Co., Ltd. Method, device, and medium for video processing
CN117957837A (zh) * 2021-07-14 2024-04-30 抖音视界有限公司 用于视频处理的方法、装置和介质
EP4388744A1 (en) * 2021-08-19 2024-06-26 MediaTek Singapore Pte. Ltd. Using template matching for refining candidate selection
CN118285098A (zh) * 2021-11-22 2024-07-02 抖音视界有限公司 用于视频处理的方法、装置和介质
WO2023088472A1 (en) * 2021-11-22 2023-05-25 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2023202569A1 (en) * 2022-04-19 2023-10-26 Mediatek Inc. Extended template matching for video coding
US20240137552A1 (en) * 2022-10-10 2024-04-25 Tencent America LLC Method and apparatus for extended decoder side motion vector refinement
EP4383717A1 (en) * 2022-12-09 2024-06-12 Comcast Cable Communications LLC Coding unit prediction using template matching costs
WO2024211098A1 (en) * 2023-04-03 2024-10-10 Google Llc Sub-block based motion vector refinement

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104780383A (zh) * 2015-02-02 2015-07-15 杭州电子科技大学 一种3d-hevc多分辨率视频编码方法

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5661524A (en) * 1996-03-08 1997-08-26 International Business Machines Corporation Method and apparatus for motion estimation using trajectory in a digital video encoder
US5987180A (en) * 1997-09-26 1999-11-16 Sarnoff Corporation Multiple component compression encoder motion search method and apparatus
US6876703B2 (en) * 2000-05-11 2005-04-05 Ub Video Inc. Method and apparatus for video coding
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US7720151B2 (en) * 2003-02-11 2010-05-18 Texas Instruments Incorporated Motion estimation using early decision for goodness of estimation with quick convergence feedback
US7145950B2 (en) * 2003-07-14 2006-12-05 Primax Electronics Ltd. Method of motion vector determination in digital video compression
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7627037B2 (en) 2004-02-27 2009-12-01 Microsoft Corporation Barbell lifting for multi-layer wavelet coding
GB0500174D0 (en) * 2005-01-06 2005-02-16 Kokaram Anil Method for estimating motion and occlusion
EP1835749A1 (en) 2006-03-16 2007-09-19 THOMSON Licensing Method for coding video data of a sequence of pictures
WO2007124491A2 (en) * 2006-04-21 2007-11-01 Dilithium Networks Pty Ltd. Method and system for video encoding and transcoding
US8428118B2 (en) * 2006-08-17 2013-04-23 Ittiam Systems (P) Ltd. Technique for transcoding MPEG-2/MPEG-4 bitstream to H.264 bitstream
US8553758B2 (en) * 2007-03-02 2013-10-08 Sony Corporation Motion parameter engine for true motion
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
US9225996B2 (en) * 2007-12-19 2015-12-29 Vixs Systems, Inc. Motion refinement engine with flexible direction processing and methods for use therewith
US8228990B2 (en) * 2008-01-16 2012-07-24 Sony Corporation Template matching scheme using multiple predictors as candidates for intra-prediction
CN101965733B (zh) * 2008-03-09 2013-08-07 Lg电子株式会社 用于编码或解码视频信号的方法和设备
US8520731B2 (en) * 2009-06-05 2013-08-27 Cisco Technology, Inc. Motion estimation for noisy frames based on block matching of filtered blocks
US8638395B2 (en) * 2009-06-05 2014-01-28 Cisco Technology, Inc. Consolidating prior temporally-matched frames in 3D-based video denoising
CN105263020B (zh) * 2009-08-12 2019-05-03 汤姆森特许公司 用于改进的帧内色度编码和解码的方法及装置
TWI566586B (zh) * 2009-10-20 2017-01-11 湯姆生特許公司 一序列形象的現時區塊之寫碼方法和重建方法
KR101036552B1 (ko) * 2009-11-02 2011-05-24 중앙대학교 산학협력단 적응적 탐색 영역 및 부분 정합 오차 기반의 고속 움직임 추정 장치 및 방법
US20110176611A1 (en) 2010-01-15 2011-07-21 Yu-Wen Huang Methods for decoder-side motion vector derivation
CN102823249B (zh) * 2010-02-09 2016-07-06 日本电信电话株式会社 运动向量预测编码方法、运动向量预测解码方法、活动图像编码装置、活动图像解码装置
US8976873B2 (en) * 2010-11-24 2015-03-10 Stmicroelectronics S.R.L. Apparatus and method for performing error concealment of inter-coded video frames
US9380314B2 (en) * 2010-12-20 2016-06-28 Texas Instruments Incorporated Pixel retrieval for frame reconstruction
KR101422422B1 (ko) * 2010-12-21 2014-07-23 인텔 코오퍼레이션 Dmvd 처리 향상을 위한 시스템 및 방법
US8755437B2 (en) * 2011-03-17 2014-06-17 Mediatek Inc. Method and apparatus for derivation of spatial motion vector candidate and motion vector prediction candidate
CN102710934B (zh) * 2011-01-22 2015-05-06 华为技术有限公司 一种运动预测或补偿方法
US9549182B2 (en) 2012-07-11 2017-01-17 Qualcomm Incorporated Repositioning of prediction residual blocks in video coding
US20140286408A1 (en) 2012-09-28 2014-09-25 Intel Corporation Inter-layer pixel sample prediction
US10764592B2 (en) 2012-09-28 2020-09-01 Intel Corporation Inter-layer residual prediction
US9294777B2 (en) 2012-12-30 2016-03-22 Qualcomm Incorporated Progressive refinement with temporal scalability support in video coding
US9521425B2 (en) 2013-03-19 2016-12-13 Qualcomm Incorporated Disparity vector derivation in 3D video coding for skip and direct modes
US9667996B2 (en) 2013-09-26 2017-05-30 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC
US9762927B2 (en) 2013-09-26 2017-09-12 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC
US10531116B2 (en) * 2014-01-09 2020-01-07 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
US10484721B2 (en) * 2014-03-17 2019-11-19 Qualcomm Incorporated Method for motion estimation of non-natural video data
JPWO2015166639A1 (ja) * 2014-04-28 2017-04-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化方法、復号方法、符号化装置および復号装置
US11330284B2 (en) * 2015-03-27 2022-05-10 Qualcomm Incorporated Deriving motion information for sub-blocks in video coding
EP3314894B1 (en) * 2015-06-25 2024-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Refinement of a low-pel resolution motion estimation vector
MY197611A (en) * 2015-09-25 2023-06-28 Huawei Tech Co Ltd Apparatus and method for video motion compensation
US10602191B2 (en) * 2016-05-13 2020-03-24 Gopro, Inc. Apparatus and methods for video compression
CN115118970A (zh) * 2016-05-13 2022-09-27 Vid拓展公司 用于视频编码的通用式多假设预测的系统及方法
MX2018014487A (es) * 2016-05-25 2019-08-12 Arris Entpr Llc Prediccion angular ponderada para intra codificacion.
US10944963B2 (en) 2016-05-25 2021-03-09 Arris Enterprises Llc Coding weighted angular prediction for intra coding
EP3264768A1 (en) * 2016-06-30 2018-01-03 Thomson Licensing Method and apparatus for video coding with adaptive motion information refinement
US11638027B2 (en) 2016-08-08 2023-04-25 Hfi Innovation, Inc. Pattern-based motion vector derivation for video coding
US10880570B2 (en) * 2016-10-05 2020-12-29 Qualcomm Incorporated Systems and methods of adaptively determining template size for illumination compensation
US10750203B2 (en) 2016-12-22 2020-08-18 Mediatek Inc. Method and apparatus of adaptive bi-prediction for video coding
WO2018121506A1 (en) 2016-12-27 2018-07-05 Mediatek Inc. Method and apparatus of bilateral template mv refinement for video coding
EP3343925A1 (en) * 2017-01-03 2018-07-04 Thomson Licensing Method and apparatus for encoding and decoding motion information
US20180199057A1 (en) 2017-01-12 2018-07-12 Mediatek Inc. Method and Apparatus of Candidate Skipping for Predictor Refinement in Video Coding
US10701366B2 (en) 2017-02-21 2020-06-30 Qualcomm Incorporated Deriving motion vector information at a video decoder
US10523964B2 (en) * 2017-03-13 2019-12-31 Qualcomm Incorporated Inter prediction refinement based on bi-directional optical flow (BIO)
US10602180B2 (en) 2017-06-13 2020-03-24 Qualcomm Incorporated Motion vector prediction
WO2019001741A1 (en) 2017-06-30 2019-01-03 Huawei Technologies Co., Ltd. MOTION VECTOR REFINEMENT FOR MULTI-REFERENCE PREDICTION
EP3451664A1 (en) * 2017-09-01 2019-03-06 Thomson Licensing Motion compensation at a finer precision than motion vector differential
CN107483960B (zh) * 2017-09-15 2020-06-02 信阳师范学院 一种基于空间预测的运动补偿帧率上转换方法
US10785494B2 (en) * 2017-10-11 2020-09-22 Qualcomm Incorporated Low-complexity design for FRUC
US11750832B2 (en) * 2017-11-02 2023-09-05 Hfi Innovation Inc. Method and apparatus for video coding
WO2019107916A1 (ko) 2017-11-30 2019-06-06 엘지전자 주식회사 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치
WO2019190224A1 (ko) * 2018-03-30 2019-10-03 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
US20190306502A1 (en) 2018-04-02 2019-10-03 Qualcomm Incorporated System and method for improved adaptive loop filtering
US10779002B2 (en) 2018-04-17 2020-09-15 Qualcomm Incorporated Limitation of the MVP derivation based on decoder-side motion vector derivation
US10469869B1 (en) 2018-06-01 2019-11-05 Tencent America LLC Method and apparatus for video coding
KR102605638B1 (ko) 2018-06-07 2023-11-22 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 부분 코스트 계산
TWI719519B (zh) 2018-07-02 2021-02-21 大陸商北京字節跳動網絡技術有限公司 對於dmvr的塊尺寸限制
WO2020084461A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Restrictions on decoder side motion vector derivation based on coding information
CN112889284A (zh) 2018-10-22 2021-06-01 北京字节跳动网络技术有限公司 基于子块的解码器侧运动矢量推导
MX2021004715A (es) 2018-11-05 2021-06-04 Beijing Bytedance Network Tech Co Ltd Interpolacion para interprediccion con refinamiento.
JP2022547599A (ja) 2019-09-12 2022-11-14 アリババ グループ ホウルディング リミテッド 映像符号化情報をシグナリングするための方法及び装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104780383A (zh) * 2015-02-02 2015-07-15 杭州电子科技大学 一种3d-hevc多分辨率视频编码方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
An optimal quad-tree-based motion estimator;Schuster G M et al;《Visual communications and image processing》;20040120;第5章节 *
Description of SDR, HDR and 360°video coding technology proposal by huawei, GoPro, HiSilicon, and Samsung;Chen H et al;《10 JVET meeting》;20180414;第3.1.4.9.1章节 *
Te1: RETH partner report on DMVD;Wien M et al;《2 JCT-VC meeting》;20100723;第2.1.1、2.1.3章节 *

Also Published As

Publication number Publication date
JP7417670B2 (ja) 2024-01-18
TW202013979A (zh) 2020-04-01
US11159816B2 (en) 2021-10-26
CN110581996B (zh) 2022-03-25
TWI736907B (zh) 2021-08-21
GB202018865D0 (en) 2021-01-13
TW202002637A (zh) 2020-01-01
CN110581992B (zh) 2022-06-14
WO2019234673A1 (en) 2019-12-12
TWI718555B (zh) 2021-02-11
US20200374543A1 (en) 2020-11-26
CN110581999A (zh) 2019-12-17
GB2589222B (en) 2023-01-25
CN110582000A (zh) 2019-12-17
KR20230161539A (ko) 2023-11-27
KR102605638B1 (ko) 2023-11-22
CN114827626A (zh) 2022-07-29
KR20210018896A (ko) 2021-02-18
EP4351140A1 (en) 2024-04-10
WO2019234669A1 (en) 2019-12-12
TWI707579B (zh) 2020-10-11
TWI736906B (zh) 2021-08-21
TW202013967A (zh) 2020-04-01
US20200374544A1 (en) 2020-11-26
WO2019234674A1 (en) 2019-12-12
CN110581998A (zh) 2019-12-17
WO2019234671A1 (en) 2019-12-12
WO2019234676A1 (en) 2019-12-12
TWI727338B (zh) 2021-05-11
TWI736905B (zh) 2021-08-21
CN110581992A (zh) 2019-12-17
TW202005383A (zh) 2020-01-16
CN110581998B (zh) 2023-04-14
JP2022123085A (ja) 2022-08-23
US20220030265A1 (en) 2022-01-27
CN110581994A (zh) 2019-12-17
TW202002652A (zh) 2020-01-01
TW202013966A (zh) 2020-04-01
GB2589222A (en) 2021-05-26
TW202019180A (zh) 2020-05-16
EP3788788A1 (en) 2021-03-10
CN110581994B (zh) 2022-07-19
WO2019234672A1 (en) 2019-12-12
JP7096373B2 (ja) 2022-07-05
US12075084B2 (en) 2024-08-27
CN110582000B (zh) 2022-03-25
WO2019234668A1 (en) 2019-12-12
JP2021528896A (ja) 2021-10-21
CN110581997B (zh) 2021-10-12
TWI711299B (zh) 2020-11-21
CN110581996A (zh) 2019-12-17
CN110581997A (zh) 2019-12-17

Similar Documents

Publication Publication Date Title
CN110581999B (zh) 色度解码器侧运动矢量细化
CN110620932B (zh) 依赖模式的运动矢量差精度集
CN113597766B (zh) 基于光流的预测细化的计算
CN110891174B (zh) 不同视频块尺寸的仿射模式计算
CN111147855A (zh) 几何分割预测模式与其他工具之间的协调
CN113302918A (zh) 视频编解码中的加权预测
CN110662055B (zh) 扩展Merge模式
CN113316933A (zh) 使用运动预测进行去方块滤波
CN110677674B (zh) 视频处理的方法、设备和非暂时性计算机可读介质
CN111010570B (zh) 基于仿射运动信息的尺寸限制
CN113557720A (zh) 视频编解码中的多假设预测当中的自适应权重

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant