RU2613722C1 - Внутреннее предсказание с низкой сложностью для кодирования видеосигнала - Google Patents
Внутреннее предсказание с низкой сложностью для кодирования видеосигнала Download PDFInfo
- Publication number
- RU2613722C1 RU2613722C1 RU2015141279A RU2015141279A RU2613722C1 RU 2613722 C1 RU2613722 C1 RU 2613722C1 RU 2015141279 A RU2015141279 A RU 2015141279A RU 2015141279 A RU2015141279 A RU 2015141279A RU 2613722 C1 RU2613722 C1 RU 2613722C1
- Authority
- RU
- Russia
- Prior art keywords
- array
- prediction
- pixels
- boundary pixels
- target block
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 76
- 230000008569 process Effects 0.000 claims abstract description 67
- 238000005070 sampling Methods 0.000 abstract description 3
- 239000000126 substance Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 11
- 101100446506 Mus musculus Fgf3 gene Proteins 0.000 description 9
- 238000013139 quantization Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 241000023320 Luma <angiosperm> Species 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности кодирования видеосигнала. Способ кодирования видео, в котором выполняют на основе информации вида предсказания либо первый процесс, включающий: выборку по меньшей мере некоторых из пикселов из массива вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока; добавление выбранных пикселов к массиву горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока, вдоль направления массива горизонтальных граничных пикселов, с целью расширения массива горизонтальных граничных пикселов; и выполнение внутреннего предсказания на основе расширенного массива горизонтальных граничных пикселов, либо второй процесс, включающий: выборку по меньшей мере некоторых из пикселов из массива горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока; добавление выбранных пикселов к массиву вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока, вдоль направления массива вертикальных граничных пикселов, с целью расширения массива вертикальных граничных пикселов; и выполнение внутреннего предсказания на основе расширенного массива вертикальных граничных пикселов. 4 н. и 2 з.п. ф-лы, 15 ил., 3 табл.
Description
УРОВЕНЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ
Область техники
[0001] Настоящее изобретение относится к кодированию видеосигнала и, в частности, к внутрикадровому предсказанию, в котором блок выборки предсказывается с использованием ранее кодированных и реконструированных пикселов из того же видеокадра.
Сведения из уровня техники
[0002] Цифровой видеосигнал требует большого количества данных для всех без исключения кадров цифровой видеопоследовательности (например, ряда кадров) в несжатом виде. Для большинства приложений передача несжатого цифрового видеосигнала через компьютерные сети невыполнима по причине ограничений полосы пропускания. Кроме того, несжатый цифровой видеосигнал требует большого объема памяти в запоминающем устройстве. Обычно цифровой видеосигнал некоторым образом кодируется с целью снижения потребности в памяти и снижения требований к полосе пропускания.
[0003] Одним из способов кодирования цифрового видеосигнала является межкадровое, или внешнее, предсказание. Внешнее предсказание эксплуатирует временные избыточности между разными кадрами. Смежные по времени кадры видеосигнала, как правило, включают блоки пикселов, которые остаются, в значительной мере, неизменными. В ходе процесса кодирования вектор движения связывает движение блока пикселов в одном кадре с блоком сходных пикселов в другом кадре. Соответственно, система не требует кодирования блока пикселов дважды, но вместо этого кодирует блок пикселов один раз и создает вектор движения, предназначенный для предсказания другого блока пикселов.
[0004] Другим способом кодирования цифрового видеосигнала является внутрикадровое, или внутреннее, предсказание. Внутреннее предсказание кодирует кадр, или его часть, без привязки к пикселам в других кадрах. Внутреннее предсказание эксплуатирует пространственные избыточности между блоками пикселов в пределах кадра. Поскольку смежные в пространстве блоки пикселов, в общем, имеют сходные признаки, эффективность процесса кодирования увеличивается путем привязки к пространственной корреляции между смежными блоками. Эта корреляция может эксплуатироваться путем предсказания целевого блока на основе видов предсказания, использованных в смежных блоках.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0005] Настоящее изобретение предусматривает оригинальный процесс внутреннего предсказания, который увеличивает эффективность кодирования видеосигнала. H.264/AVC использует опорные пикселы на горизонтальной границе, расположенные непосредственно над целевым блоком, который требуется предсказать, и опорные пикселы на вертикальной границе, расположенные непосредственно слева от целевого блока. В настоящем изобретении отыскиваются и выбираются, по меньшей мере, некоторые пикселы или из массива горизонтальных граничных пикселов, или из массива вертикальных граничных пикселов. Затем отысканные и выбранные пикселы добавляются к другим граничным пикселам с целью расширения их массива. Внутреннее предсказание выполняется единственно на основе расширенного массива граничных пикселов. В одном из вариантов осуществления настоящего изобретения, по меньшей мере, некоторые из вертикальных граничных пикселов отыскиваются, выбираются и добавляются к горизонтальным граничным пикселам с целью расширения их массива.
[0006] Настоящее изобретение исключает процесс принятия решения при выборе или горизонтальной границы, или вертикальной границы, на которой отыскиваются и выбираются опорные пикселы. Настоящее изобретение также исключает повторяющийся процесс вычисления положения пересечения вертикальной границы с направлением предсказания, где повторяющийся процесс вычисления, как правило, включает в себя операцию деления. Исключение этих процессов позволяет реализовывать процесс внутреннего предсказания на архитектурах с одним потоком команд и несколькими потоками данных (SIMD), что, таким образом, повышает вычислительную эффективность кодирования видеосигнала.
[0007] В одном из вариантов осуществления настоящего изобретения, по меньшей мере, некоторые из пикселов среди вертикальных граничных пикселов отыскиваются и выбираются с использованием идентификатора вертикальных пикселов, который выражается как:
где size представляет размер целевого блока, который требуется предсказать, angle представляет направление предсказания, и col - счетчик, который уменьшается на 1 от -1 до angle. Отысканные и выбранные пикселы добавляются к горизонтальным пикселам в положение, которое идентифицируется идентификатором горизонтальных пикселов [col].
[0008] В другом варианте осуществления изобретения при отыскании и выборке, по меньшей мере, некоторых из вертикальных граничных пикселов InvAngle вычисляется из:
где N - целочисленная степень числа 2. Затем, по меньшей мере, некоторые из пикселов среди вертикальных граничных пикселов выбираются с использованием идентификатора вертикальных пикселов, который выражается как Выбранные пикселы добавляются к горизонтальным пикселам в положение, которое идентифицируется идентификатором горизонтальных пикселов [col].
[0009] В другом варианте осуществления изобретения InvAngle получается из справочной таблицы, где перечислены значения InvAngle в зависимости от значений angle.
[0010] В другом варианте осуществления изобретения пиксел идентифицируется среди вертикальных граничных пикселов с использованием идентификатора вертикальных пикселов [row], где row - счетчик, который увеличивается на 1 от 0 до size. Выбранный пиксел добавляется к горизонтальным граничным пикселам в положение, которое идентифицируется идентификатором горизонтальных пикселов [int +1], где int - целочисленное представление положения пиксела, пересекающегося с направлением предсказания.
[0011] Настоящее изобретение также предусматривает кодер и декодер, которые реализуют операцию внутреннего предсказания, в которой выбираются, по меньшей мере, некоторые пикселы или из массива горизонтальных граничных пикселов, или из массива вертикальных граничных пикселов. Затем выбранные пикселы добавляются к другим граничным пикселам с целью расширения их массива. Внутреннее предсказание выполняется исключительно на основе расширенного массива граничных пикселов.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
[0012] ФИГ.1 - блок-схема, показывающая пример архитектуры аппаратного обеспечения, в которой может быть реализовано настоящее изобретение.
[0013] ФИГ.2 - блок-схема, показывающая общий вид видеокодера, к которому может быть применено настоящее изобретение.
[0014] ФИГ.3 - блок-схема, показывающая общий вид видеодекодера, к которому может быть применено настоящее изобретение.
[0015] ФИГ.4 - блок-схема, показывающая функциональные модули кодера согласно одному из вариантов осуществления настоящего изобретения.
[0016] ФИГ.5 - схема последовательности операций, показывающая процесс внутреннего предсказания, выполняемый модулем внутреннего предсказания согласно варианту осуществления настоящего изобретения.
[0017] ФИГ.6 - блок-схема, показывающая функциональные модули декодера согласно одному из вариантов осуществления настоящего изобретения.
[0018] ФИГ.7 - диаграмма, показывающая направления предсказания, иллюстрирующие виды предсказания Intra_4×4, поддерживаемые H.264/AVC.
[0019] ФИГ.8 - диаграмма, показывающая направления предсказания, предложенные в Документе №JCT-VC A119.
[0020] ФИГ.9 - схема последовательности операций, показывающая процесс, предложенный в JCT-VC A119 для генерирования предсказываемого блока по одному из направлений предсказания, показанных на ФИГ.7.
[0021] ФИГ.10 - схема последовательности операций, показывающая процесс внутреннего предсказания с низкой сложностью, выполняемый в соответствии с одним из вариантов осуществления настоящего изобретения.
[0022] ФИГ.11А - схематический вид, показывающий блок предсказания и массивы горизонтальных и вертикальных граничных пикселов.
[0023] ФИГ.11В - схематический вид, показывающий массив горизонтальных граничных пикселов, расширенный вертикальными граничными пикселами.
[0024] ФИГ.12 - схема последовательности операций, показывающая процесс расширения массива горизонтальных граничных пикселов, выполняемый в соответствии с одним из вариантов осуществления настоящего изобретения.
[0025] ФИГ.13 - схема последовательности операций, показывающая другой вариант осуществления расширения массива горизонтальных граничных пикселов.
[0026] ФИГ.14 - схема последовательности операций, показывающая процесс внутреннего предсказания с низкой сложностью, выполняемый согласно еще одному из вариантов осуществления настоящего изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ И ПРЕДПОЧТИТЕЛЬНЫХ В НАСТОЯЩЕЕ ВРЕМЯ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
[0027] ФИГ.1 показывает пример архитектуры аппаратного обеспечения компьютера 100, на котором может быть реализовано настоящее изобретение. Следует отметить, что архитектура аппаратного обеспечения, показанная на ФИГ.1, может быть общей и для видеодекодера, и для видеодекодера, которые реализуют варианты осуществления настоящего изобретения. Компьютер 100 включает в себя процессор 101, память 102, устройство 105 хранения данных и одно или несколько устройств 106 (или периферийных устройств) ввода и/или вывода (I/O), которые коммуникативно связаны через локальный интерфейс 107. Локальный интерфейс 105 может, в качестве неограничивающих примеров, представлять собой одну или несколько шин или других проводных или беспроводных соединений, известных в данной области техники.
[0028] Процессор 101 представляет собой аппаратное устройство, предназначенное для исполнения программного обеспечения, в частности, хранящегося в памяти 102. Процессор 101 может представлять собой любой изготовленный на заказ или выпускаемый серийно процессор, центральный процессор (CPU), вспомогательный процессор среди нескольких процессоров, связанных с компьютером 100, микропроцессор на полупроводниковой основе (в форме микросхемы или набора микросхем), или, в общем, любое устройство, предназначенное для исполнения команд программного обеспечения.
[0029] Память 102 включает в себя компьютерно-читаемый носитель данных, который может включать любой из элементов энергозависимой памяти (например, памяти с произвольным доступом (RAM, как, например, DRAM, SRAM, SDRAM и т.д.)) и элементов энергонезависимой памяти (например, ROM, накопитель на жестких дисках, ленту, CDROM и т.д.) или их комбинацию. Кроме того, память 102 может включать электронные, магнитные, оптические и/или другие типы носителей данных. Компьютерно-читаемый носитель данных может представлять собой любые средства, которые могут хранить, сообщать, распространять или передавать программу для использования системой, блоком или устройством исполнения команд или в связи с ними. Следует отметить, что память 102 имеет распределенную архитектуру, где различные компоненты располагаются удаленно один от другого, но могут быть доступны для процессора 101.
[0030] Программное обеспечение 103 в памяти 102 может включать одну или несколько отдельных программ, каждая из которых содержит упорядоченный список исполняемых команд, предназначенных для реализации логических функций компьютера 100, как описывается ниже. В примере по ФИГ.1 программное обеспечение 103 в памяти 102 определяет функциональную возможность компьютера 100 кодировать видеосигнал или декодировать видеосигнал согласно настоящему изобретению. Кроме того, хотя это и не требуется, память 102 может содержать операционную систему (O/S) 104. Операционная система 104, по существу, управляет исполнением компьютерных программ и обеспечивает диспетчеризацию, управление вводом-выводом, управление файлами и данными, управление памятью, управление передачей данных и связанные службы.
[0031] Устройство 105 хранения данных компьютера 100 может представлять собой одно из множества различных типов устройств хранения данных, в том числе стационарное устройство хранения данных или переносное устройство хранения данных. Например, устройство 105 хранения данных может представлять собой магнитную ленту, диск, флэш-память, энергозависимую память или другое устройство хранения данных. Кроме того, устройство 105 хранения данных может представлять собой SD-карту памяти или любое другое съемное устройство 105 хранения данных.
[0032] Устройства 106 ввода/вывода могут включать в качестве неограничивающих примеров следующие устройств ввода: сенсорный экран, клавиатура, мышь, сканер, микрофон или другое устройство ввода. Кроме того, устройства 106 ввода/вывода также могут включать в качестве неограничивающих примеров следующие устройства вывода: дисплей или другие устройства вывода. Устройства 106 ввода/вывода также могут включать в качестве неограничивающих примеров устройства, которые передают данные и через входы, и через выходы: модулятор/демодулятор (модем, предназначенный для доступа к другому устройству, системе или сети), высокочастотный (RF), беспроводной или другой трансивер, телефонный интерфейс, мост, маршрутизатор или другие устройства, которые функционируют и как устройства ввода, и как устройства вывода.
[0033] Как хорошо известно средним специалистам в данной области, сжатие видеосигнала достигается путем исключения избыточной информации из видеопоследовательности. Существует множество стандартов кодирования видеосигнала, примеры которых включают MPEG-1, MPEG-2, MPEG-4, H.261, H.263 и H.264/AVC. Следует отметить, что настоящее изобретение не предназначено для ограничения применением в каком-либо конкретном стандарте кодирования видеосигнала. Однако нижеследующее описание настоящего изобретения представлено с использованием примера стандарта H.264/AVC, который ссылкой включается в настоящее описание. H.264/AVC представляет собой новейший стандарт кодирования видеосигнала и он достигает значительного увеличения производительности по сравнению с предыдущими стандартами кодирования, такими как MPEG-1, MPEG-2, H.261 и H.263
[0034] В стандарте H.264/AVC каждый кадр, или картинка, видеосигнала может быть разбит на несколько полей. Поля затем разделяются на блоки размера 16×16 пикселов, называемые макроблоками, которые затем могут дальше разделяться на блоки из 8×16, 16×8, 8×8, 4×8, 8×4 вплоть до 4×4 пикселов. Существует пять типов полей, поддерживаемых стандартом H.264/AVC. В I-полях все макроблоки кодируются с использованием внутреннего предсказания. В Р-полях макроблоки могут кодироваться с использованием внутреннего или внешнего предсказания. Р-поля позволяют использовать только один сигнал предсказания с компенсацией движения (MCP) на макроблок. В В-полях макроблоки могут кодироваться с использованием внутреннего и внешнего предсказаний. Для каждого предсказания могут использоваться два сигнала МСР. SP-поля позволяют эффективно переключать Р-поля между разными видеопотоками. SI-поле представляет собой точное соответствие SP-полю для произвольного доступа или восстановления при ошибках, несмотря на использование только внутреннего предсказания.
[0035] ФИГ.2 показывает общий вид видеокодера, в котором может применяться настоящее изобретение. Блоки, показанные на фигуре, представляют функциональные модули, реализованные процессором 101, исполняющим программное обеспечение 103 в памяти 102. Картинка, или видеокадр 200, подается в видеокодер 201. Видеокодер обрабатывает картинку 200 в единицах макроблоков 200А. Каждый макроблок содержит несколько пикселов картинки 200. На каждом макроблоке выполняется преобразование в коэффициенты преобразования с последующим квантованием в уровни коэффициентов преобразования. Кроме того, используется внутреннее предсказание или внешнее предсказание с тем, чтобы выполнять этапы кодирования не непосредственно на пиксельных данных, но на разностях между ними и предсказанными значениями пикселов, и, таким образом, добиваться небольших значений, которые легче подвергаются сжатию.
[0036] Для каждого поля кодер 201 генерирует некоторое количество синтаксических элементов, которые образуют кодированную версию макроблоков соответствующего поля. Все остаточные элементы данных в синтаксических элементах, которые относятся к кодированию коэффициентов преобразования, такие как уровни коэффициентов преобразования или карта значимости, указывающая пропущенные уровни коэффициентов преобразования, называются остаточными синтаксическими элементами данных. Помимо этих остаточных синтаксических элементов данных синтаксические элементы, генерируемые кодером 201, содержат синтаксические элементы управляющей информации, содержащие управляющую информацию о том как кодировался каждый макроблок и соответственно как он должен декодироваться. Иными словами, синтаксические элементы делятся на две категории. Первая категория - синтаксические элементы управляющей информации - содержит элементы, относящиеся к типу макроблока, типу субмакроблока, и информацию о видах предсказания как пространственного, так и временного типа, а также, например, управляющую информацию на основе поля и на основе макроблока. Во второй категории объединяются и становятся остаточными синтаксическими элементами данных все остаточные элементы данных, такие как карта значимости, указывающая положения все значимых коэффициентов внутри блока квантованных коэффициентов преобразования, и значения значимых коэффициентов, которые указываются в единицах уровней, соответствующих шагам квантования.
[0037] Кодер 201 включает в себя энтропийный кодер, который кодирует синтаксические элементы и генерирует для каждого поля арифметические кодовые слова. При генерировании арифметических кодовых слов для поля энтропийный кодер эксплуатирует статистические зависимости между значениями данных синтаксических элементов в битовом потоке видеосигнала. Кодер 201 выводит кодированный видеосигнал для поля картинки 200 в видеодекодер 301, показанный на ФИГ.3.
[0038] ФИГ.3 показывает общий вид видеодекодера, в котором может применяться настоящее изобретение. Аналогично блоки, показанные на фигуре, представляют функциональные модули, реализуемые процессором 101, исполняющим программное обеспечение 103 в памяти 102. Видеодекодер 301 принимает кодированный видеосигнал и, в первую очередь, энтропийно декодирует сигнал обратно в синтаксические элементы. Декодер 301 использует синтаксические элементы с целью реконструкции, макроблок за макроблоком, а затем поле за полем, выборочных значений картинки 300А, состоящей из пикселов, в картинку 300.
[0039] ФИГ.4 показывает функциональные модули видеокодера 201. Эти функциональные модули реализуются процессором 101, исполняющим программное обеспечение 103 в памяти 102. Входная видеокартинка представляет собой кадр, или поле, натурального (несжатого) видеоизображения, определяемого выборочными точками, которые представляют компоненты оригинальных цветов, такие как цветность («chroma») и яркость («luma») (возможны и другие компоненты, например тон, насыщенность и номер). Входная видеокартинка разделяется на макроблоки 400 так, чтобы каждый из них представлял квадратную область картинки, состоящую из 16×16 пикселов luma-компоненты цвета изображения. Входная видеокаринка также разделяется на макроблоки так, чтобы каждый из них представлял 8×8 пикселов каждой из двух chroma-компонент цвета изображения. В общем действии кодера введенные макроблоки могут предсказываться во времени или пространственно с использованием внешнего или внутреннего предсказания. Однако для целей обсуждения предполагается, что все макроблоки 400 относятся к типу макроблоков I-поля и подвергаются только внутреннему предсказанию.
[0040] Внутреннее предсказание выполняется в модуле 401 внутреннего предсказания, действие которого будет более подробно обсуждаться ниже. Модуль 401 внутреннего предсказания генерирует блок 402 предсказания из горизонтальных и вертикальных граничных пикселов соседних блоков, которые ранее были закодированы, реконструированы и сохранены в памяти 403 кадров. Остаток 404 блока 402 предсказания, который представляет собой разность между целевым блоком 400 и блоком 402 предсказания, преобразовывается, масштабируется и квантуется в модуле 405 преобразования/квантования с использованием способов и технологий, известных специалистам в области кодирования видеосигналов. Квантованные коэффициенты 406 преобразования затем энтропийно кодируются в модуле 407 энтропийного кодирования и передаются (вместе с другой информацией, относящейся к внутреннему предсказанию) в виде кодированного видеосигнала 408.
[0041] Видеокодер 201 содержит функциональную возможность декодирования, предназначенную для выполнения внутреннего предсказания на целевых блоках. Функциональная возможность декодирования включает в себя модуль 409 обратного квантования/преобразования, который выполняет обратное квантование и обратное преобразование квантованных коэффициентов 406 преобразования с целью получения декодированного остатка 410 предсказания, который добавляется к блоку 402 предсказания. Сумма декодированного остатка 410 предсказания и блока 402 предсказания представляет собой реконструированный блок 411, который сохраняется в памяти 403 кадров и будет считываться из нее и использоваться модулем 401 внутреннего предсказания для генерирования блока 402 предсказания с целью декодирования следующего целевого блока 400.
[0042] ФИГ.5 представляет собой схему последовательности операций, показывающую процессы, выполняемые модулем 401 внутреннего предсказания. Согласно [стандарту] H.264/AVC внутреннее предсказание включает в себя предсказание каждого пиксела целевого блока 400 в соответствии с рядом видов предсказания с использованием интерполяций граничных пикселов («опорных пикселов») соседних блоков, которые предварительно кодируются и реконструируются. Виды предсказания идентифицируются положительными целыми числами 0, 1, 2, ..., каждое из которых связано с отличающейся командой или алгоритмом предсказания определенных пикселов в целевом блоке 400. Модуль 401 внутреннего предсказания запускает внутреннее предсказание в соответствии с соответствующим видом предсказания и генерирует различные блоки предсказания. В соответствии с алгоритмом полного поиска («FS») каждый из генерируемых блоков предсказания сравнивается с целевым блоком 400 с целью нахождения оптимального вида предсказания, который минимизирует остаток 404 предсказания или генерирует наименьший остаток 404 предсказания среди видов предсказания. Идентификатор оптимального вида предсказания сжимается и отправляется в декодер 301 с другими синтаксическими элементами управляющей информации.
[0043] Каждый вид предсказания может быть описан общим направлением предсказания, описываемым на словах (т.е. «горизонтально вверх», «вертикально» и «по диагонали вниз и влево»). Направление предсказания может быть описано графически как угловое направление, которое выражается при помощи диаграммы со стрелками, как показано на ФИГ.7. В диаграмме такого типа каждая стрелка может рассматриваться как представляющая направление предсказания или вид предсказания. Угол, соответствующий виду предсказания, имеет общую взаимосвязь с направлением из средневзвешенного положения опорных пикселов, используемых для предсказания целевого пиксела, к положению целевого пиксела. Следует отметить, что виды предсказания включают вид предсказания DC, который не связан с каким-либо направлением предсказания, и поэтому, в отличие от других видов предсказания, не может быть описан графически на диаграмме. В виде предсказания DC блок 402 предсказания генерируется так, чтобы каждый пиксел в блоке 402 предсказания задавался единообразно со средним значением опорных пикселов.
[0044] Возвращаясь к ФИГ.5, вид предсказания инициализируется на Этапе 501. Затем на Этапе 502 определяется, указывает ли вид предсказания на предсказание DC. Если указывает, то последовательность операций продвигается на Этап 503, где на Этапе 503 блок 402 предсказания генерируется вместе со средним значением опорных пикселов. Если вид предсказания обусловливает иное, блок 402 предсказания генерируется на Этапе 504 согласно связанной с видом предсказания команде или алгоритму, процесс которого будет подробно описываться ниже. После Этапа 503 или 504 последовательность операций продвигается на Этап 505, где определяется, сгенерированы ли блоки предсказания для всех видов предсказания. Если внутреннее предсказание запущено в соответствии со всеми видами предсказания, последовательность операций продвигается на Этап 506. Иначе на Этапе 507 вид предсказания увеличивается, и последовательность операций возвращается на Этап 502. На Этапе 506 каждый из генерируемых блоков предсказания сравнивается с целевым блоком 400 с целью определения оптимального вида предсказания, который минимизирует остаток 404 предсказания.
[0045] ФИГ.6 показывает функциональные модули видеодекодера 301. Эти функциональные модули реализуются процессором 101, исполняющим программное обеспечение 103 в памяти 102. Кодированный видеосигнал из кодера 201, в первую очередь, принимается энтропийным декодером 600, и подвергается энтропийному декодированию обратно в квантованные коэффициенты 601 преобразования. Квантованные коэффициенты 601 преобразования обратно квантуются и преобразовываются модулем 602 обратного квантования/преобразования, генерирующим остаток 603 предсказания. Модуль 604 внутреннего предсказания извещается о виде предсказания, который был выбран кодером 201. Согласно выбранному виду предсказания модуль 604 внутреннего предсказания выполняет процесс внутреннего предсказания, сходный с процессом, выполняемым на этапах 502, 503 и 504 по ФИГ.5, с целью генерирования блока 605 предсказания с использованием граничных пикселов соседних блоков, ранее реконструированных и хранящихся в памяти 606 кадров. Блок 605 предсказания добавляется к остатку 603 предсказания для реконструкции блока 607 декодированного видеосигнала. Реконструированный блок 607 хранится в памяти 606 кадров с целью использования при предсказании следующего блока.
[0046] Ниже будет дано подробное описание процесса на Этапе 504, выполняемом модулями 401 и 604 внутреннего предсказания для генерирования блока предсказания в соответствии с одним из видов предсказания за исключением вида предсказания DC. H.264/AVC поддерживает предсказание Intra_4×4, предсказание Intra_8×8 и предсказание Intra_16×16. Предсказание Intra_4×4 обычно используется тогда, когда на картинке присутствуют существенные детали. Предсказание Intra_4×4 предсказывает по отдельности шестнадцать блоков luma размера 4×4 в пределах одного макроблока. Предсказание Intra_4×4 выполняется в соответствии с девятью видами предсказания, в том числе с одним видом предсказания DC. Направления пространственного предсказания, в соответствии с которыми выполняется предсказание Intra_4×4, показаны на ФИГ.7. Предсказание Intra_8×8 выполняется в соответствии с девятью видами предсказания, в том числе с одним видом предсказания DC. Предсказание Intra_16×16 выполняется в соответствии с четырьмя видами предсказания, в том числе с одним видом предсказания DC.
[0047] Недавние исследования показали, что увеличение количества направлений предсказания или увеличение количества видов предсказания, в общем, вносит вклад в эффективность сжатия при кодировании видеосигнала. См., например, поданные в Joint Collaborative Team on Video Coding (JCT-VC), Документы №№JCT-VC A119 («Angular Intra Prediction») и JCT-VC A124 («Arbitrary Direction Intra»), которые ссылкой включаются в настоящее описание. Увеличение количества направлений предсказания ведет к увеличению количества угловых интервалов доступных направлений предсказания и, таким образом, к увеличению количества кандидатов для блоков предсказания. Увеличение количества кандидатов для блоков предсказания просто увеличивает шансы получить блок предсказания, почти аналогичный целевому блоку, который требуется кодировать. ФИГ.8 представляет собой диаграмму, показывающую направления предсказания, предложенные в Документе №JCT-VC A119. На ФИГ.8 опорные пикселы состоят из семнадцати (17) горизонтальных пикселов и семнадцати (17) вертикальных пикселов, где верхний левый пиксел является общим и для горизонтальной, и для вертикальной границ. Поэтому для генерирования пикселов предсказания в блоке размера 8×8 доступны 33 различным направлениям предсказания. JCT-VC A124 предлагает произвольное направленное внутреннее предсказание, в котором количество направлений предсказания корректируется в соответствии с размером блока, который требуется предсказать.
[0048] ФИГ.9 представляет собой схему последовательности операций, показывающую предложенный в JCT-VC A119 процесс генерирования блока предсказания по одному из направлений предсказания, показанных на ФИГ.8. В нижеследующем описании процесса некоторые алгоритмы упрощены для легкости разъяснения. Также описываемый процесс ограничен внутренним предсказанием по направлению предсказания, которое, главным образом, вертикально. Как показано в программном обеспечении, предусматриваемом в JCT-VC A119, внутреннее предсказание по направлению предсказания, которое, главным образом, горизонтально, может быть реализовано симметрично относительно процесса, показанного на ФИГ.9. Несмотря на то что ФИГ.8 показывает блок размера 8×8, который требуется предсказать, процесс, показанный на ФИГ.9, может быть распространен на применение к различным количествам пикселов в различных конфигурациях. Например, блок, который требуется предсказать, может включать массив пикселов размера 4×4. Блок предсказания также может включать массив пикселов размера 8×8, массив пикселов размера 16×16 или массивы пикселов большего размера. Блок предсказания также могут составлять и другие конфигурации пикселов, в том числе, как квадратные, так и прямоугольные массивы.
[0049] На Этапе 900 по ФИГ.9 опорные пикселы на горизонтальной и вертикальной границах, которые соответственно лежат непосредственно слева и непосредственно над целевым блоком, считываются из соседних блоков, которые ранее уже были декодированы, реконструированы и сохранены в памяти кадров, такой как память 403 кадров, показанная на ФИГ.4. Пикселы с горизонтальной границы хранятся в области памяти, называемой «refН». Пикселы с вертикальной границы хранятся в другой области памяти, называемой «refV». Возвращаясь к ФИГ.8, опорные пикселы идентифицируются по их координатам в координатной системе, имеющей начало в положении верхнего левого пиксела в блоке размера 8×8. Таким образом, горизонтальные опорные пикселы имеют координаты, которые выражаются как p[x, y], где x=0, 1, …, 16, и у=0. Вертикальные опорные пикселы имеют координаты, выражаемые как p[x, y], где х=0, у=0, -1, -2, …, -16.
[0050] Предполагается, что горизонтальные граничные пикселы, хранящиеся в области памяти refН, идентифицируются по логическому адресу (x), где x=0, 1, …, 16, и вертикальные граничные пикселы идентифицируются по логическому адресу (у), где у=0, -1, -2, …, -16, где каждый пиксел хранится по адресу, имеющему номер координаты, из которой он считывается. По тому как горизонтальные и вертикальные пикселы графически представлены на ФИГ.8, области памяти refH и refV могут рассматриваться как проходящие линейно и ортогонально друг к другу, и каждая из них имеет длину 2×size+1, где «size» - параметр, представляющий размер целевого блока. Предполагается, что size имеет значение, равное целочисленной степени числа 2, такое как 4, 8, 16... К пикселам в refH и refV может, необязательно, применяться фильтр прохождения нижних частот, в том виде как он описывается в Разделе 8.3.2.2.1 H.264/AVC.
[0051] На Этапе 901 счетчик, называемый «row», приравнивается нулю («0»). Счетчик row принимает значения от 0 до size и указывает позицию пиксела предсказания в строке в блоке предсказания. На Этапе 902 параметр, называемый «pos», вычисляется как ange×(row+1). angle представляет собой параметр, содержащий дробное число в представлении с фиксированной запятой. По существу, angle формируется с целочисленной частью и дробной частью, и дробная часть состоит из фиксированного количества двоичных разрядов, и angle представляет одно из направлений предсказания, показанных на ФИГ.8. Например, «angle =-size» идентифицирует направление предсказания, которое на ФИГ.8 проходит через координаты [x=0, y=0]. angle, имеющий положительное значение, идентифицирует направление предсказания, которое пересекается только с горизонтальной границей, в то время как параметр angle, имеющий отрицательное значение, идентифицирует направление предсказания, которое пересекается и с горизонтальной, и с вертикальной границами, и параметр angle варьируется в границах интервала, определяемого количеством направлений предсказания, которые требуется использовать. Как предложено в JCT-VC A124, количество направлений предсказания, которое требуется использовать, может определяться в соответствии с размером блока, который требуется предсказать. В нижеследующем описании предполагается, что angle принимает дробное значение, которое варьируется в интервале от «-size» до «size». Следует отметить, что границы интервала для angle могут определяться и другими значениями.
[0052] Как и angle, pos состоит из целочисленной части и дробной части, и его дробная часть состоит из фиксированного количества двоичных разрядов, которое равно логарифму по основанию 2 границы интервала angle, что можно выразить как log2_size согласно сделанному выше допущению о том, что граница интервала angle приравнена size, и pos идентифицирует положение пересечения между горизонтальной границей и направлением предсказания, которое представлено angle. Возвращаясь к Этапу 902, операция “pos>>log2_size” идентифицирует целое число в pos, которое сохраняется в параметр «int», и операция “pos&(size-1)” идентифицирует дробное число в pos, которое сохраняется в параметр «frac». Оператор «>>» вызывает арифметический сдвиг вправо двоичных разрядов. Оператор «&» вызывает поразрядную операцию «and».
[0053] На Этапе 903 определяется, имеет ли angle значение больше или равное нулю («0»). Если angle имеет значение большее или равное нулю, последовательность операций продолжается на Этапе 904. Иначе последовательность операций продолжается на Этапе 913. angle, больший или равный нулю, означает, что для получения пикселов предсказания в блоке предсказания можно основываться только на пикселах, расположенных на горизонтальной границе, или хранящихся в refH. С другой стороны, angle меньше нуля означает, что для получения опорных пикселов в блоке предсказания необходимы опорные пикселы, находящиеся на вертикальной границе, или в refV.
[0054] На Этапе 904 определяется, является ли ненулевым frac. Если frac является ненулевым, последовательность операций продолжается на Этапе 905. Если frac равен нулю, то последовательность операций продолжается на Этапе 906. Равенство нулю frac означает, что пиксел предсказания в блоке предсказания может копироваться непосредственно из опорного пиксела на горизонтальной границе. Ненулевой frac означает, что направление предсказания пересекается с горизонтальной границей в нецелочисленном положении, и что для получения пиксела предсказания в блоке предсказания необходима интерполяция более чем одного опорного пиксела.
[0055] На этапе 905 счетчик, называемый «col», приравнивается нулю («0»). Счетчик col используется для адресации опорного пиксела в refH. На Этапе 907 в refH выбираются два опорных пиксела, идентифицируемых как «int+col+1» и «int+col+2». Эти два опорных пиксела подвергаются взвешенному усреднению, или интерполируются, по frac, давая пиксел предсказания ν. Конкретнее, опорный пиксел в refH, идентифицированный как «int+col+1», умножается на «size-frac» и сохраняется в параметр а. Опорный пиксел в refH, идентифицированный как «int+col+2», умножается на «frac» и сохраняется в параметр b. Параметры а и b затем складываются и делятся на size, т.е. (size-frac)+frac. Деление на size можно заменить сдвигом вправо на log2_size. Полученный пиксел предсказания ν хранится в массиве областей памяти, называемом «pred», который представляет блок предсказания для целевого блока в соответствии с конкретным направлением предсказания. Каждая область памяти в pred определяется параметрами row и col. Затем на Этапе 908 col увеличивается на 1 и на Этапе 909 сравнивается с size. Этапы 907 и 908 повторяются до тех пор, пока col будет меньше size. Когда col становится равен size, последовательность операций продолжается на Этапе 920.
[0056] Если frac определен на Этапе 904 как нулевой, то на Этапе 906 счетчик col приравнивается нулю. На Этапе 910 пиксел предсказания ν копируется непосредственно из refH (int+col+1) и затем сохраняется в соответствующей области памяти в pred. Затем на Этапе 911 col увеличивается на 1 и на Этапе 912 сравнивается с size. Этапы 910 и 911 повторяются до тех пор, пока col будет меньше size. Когда col становится равен size, последовательность операций продолжается на Этапе 920.
[0057] Возвращаясь к Этапу 903, angle меньше нуля требует для получения пикселов предсказания в блоке предсказания опорных пикселов из refV. На Этапе 913 счетчик col приравнивается нулю. Затем на Этапе 914 определяется, является ли «int+col+1» меньше нуля, «int+col+1», больший или равный нулю, означает, что для получения пикселов предсказания в блоке предсказания можно по-прежнему основываться на опорных пикселах, хранящихся в refH, и последовательность операции продолжается на Этапе 915. Процесс, выполняемый на Этапе 915, сходен с процессом на Этапе 907, и его описание не будет здесь повторяться. Затем на Этапе 916 col увеличивается на 1 и на Этапе 917 сравнивается с size. Этапы 914, 915 и 916 повторяются до тех пор, пока col будет меньше size. Когда col становится равен size, последовательность операций продолжается на Этапе 920.
[0058] Если на Этапе 914 определяется, что «int+col+1» меньше нуля, то для получения пикселов предсказания в блоке предсказания необходимы пикселы, хранящиеся в refV. На Этапе 918 в первую очередь определяется положение пересечения между вертикальной границей и направлением предсказания. На Этапе 918 это положение представляется pos2. Следует отметить, что на Этапе 902 pos, т.е. положение пересечения между горизонтальной границей и направлением предсказания, определяется как «angle×(row+1)». При условии, что angle представляет соотношение горизонтальных и вертикальных разностей, для определения положения пересечения между вертикальной границей и направлением предсказания вместо «angle×(row+1)» вычисляется “ange-1×(col+1)”. Как допущено выше, angle находится в интервале от -size до size (-size<angle<size). Поэтому соотношение между angle и size имеет вид:
Тогда angle-1 определяется как:
По существу, pos2 определяется на Этапе 918 квадратом параметра size, умноженным на col+1, а затем деленным на абсолютное значение angle следующим образом:
[0059] Как и pos, pos2 содержит дробное число в представлении с фиксированной запятой, образованное целочисленной частью и дробной частью. Дробная часть состоит из числа в двоичных разрядах, определяемого как log2_size. Целочисленная часть pos2 сохраняется в параметр int2, а дробная часть pos2 сохраняется в параметр frac2. На Этапе 919 в refV выбираются два опорных пиксела, идентифицируемых как «int2+row+1» и «int2+row+2». Эти два опорных пиксела подвергаются взвешенному усреднению или интерполируются по frac2, давая пиксел ν предсказания. Конкретнее, опорный пиксел из refV (int2+row+1) умножается на «size-frac2»и сохраняется в параметр а. Опорный пиксел из refV (int2+row+2) умножается на «frac2» и сохраняется в параметр b. Параметры а и b затем складываются и делятся на size или сдвигаются вправо на log2_size. Полученный пиксел ν предсказания хранится в соответствующей области памяти pred. Этапы 914, 918, 919 и 916 повторяются до тех пор, пока на Этапе 917 col не станет равен size.
[0060] На Этапе 920 row увеличивается на 1. Затем на Этапе 921 определяется, является ли row меньшим, чем size. Для получения пиксела предсказания в блоке предсказания этапы, начиная с Этапа 902, повторяются до тех пор, пока row будет меньше size. Последовательность операций завершается тогда, когда row становится равен size на этапе 921.
[0061] Как упоминалось выше, увеличение количества кандидатов для блока предсказания вносит вклад в повышение эффективности кодирования, и в то время увеличение количества кандидатов для блока предсказания приводит к увеличению объема вычислительной работы. Поэтому для того чтобы увеличить количество кандидатов для блока предсказания с тем, чтобы повысить эффективность кодирования, процесс генерирования кандидата для блока предсказания необходимо пересмотреть так, чтобы дополнительно повысить эффективность процесса. При пересмотре процесса, показанного на ФИГ.9, можно обнаружить два узких в вычислительном отношении места. Первым узким в вычислительном отношении местом является операция сравнения и ветвления на Этапе 914, которая повторяется в цикле. Вторым узким в вычислительном отношении местом является операция деления на Этапе 918, которая также повторяется в цикле.
[0062] В настоящее время для эффективных вычислений доступна архитектура с одним потоком команд и несколькими потоками данных (SIMD). SIMD позволяет компьютерам с несколькими процессорными элементами выполнять одну и ту же операцию на нескольких данных одновременно. Однако типичные архитектуры SIMD не поддерживают реализацию деления и вычисления/ветвления в цикле и поэтому не могут использоваться для реализации процесса, показанного на ФИГ.9, по причине включения в цикл Этапов 914 и 918, несмотря на то, что циклы, начинающиеся на Этапах 907 и 910, достаточно надежны для реализации на SIMD. Поэтому целью настоящего изобретения является устранение узких в вычислительном отношении мест из процесса, показанного на ФИГ.9, и создание внутреннего предсказания с низкой сложностью, которое допускает реализацию типичными архитектурами SIMD параллельной обработки по всем направлениям предсказания, показанным на ФИГ.8.
[0063] ФИГ.10 представляет собой схему последовательности операций внутреннего предсказания с низкой сложностью согласно одному из вариантов осуществления настоящего изобретения, который сконструирован для замены процесса согласно ФИГ.9 при реализации процесса на Этапе 504 согласно ФИГ.5. На ФИГ.10 этапы процесса, выполняемые аналогично этапам согласно ФИГ.9, таким как Этапы 900, 901, 902, 904, 905, 906, 907, 908, 909, 910, 911, 912, 920 и 921, идентифицируются номерами этапов, аналогичными номерам, используемым на ФИГ.9. Описание этих общих этапов здесь повторяться не будет. Этапы 1000 и 1001 представляют собой этапы, специфические для процесса согласно ФИГ.10. При сопоставлении с процессом согласно ФИГ.9 становится очевидно, что процесс согласно ФИГ.10 исключает этап сравнения на Этапе 903, и все этапы, ответвляющиеся влево от Этапа 903, которые выполняются, когда angle меньше нуля, что, таким образом, исключает узкие в вычислительном отношении места Этапов 914 и 918.
[0064] На добавленных Этапах 1000 и 1001 определяется, является ли angle большим или равным -1. Если angle больше или равен -1, опорных пикселов, находящихся на горизонтальной границе, достаточно для генерирования пиксела предсказания в блоке предсказания, и опорные пикселы на вертикальной границе не являются необходимыми. С другой стороны, если angle меньше -1, то для генерирования пиксела предсказания в блоке предсказания необходимы опорные пикселы на вертикальной границе. На Этапе 1001 опорные пикселы, хранящиеся в refH, распространяются в отрицательном направлении с использованием, по меньшей мере, некоторых пикселов, хранящихся в refV. ФИГ.11А и 11В представляют собой схематические представления, показывающие расширение refH, выполняемое на Этапе 1001. На ФИГ.11А опорные пикселы 1102, хранящиеся в refH, исходят из горизонтальной границы, расположенной выше целевого блока 1101. Опорные пикселы 1103, хранящиеся в refV, исходят из вертикальной границы, расположенной слева от целевого блока 1101. Как показано на ФИГ.11В, после Этапа 1001 согласно ФИГ.10 некоторые из опорных пикселов в refV копируются в refH, и refH содержит расширенную часть 1104, проходящую в отрицательном направлении.
[0065] ФИГ.12 представляет собой схему последовательности операций, показывающую подробности процесса, выполняемого на Этапе 1001. На Этапе 1201 счетчику col присваивается значение -1. Счетчик col используется для идентификации адреса расширенной части refH. На Этапе 1202 опорный пиксел в refV, предназначенный для копирования в расширенную часть refH, идентифицируется как:
Деление в приведенном выше уравнении является целочисленным делением и уравнение дает целое число. Данное уравнение выполняет функцию, аналогичную процессу на Этапе 918, показанном на ФИГ.9. На Этапе 918 целочисленное значение pos2 вычисляется как:
Следует учитывать, что сдвиг вправо на log2_size эквивалентен делению на size.
[0066] На Этапе 1203 счетчик col уменьшается на 1. Затем на Этапе 1204 определяется, является ли col равным angle. Если col не равен angle, последовательность операций возвращается на Этап 1202. Этапы 1202 и 1203 повторяются до тех пор, пока col не станет равен angle. Таким образом, опорные пикселы считываются из refV в возрастающем порядке, или снизу вверх по вертикальной границе, и копируются в refH также в убывающем порядке, или слева направо по горизонтальной границе. Кроме того, не все опорные пикселы в refV копируются в refH. Из refV в refH копируются только те опорные пикселы, которые расположены в интервале от верха до пересечения с направлением предсказания.
[0067] Вернемся к ФИГ.10, этапы процесса, начиная с Этапа 902, скопированы с ФИГ.9, и они включают этапы генерирования пикселов предсказания, ответвляющиеся вправо от этапа сравнения на Этапе 903 согласно ФИГ.9. Однако следует отметить, что этапы по ФИГ.10, предназначенные для генерирования пикселов предсказания, используют расширенную refH (сумму частей 1102+1104 на ФИГ.11В), в то время как соответствующие этапы на ФИГ.9 используют оригинальную (часть 1102 на ФИГ.10А). Поскольку refH расширена в отрицательном направлении, отдельная операция внутреннего предсказания, сконструированная специально для использования опорных пикселов, хранящихся в refV, такая как операция, ответвляющаяся влево от Этапа 903 на ФИГ.9, не требуется вне зависимости от знака angle.
[0068] ФИГ.13 представляет собой схему последовательности операций, показывающую другой вариант осуществления процесса, предназначенный для расширения refH с использованием опорных пикселов в refV. Процесс, показанный на ФИГ.11 и 12, исключает этапы с узкими местами Этапов 914 и 918, показанных на ФИГ.9, и, таким образом, как ожидается, будет повышать эффективность процесса внутреннего предсказания. Процесс, показанный на ФИГ.13, исключает операцию деления, выполняемую на Этапе 1202 согласно ФИГ.12, из цикла копирования опорных пикселов из refV в refH. Исключая операцию деления из цикла, процесс, показанный на ФИГ.13, как ожидается, будет дополнительно увеличивать эффективность процесса внутреннего предсказания.
[0069] Процесс, показанный на ФИГ.13, замещает Этап 1202 согласно ФИГ.12 Этапами 1301 и 1302. Этап 1302 находится в цикле для копирования опорных пикселов из refV в refH, в то время как Этап 1301 находится за пределами цикла. Этап 1301 вводит новый параметр, называемый «InvAngle». InvAngle определяется как:
Умножение на 256 эквивалентно сдвигу влево на 8,и оно гарантирует то, что каждый бит в результате действия «size/angle» обеспечивает вычисление идентификатора опорного пиксела в refV. На Этапе 1302 адрес опорного пиксела в refV, предназначенного для копирования в расширенную часть refH, идентифицируется как:
Для отмены операции сдвига влево, выполняемой на Этапе 1301, результат «col×InvAngle» сдвигается вправо на 8. Следует отметить, что функция операции сдвига вправо на Этапе 1302 заключается в округлении результата «col×InvAngle». Для округления до ближайшего целого числа перед выполнением операции сдвига вправо для результата «col×InvAngle» может выполняться округляющее смещение на 128. Следует отметить, что число «256» - это всего лишь пример, и Этап 1301 может принимать другое число сдвига, предпочтительно, целочисленную степень числа 2, до тех пор, пока число будет достаточно велико для сохранения всех результирующих битов операции «size/angle». Например, числом на Этапе 1301 может быть 64 вместо 256, а числом сдвига вправо на Этапе 1302 может быть 6 вместо 8. Если принимается число 64, округляющим смещением должно быть число 32.
[0070] Для дополнительного уменьшения объема вычислительной работы вычисление, выполняемое на Этапе 1301, может замещаться операцией нахождения. Иными словами, подготавливается справочная таблица, в которой хранятся значения InvAngle в зависимости от значений angle. Представленная ниже Таблица 1 представляет собой пример таблицы для нахождения на Этапе 1301:
Таблица 1 | ||||||||
angle | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
lnvAngle | 2048 | 1024 | 683 | 512 | 410 | 341 | 293 | 256 |
Предполагается, что в приведенной выше таблице size равен 8, и angle принимает целочисленные значения от 1 до 8. Следует, однако, отметить, что size не ограничивается числом 8 и может принимать и другое значение, такое как 4 или 16. Кроме того, как определено выше, angle может быть дробным числом в представлении с фиксированной запятой.
[0071] Когда на Этапе 1202 согласно ФИГ.12 или на Этапе 1302 согласно ФИГ.13 опорный пиксел копируется из refV в refH, опорный пиксел может пропускаться через фильтр прохождения нижних частот с целью снижения возможных искажений в блоке предсказания. Интенсивность фильтра прохождения нижних частот может изменяться в соответствии со значением angle. Например, когда angle равен -size, может применятся слабая фильтрация прохождения нижних частот, а когда angle равен -2, может применяться сильная фильтрация прохождения нижних частот.
[0072] Как разъяснялось выше, в refH копируются не все опорные пикселы из refV. Поскольку копируются не все опорные пикселы из refV, некоторая часть информации при копировании пикселов теряется. Для смягчения потери информации разрешение опорных пикселов в refH и refV может быть удвоено так, чтобы refH и refV cодержали не только пикселы из ранее кодированных и реконструированных блоков, но также один пиксел между двумя смежными реконструированными пикселами, который генерируется путем интерполяции двух смежных пикселов. Два смежных пиксела могут просто усредняться для генерирования интерполированного пиксела. Процесс интерполяции может выполняться при считывании опорных пикселов на Этапе 900 согласно ФИГ.9. Когда разрешение пикселов в refH и refV удваивается, появляется необходимость в масштабировании идентификаций адресов опорных пикселов, хранящихся в refH и refV, таких как идентификации, выполняемые на Этапах 907, 910, 915 и 919 на ФИГ.9 и на Этапе 1001 на ФИГ.10. Например, «int+col+1», выполняемую на Этапах 907, 910 и 915, необходимо заменить на «int+2×col+2». Идентификацию «int+col+2», выполняемую на Этапах 907, 910, 915, необходимо заменить на «int+2×col+3». Идентификации «int2+row+1» и «int2+row+2», выполняемые на Этапе 919, необходимо заменить соответственно на «int2+2×row+2» и «int2+2×row+3».
[0073] В другом варианте осуществления изобретения процесс на Этапе 1202 согласно ФИГ.12 может просто заменяться на «refH[col]←refV[-col]» с целью дальнейшего упрощения процесса копирования. Несмотря на ухудшение качества предсказания, этот вариант осуществления изобретения обеспечивает операции внутреннего предсказания самую низкую сложность.
[0074] ФИГ.11В показывает расширенную часть 1104, добавленную к refH. Расширенная часть 1104 не нуждается в том, чтобы она формировалась опорными пикселами из refV. Расширенная часть 1104 может формироваться пикселами из области ранее реконструированного блока, который пространственно соответствует положению расширенной части 1104. Поскольку расширение происходит в отрицательном направлении, расширенная refH (части 1102 и 1104) на ФИГ.11В находится в интервале от -size+1 до 2×size. Масштаб интервала расширенной refH может изменяться до интервала от 0 до 3×size-1 путем добавления соответствующего смещения при адресации опорных пикселов в расширенной refH. То же остается в силе и при изменении масштаба интервала для refV.
[0075] В другом варианте осуществления изобретения граница интервала angle может выбираться свободно. В описанных выше вариантах осуществления изобретения предполагается, что angle принимает значения в границах интервала от -size до size (-size<angle<size). Иными словами, в описанных выше вариантах осуществления изобретения границы интервала angle определяются размером целевого блока. Следует отметить, что границы интервала angle могут определяться независимо от размера целевого блока, хотя по-прежнему остается предпочтительным, чтобы граница интервала определялась целочисленной степенью числа 2 так, чтобы log2_rangelimit было положительным целым числом, и уравнение «rangelimit=1<<log2_rangelimit» оставалось в силе. Выбирая подходящее большое число для rangelimit, можно установить большое количество направлений предсказания и представить их значениями angle с достаточно широкими угловыми интервалами.
[0076] Если граница интервала angle определяется независимо от размера целевого блока, то size, присутствующий на ФИГ.9 и 10, необходимо заменить rangelimit, и log2_size необходимо заменить на log2_rangelimit, за исключением Этапов 909, 912, 917 и 921. Сравнение «angle>-1», выполняемое на Этапе 1000 согласно ФИГ.10, также необходимо заменить на «angle×size/rangelimit>-1» или на «angle×size>-rangelimit». Кроме того, size, присутствующий на Этапах 1202 и 1301 на ФИГ.12 и 13, необходимо заменить на rangelimit, и сравнение «col=angle?», выполняемое на Этапе 1204, необходимо заменить на «col=angle×size/rangelimit?».
[0077] Если в качестве границы интервала параметра angle вводится параметр rangelimit, Таблицу 1 (представленную выше) можно изменить следующим образом:
Таблица 2 | ||||||||
Angle* | 2 | 5 | 9 | 13 | 17 | 21 | 26 | 32 |
InvAngle | 4096 | 1638 | 910 | 630 | 482 | 390 | 315 | 256 |
В Таблице 2 rangelimit присвоено значение 32. Angle* равен целочисленному приближению «rangelimit×tan(π×angle/8)», где angle=1, 2, 3, 4, 5, 6, 7 и 8. InvAngle равен 256×rangelimit/angle*. Все значения в Таблице 2 являются целыми числами, которые получены путем округления в большую сторону. Вместо округления в большую сторону числа могут округляться в меньшую сторону. В приведенной ниже Таблице 3 InvAngle равен 32×rangelimit/angle*. Поскольку вместо «256» используется «32», точность предсказания неизбежно ниже, чем точность в Таблице 2.
Таблица 3 | ||||||||
Angle* | 2 | 5 | 9 | 13 | 17 | 21 | 26 | 32 |
InvAngle | 512 | 204 | 113 | 78 | 60 | 48 | 39 | 32 |
[0078] ФИГ.14 представляет собой схему последовательности операций, показывающую другой вариант осуществления, который дополнительно упрощает процесс, показанный на ФИГ.10. Показанный на ФИГ.10 процесс копирования опорных пикселов из refV в refH выполняется перед вхождением последовательности операций в основной цикл предсказания, где процесс копирования, показанный на ФИГ.14, выполняется в основном цикле предсказания. Также процесс, показанный на ФИГ.14, исключает переменную InvAngle. Этапы 900, 902 и 921, показанные на ФИГ.14, являются этапами из соответствующих этапов согласно ФИГ.10.
[0079] На Этапе 1401 счетчик lastlnt инициализируется со значением -1. Счетчик lastlnt представляет индекс последнего пиксела, который был добавлен к refH. На Этапе 902 pos вычисляется как angle×(row+1). Как разъяснено выше, pos идентифицирует положение пересечения между границами и направлением предсказания, которое представлено angle. В контексте ФИГ.9 Этап 902 выводит pos, который идентифицирует положение пересечения между горизонтальной границей и направлением предсказания, представленным angle. В дальнейшем на Этапе 902 целочисленная часть в pos сохраняется в int, а дробная часть в pos сохраняется в параметр «frac». На Этапе 1402 определяется, является ли int меньшим, чем lastlnt. Если int меньше, чем lastlnt, то опорный пиксел в refV, идентифицируемый row, копируется в refН по адресу, идентифицируемому как «int+1». Этап 1404 состоит из этапов 904, 905, 906, 907, 908, 909, 910, 911 и 912, показанных на ФИГ.9 и 10, описание которых здесь повторяться не будет. На Этапе 1405 int копируется в lastlnt. Операция копирования int в lastlnt может выполняться на Этапе 1403 вместо Этапа 1405.
[0080] Операция копирования на Этапе 1403 приводит к копированию того же пиксела, который копируется на Этапах 1202 и 1302, причем на этих этапах используется округление в меньшую сторону. Этап 1403 может модифицироваться для округления в сторону ближайшего целого числа путем условного использования на Этапе 1403 «row+1» вместо «row», когда дробное положение frac, вычисленное на Этапе 902, больше, чем offset, который определяется как rangelimit+(angle>>1). Следует отметить, что angle равен -ve, а параметр frac равен +ve. Использование «row+1» приводит к округлению в большую сторону. Для совершения условного приращения row на 1 процесс, выполняемый на Этапе 1403, заменяется на refH[int+1]←refV[row-((offset-frac)>>31)] в предположении, что в 32-битной арифметике сдвиг вправо «offset-frac» в результате приводит к -1, когда frac больше, чем offset, и иначе приводит к 0. Таким образом, идентификатор адреса «row-((offset-frac)>>31)» становится равен «row+1», когда frac становится больше, чем offset, и иначе становится «row». Если offset приравнивается rangelimit, то «offset-frac» всегда будет положительным, и поэтому округление происходить не будет.
[0081] Ниже приводится исходный код, разработанный на языке программирования C++ и реализующий процесс, показанный на ФИГ.14. Исходный код модифицирован из функции TComPrediction::xPredIntraAng, находящейся в файле TComPrediction.cpp, который составляет часть программного обеспечения TMuC 0.7, разработанного JCT-VC, которое доступно по адресу http://hevc.kw.bbc.co.uk/svn/jctvc.al24/tags/0.7.
[0082] Несмотря на то что специалисту в данной области техники после прочтения предшествующего описания, вне всякого сомнения, будут очевидны многие изменения и модификации настоящего изобретения, следует понимать, что любой конкретный вариант осуществления изобретения, описанный и показанный с целью иллюстрации, никоим образом не предназначен для рассмотрения в качестве ограничивающего. Поэтому отсылки к деталям различных вариантов осуществления изобретения не предназначаются для ограничения объема формулы изобретения, которые сами по себе излагают только те признаки, которые рассматриваются как существенные для изобретения.
Claims (47)
1. Способ кодирования видео, включающий в себя этап выполнения на основе информации вида предсказания, указывающей вид предсказания, либо
первого процесса, включающего в себя:
выборку по меньшей мере некоторых из пикселов из массива вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока;
добавление выбранных пикселов к массиву горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока, вдоль направления массива горизонтальных граничных пикселов, с целью расширения массива горизонтальных граничных пикселов; и
выполнение внутреннего предсказания на основе расширенного массива горизонтальных граничных пикселов,
либо
второго процесса, включающего в себя:
выборку по меньшей мере некоторых из пикселов из массива горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока;
добавление выбранных пикселов к массиву вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока, вдоль направления массива вертикальных граничных пикселов, с целью расширения массива вертикальных граничных пикселов; и
выполнение внутреннего предсказания на основе расширенного массива вертикальных граничных пикселов.
2. Способ кодирования видео по п. 1, в котором информация вида предсказания представляет собой информацию, указывающую одно из направлений предсказания.
3. Способ декодирования видео, который исполняется процессором видеодекодера, содержащий:
этап декодирования вида предсказания для декодирования информации вида предсказания, указывающей вид предсказания, из кодированных видеосигналов; и
этап выполнения для выполнения на основе информации вида предсказания, декодированной на этапе декодирования вида предсказания, либо
первого процесса, включающего в себя:
выборку по меньшей мере некоторых из пикселов из массива вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока;
добавление выбранных пикселов к массиву горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока, вдоль направления массива горизонтальных граничных пикселов, с целью расширения массива горизонтальных граничных пикселов; и
выполнение внутреннего предсказания на основе расширенного массива горизонтальных граничных пикселов,
либо
второго процесса, включающего в себя:
выборку по меньшей мере некоторых из пикселов из массива горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока;
добавление выбранных пикселов к массиву вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока, вдоль направления массива вертикальных граничных пикселов, с целью расширения массива вертикальных граничных пикселов; и
выполнение внутреннего предсказания на основе расширенного массива вертикальных граничных пикселов.
4. Способ декодирования видео по п. 3, в котором информация вида предсказания представляет собой информацию, указывающую одно из направлений предсказания.
5. Видеокодер, содержащий:
средство для выполнения на основе информации вида предсказания, указывающей вид предсказания, либо
первого процесса, включающего в себя:
выборку по меньшей мере некоторых из пикселов из массива вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока;
добавление выбранных пикселов к массиву горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока, вдоль направления массива горизонтальных граничных пикселов, с целью расширения массива горизонтальных граничных пикселов; и
выполнение внутреннего предсказания на основе расширенного массива горизонтальных граничных пикселов,
либо
второго процесса, включающего в себя:
выборку по меньшей мере некоторых из пикселов из массива горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока;
добавление выбранных пикселов к массиву вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока, вдоль направления массива вертикальных граничных пикселов, с целью расширения массива вертикальных граничных пикселов; и
выполнение внутреннего предсказания на основе расширенного массива вертикальных граничных пикселов.
6. Видеодекодер, содержащий:
средство для декодирования информации вида предсказания, указывающей вид предсказания, из кодированных видеосигналов; и
средство для выполнения на основе информации вида предсказания, декодированной при помощи упомянутого средства для декодирования, либо
первого процесса, включающего в себя:
выборку по меньшей мере некоторых из пикселов из массива вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока;
добавление выбранных пикселов к массиву горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока, вдоль направления массива горизонтальных граничных пикселов, с целью расширения массива горизонтальных граничных пикселов; и
выполнение внутреннего предсказания на основе расширенного массива горизонтальных граничных пикселов,
либо
второго процесса, включающего в себя:
выборку по меньшей мере некоторых из пикселов из массива горизонтальных граничных пикселов, расположенных непосредственно выше целевого блока;
добавление выбранных пикселов к массиву вертикальных граничных пикселов, расположенных непосредственно слева от целевого блока, вдоль направления массива вертикальных граничных пикселов, с целью расширения массива вертикальных граничных пикселов; и
выполнение внутреннего предсказания на основе расширенного массива вертикальных граничных пикселов.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US36432210P | 2010-07-14 | 2010-07-14 | |
US61/364,322 | 2010-07-14 | ||
US38854110P | 2010-09-30 | 2010-09-30 | |
US61/388,541 | 2010-09-30 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013106296/08A Division RU2579947C2 (ru) | 2010-07-14 | 2011-07-14 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017107462A Division RU2658880C1 (ru) | 2010-07-14 | 2017-03-07 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2613722C1 true RU2613722C1 (ru) | 2017-03-21 |
Family
ID=45469801
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013106296/08A RU2579947C2 (ru) | 2010-07-14 | 2011-07-14 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2015141145A RU2613725C1 (ru) | 2010-07-14 | 2011-07-14 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2015141279A RU2613722C1 (ru) | 2010-07-14 | 2011-07-14 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2017107462A RU2658880C1 (ru) | 2010-07-14 | 2017-03-07 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2018120140A RU2687031C1 (ru) | 2010-07-14 | 2018-05-31 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2019112302A RU2710947C1 (ru) | 2010-07-14 | 2019-04-23 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2019112301A RU2710946C1 (ru) | 2010-07-14 | 2019-04-23 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2019112303A RU2738786C2 (ru) | 2010-07-14 | 2019-04-23 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013106296/08A RU2579947C2 (ru) | 2010-07-14 | 2011-07-14 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2015141145A RU2613725C1 (ru) | 2010-07-14 | 2011-07-14 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017107462A RU2658880C1 (ru) | 2010-07-14 | 2017-03-07 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2018120140A RU2687031C1 (ru) | 2010-07-14 | 2018-05-31 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2019112302A RU2710947C1 (ru) | 2010-07-14 | 2019-04-23 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2019112301A RU2710946C1 (ru) | 2010-07-14 | 2019-04-23 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
RU2019112303A RU2738786C2 (ru) | 2010-07-14 | 2019-04-23 | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала |
Country Status (16)
Country | Link |
---|---|
US (6) | US9225986B2 (ru) |
EP (7) | EP2934009B1 (ru) |
JP (8) | JP5687341B2 (ru) |
KR (7) | KR101811360B1 (ru) |
CN (4) | CN105227960B (ru) |
AU (1) | AU2011279139B2 (ru) |
BR (1) | BR112013000963B1 (ru) |
CA (7) | CA3014052C (ru) |
ES (7) | ES2864048T3 (ru) |
HU (2) | HUE053802T2 (ru) |
MX (5) | MX367865B (ru) |
PL (7) | PL3226560T3 (ru) |
PT (7) | PT2594076T (ru) |
RU (8) | RU2579947C2 (ru) |
SG (1) | SG187065A1 (ru) |
WO (1) | WO2012009540A1 (ru) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX367865B (es) | 2010-07-14 | 2019-09-05 | Ntt Docomo Inc | Intrapredicción de baja complejidad para la codificación de video. |
KR101530284B1 (ko) * | 2010-07-16 | 2015-06-19 | 삼성전자주식회사 | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 |
US9008175B2 (en) | 2010-10-01 | 2015-04-14 | Qualcomm Incorporated | Intra smoothing filter for video coding |
KR20120140181A (ko) * | 2011-06-20 | 2012-12-28 | 한국전자통신연구원 | 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치 |
US8811760B2 (en) * | 2011-10-25 | 2014-08-19 | Mitsubishi Electric Research Laboratories, Inc. | Coding images using intra prediction modes |
US10645398B2 (en) | 2011-10-25 | 2020-05-05 | Texas Instruments Incorporated | Sample-based angular intra-prediction in video coding |
US9344715B2 (en) | 2011-11-07 | 2016-05-17 | Futurewei Technologies, Inc. | Angular table for improving intra prediction |
WO2013181821A1 (en) * | 2012-06-07 | 2013-12-12 | Mediatek Singapore Pte. Ltd. | Improved intra transform skip mode |
KR101307257B1 (ko) * | 2012-06-28 | 2013-09-12 | 숭실대학교산학협력단 | 영상의 인트라 예측 장치 |
TWI627857B (zh) * | 2012-06-29 | 2018-06-21 | Sony Corp | Image processing device and method |
US9729875B2 (en) * | 2013-07-08 | 2017-08-08 | Sony Corporation | Palette coding mode |
US20150016516A1 (en) * | 2013-07-15 | 2015-01-15 | Samsung Electronics Co., Ltd. | Method for intra prediction improvements for oblique modes in video coding |
US11109036B2 (en) | 2013-10-14 | 2021-08-31 | Microsoft Technology Licensing, Llc | Encoder-side options for intra block copy prediction mode for video and image coding |
WO2015054811A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Corporation | Features of intra block copy prediction mode for video and image coding and decoding |
CA2925183C (en) | 2013-10-14 | 2020-03-10 | Microsoft Technology Licensing, Llc | Features of base color index map mode for video and image coding and decoding |
US10390034B2 (en) | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
JP6355744B2 (ja) | 2014-01-03 | 2018-07-11 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ビデオ及び画像符号化/デコーディングにおけるブロックベクトル予測 |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
US10542274B2 (en) | 2014-02-21 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dictionary encoding and decoding of screen content |
JP2017512026A (ja) | 2014-03-04 | 2017-04-27 | マイクロソフト テクノロジー ライセンシング,エルエルシー | イントラブロックコピー予測におけるブロック反転及びスキップモード |
US10785486B2 (en) | 2014-06-19 | 2020-09-22 | Microsoft Technology Licensing, Llc | Unified intra block copy and inter prediction modes |
AU2014408228B2 (en) | 2014-09-30 | 2019-09-19 | Microsoft Technology Licensing, Llc | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
US9591325B2 (en) | 2015-01-27 | 2017-03-07 | Microsoft Technology Licensing, Llc | Special case handling for merged chroma blocks in intra block copy prediction mode |
JP6122516B2 (ja) | 2015-01-28 | 2017-04-26 | 財團法人工業技術研究院Industrial Technology Research Institute | エンコーディング方法及びエンコーダ |
JP6492847B2 (ja) * | 2015-03-24 | 2019-04-03 | 日本電気株式会社 | 映像符号化システム、映像符号化回路および映像符号化方法 |
KR20170131473A (ko) * | 2015-03-29 | 2017-11-29 | 엘지전자 주식회사 | 비디오 신호의 인코딩/디코딩 방법 및 장치 |
WO2016197314A1 (en) | 2015-06-09 | 2016-12-15 | Microsoft Technology Licensing, Llc | Robust encoding/decoding of escape-coded pixels in palette mode |
WO2017034331A1 (ko) * | 2015-08-27 | 2017-03-02 | 엘지전자 주식회사 | 영상 코딩 시스템에서 크로마 샘플 인트라 예측 방법 및 장치 |
CN106231340B (zh) * | 2016-09-23 | 2019-08-27 | 优酷网络技术(北京)有限公司 | 一种基于hevc的帧内预测解码方法及装置 |
US10869049B2 (en) * | 2016-11-29 | 2020-12-15 | Research & Business Foundation Sungyunwan University | Image encoding/decoding method and device, and recording medium in which bitstream is stored |
CN113784122B (zh) | 2016-12-23 | 2022-10-11 | 华为技术有限公司 | 用于扩展预定定向帧内预测模式集合的装置、方法及介质 |
US10225578B2 (en) | 2017-05-09 | 2019-03-05 | Google Llc | Intra-prediction edge filtering |
US10992939B2 (en) | 2017-10-23 | 2021-04-27 | Google Llc | Directional intra-prediction coding |
CN110832864B (zh) * | 2017-06-26 | 2024-03-29 | 交互数字麦迪逊专利控股公司 | 利用多个加权参考进行帧内预测的方法和装置 |
US10764587B2 (en) * | 2017-06-30 | 2020-09-01 | Qualcomm Incorporated | Intra prediction in video coding |
JP2019041165A (ja) * | 2017-08-23 | 2019-03-14 | 富士通株式会社 | 画像符号化装置、画像復号装置、画像処理方法、及び画像処理プログラム |
WO2019059107A1 (ja) * | 2017-09-20 | 2019-03-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法及び復号方法 |
CN109587491B (zh) * | 2017-09-28 | 2022-09-23 | 腾讯科技(深圳)有限公司 | 一种帧内预测方法、装置及存储介质 |
WO2019112969A1 (en) | 2017-12-04 | 2019-06-13 | CyMedica Orthopedics, Inc. | Patient therapy systems and methods |
WO2019124205A1 (ja) * | 2017-12-18 | 2019-06-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法及び復号方法 |
US10986349B2 (en) | 2017-12-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Constraints on locations of reference blocks for intra block copy prediction |
TWI730311B (zh) * | 2018-03-29 | 2021-06-11 | 弗勞恩霍夫爾協會 | 用以選擇內預測模式以供填補之設備 |
CN110072112B (zh) * | 2019-03-12 | 2023-05-12 | 浙江大华技术股份有限公司 | 帧内预测方法、编码器及存储装置 |
WO2021034231A2 (en) * | 2019-12-19 | 2021-02-25 | Huawei Technologies Co., Ltd. | Method and apparatus of position dependent prediction combination for oblique directional intra prediction |
WO2021045655A2 (en) * | 2019-12-31 | 2021-03-11 | Huawei Technologies Co., Ltd. | Method and apparatus for intra prediction |
JP7470382B2 (ja) * | 2020-06-08 | 2024-04-18 | 株式会社大一商会 | 遊技機 |
WO2023120410A1 (ja) | 2021-12-20 | 2023-06-29 | 株式会社グランドライン | 構造物の表面処理方法、ブラスト処理装置、粉粒状製品の製造設備における付着物除去方法および装置、並びに、粉粒状製品の製造方法および製造設備 |
CN116071242B (zh) * | 2023-03-17 | 2023-07-14 | 山东云海国创云计算装备产业创新中心有限公司 | 一种图像处理方法、系统、设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005088972A1 (en) * | 2004-03-11 | 2005-09-22 | Daeyang Foundation | Method, medium, and filter removing a blocking effect |
US20050243920A1 (en) * | 2004-04-28 | 2005-11-03 | Tomokazu Murakami | Image encoding/decoding device, image encoding/decoding program and image encoding/decoding method |
RU2275677C2 (ru) * | 2003-06-30 | 2006-04-27 | Интел Корпорейшн | Способ, устройство и команда для выполнения знаковой операции умножения |
US20080247462A1 (en) * | 2007-04-03 | 2008-10-09 | Gary Demos | Flowfield motion compensation for video compression |
US20100128168A1 (en) * | 2008-11-25 | 2010-05-27 | Stmicroelectronics Asia Pacific Ptd. Ltd. | Apparatus and method for coding block boundary detection using interpolated autocorrelation |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6332042B1 (en) * | 1997-10-23 | 2001-12-18 | Sony Corporation | Apparatus and method for encoding and decoding data in a lossy transmission environment |
ATE384404T1 (de) | 2002-02-01 | 2008-02-15 | Matsushita Electric Ind Co Ltd | Kodierungsverfahren und dekodierungsverfahren für bewegliche bilder |
CN100562119C (zh) * | 2002-02-01 | 2009-11-18 | 松下电器产业株式会社 | 动画图象译码方法和动画图象译码装置 |
US7170937B2 (en) * | 2002-05-01 | 2007-01-30 | Texas Instruments Incorporated | Complexity-scalable intra-frame prediction technique |
AU2004301091B2 (en) * | 2003-08-19 | 2008-09-11 | Panasonic Corporation | Method for encoding moving image and method for decoding moving image |
EP1558039A1 (en) * | 2004-01-21 | 2005-07-27 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for generating/evaluating prediction information in picture signal encoding/decoding |
KR101204788B1 (ko) * | 2004-06-03 | 2012-11-26 | 삼성전자주식회사 | 영상의 공간 예측 부호화 방법, 부호화 장치, 복호화 방법및 복호화 장치 |
CN1306824C (zh) * | 2004-07-29 | 2007-03-21 | 联合信源数字音视频技术(北京)有限公司 | 图像边界像素扩展系统及其实现方法 |
US7778480B2 (en) * | 2004-11-23 | 2010-08-17 | Stmicroelectronics Asia Pacific Pte. Ltd. | Block filtering system for reducing artifacts and method |
KR100657919B1 (ko) * | 2004-12-13 | 2006-12-14 | 삼성전자주식회사 | 화상 데이터의 공간상 예측 장치 및 방법과 그를 이용한부호화 장치 및 방법, 화상 데이터의 공간상 예측 보상장치 및 방법과 그를 이용한 복호화 장치 및 방법 |
JP2007214641A (ja) * | 2006-02-07 | 2007-08-23 | Seiko Epson Corp | 符号化装置、復号化装置、画像処理装置及び画像処理方法をコンピュータに実行させるためのプログラム |
US20070274398A1 (en) * | 2006-05-23 | 2007-11-29 | Metta Technology, Inc. | Parallelization of Video Decoding on Single-Instruction, Multiple-Data Processors |
KR20090074164A (ko) * | 2006-09-29 | 2009-07-06 | 톰슨 라이센싱 | 기하학적 인트라 예측 |
US7991236B2 (en) * | 2006-10-16 | 2011-08-02 | Nokia Corporation | Discardable lower layer adaptations in scalable video coding |
US20100034268A1 (en) * | 2007-09-21 | 2010-02-11 | Toshihiko Kusakabe | Image coding device and image decoding device |
EP2046053A1 (en) * | 2007-10-05 | 2009-04-08 | Thomson Licensing | Method and device for adaptively quantizing parameters for image coding |
JP4948435B2 (ja) | 2008-01-28 | 2012-06-06 | キヤノン株式会社 | 映像符号化装置及び映像符号化方法 |
KR20090095316A (ko) | 2008-03-05 | 2009-09-09 | 삼성전자주식회사 | 영상 인트라 예측 방법 및 장치 |
CN101247525B (zh) * | 2008-03-24 | 2010-06-02 | 北京邮电大学 | 一种提高图像帧内编码速率的方法 |
JP5238523B2 (ja) * | 2009-01-13 | 2013-07-17 | 株式会社日立国際電気 | 動画像符号化装置、動画像復号化装置、および、動画像復号化方法 |
JP2010251953A (ja) * | 2009-04-14 | 2010-11-04 | Sony Corp | 画像符号化装置と画像符号化方法およびコンピュータ・プログラム |
KR101510108B1 (ko) * | 2009-08-17 | 2015-04-10 | 삼성전자주식회사 | 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
MX367865B (es) | 2010-07-14 | 2019-09-05 | Ntt Docomo Inc | Intrapredicción de baja complejidad para la codificación de video. |
WO2014156046A1 (ja) | 2013-03-29 | 2014-10-02 | 株式会社Jvcケンウッド | 画像符号化装置、画像符号化方法及び画像符号化プログラム、並びに画像復号装置、画像復号方法及び画像復号プログラム |
-
2011
- 2011-07-14 MX MX2018014741A patent/MX367865B/es unknown
- 2011-07-14 PT PT118075126T patent/PT2594076T/pt unknown
- 2011-07-14 ES ES19163444T patent/ES2864048T3/es active Active
- 2011-07-14 PT PT151696044T patent/PT2934008T/pt unknown
- 2011-07-14 PL PL17170581T patent/PL3226560T3/pl unknown
- 2011-07-14 MX MX2017000542A patent/MX361484B/es unknown
- 2011-07-14 KR KR1020167020283A patent/KR101811360B1/ko active IP Right Grant
- 2011-07-14 CA CA3014052A patent/CA3014052C/en active Active
- 2011-07-14 KR KR1020187005732A patent/KR101927281B1/ko active IP Right Grant
- 2011-07-14 PT PT191836139T patent/PT3570545T/pt unknown
- 2011-07-14 PT PT17170595T patent/PT3232666T/pt unknown
- 2011-07-14 RU RU2013106296/08A patent/RU2579947C2/ru active
- 2011-07-14 KR KR1020187018014A patent/KR101927283B1/ko active IP Right Grant
- 2011-07-14 AU AU2011279139A patent/AU2011279139B2/en active Active
- 2011-07-14 KR KR1020187018015A patent/KR101924885B1/ko active IP Right Grant
- 2011-07-14 EP EP15169606.9A patent/EP2934009B1/en active Active
- 2011-07-14 ES ES17170595T patent/ES2729031T3/es active Active
- 2011-07-14 BR BR112013000963A patent/BR112013000963B1/pt active IP Right Grant
- 2011-07-14 PT PT151696069T patent/PT2934009T/pt unknown
- 2011-07-14 CA CA3014042A patent/CA3014042C/en active Active
- 2011-07-14 PT PT171705817T patent/PT3226560T/pt unknown
- 2011-07-14 CN CN201510547113.8A patent/CN105227960B/zh active Active
- 2011-07-14 ES ES11807512.6T patent/ES2621902T3/es active Active
- 2011-07-14 EP EP17170581.7A patent/EP3226560B1/en active Active
- 2011-07-14 KR KR1020137000687A patent/KR101745928B1/ko active IP Right Grant
- 2011-07-14 PL PL15169604T patent/PL2934008T3/pl unknown
- 2011-07-14 CN CN201180034682.2A patent/CN103004210B/zh active Active
- 2011-07-14 MX MX2013000372A patent/MX2013000372A/es active IP Right Grant
- 2011-07-14 US US13/809,511 patent/US9225986B2/en active Active
- 2011-07-14 CA CA3014131A patent/CA3014131C/en active Active
- 2011-07-14 EP EP11807512.6A patent/EP2594076B1/en active Active
- 2011-07-14 PL PL11807512T patent/PL2594076T3/pl unknown
- 2011-07-14 CN CN201510546896.8A patent/CN105120263B/zh active Active
- 2011-07-14 HU HUE19163444A patent/HUE053802T2/hu unknown
- 2011-07-14 PL PL19183613T patent/PL3570545T3/pl unknown
- 2011-07-14 HU HUE19183613A patent/HUE054630T2/hu unknown
- 2011-07-14 CA CA3098217A patent/CA3098217C/en active Active
- 2011-07-14 EP EP19163444.3A patent/EP3522535B1/en active Active
- 2011-07-14 EP EP19183613.9A patent/EP3570545B1/en active Active
- 2011-07-14 ES ES15169604.4T patent/ES2605530T3/es active Active
- 2011-07-14 JP JP2013519828A patent/JP5687341B2/ja active Active
- 2011-07-14 PL PL15169606T patent/PL2934009T3/pl unknown
- 2011-07-14 WO PCT/US2011/044014 patent/WO2012009540A1/en active Application Filing
- 2011-07-14 RU RU2015141145A patent/RU2613725C1/ru active
- 2011-07-14 EP EP15169604.4A patent/EP2934008B1/en active Active
- 2011-07-14 EP EP17170595.7A patent/EP3232666B1/en active Active
- 2011-07-14 CA CA2934184A patent/CA2934184C/en active Active
- 2011-07-14 PL PL17170595T patent/PL3232666T3/pl unknown
- 2011-07-14 CA CA2804762A patent/CA2804762C/en active Active
- 2011-07-14 ES ES15169606.9T patent/ES2637446T3/es active Active
- 2011-07-14 ES ES17170581T patent/ES2748100T3/es active Active
- 2011-07-14 SG SG2013002811A patent/SG187065A1/en unknown
- 2011-07-14 ES ES19183613T patent/ES2873847T3/es active Active
- 2011-07-14 CN CN201510548062.0A patent/CN105120264B/zh active Active
- 2011-07-14 KR KR1020167020284A patent/KR101835460B1/ko active IP Right Grant
- 2011-07-14 MX MX2015002858A patent/MX344987B/es unknown
- 2011-07-14 CA CA3096445A patent/CA3096445C/en active Active
- 2011-07-14 RU RU2015141279A patent/RU2613722C1/ru active
- 2011-07-14 KR KR1020177035940A patent/KR101878293B1/ko active IP Right Grant
- 2011-07-14 PT PT191634443T patent/PT3522535T/pt unknown
- 2011-07-14 PL PL19163444T patent/PL3522535T3/pl unknown
-
2013
- 2013-01-10 MX MX2019010417A patent/MX2019010417A/es unknown
-
2014
- 2014-05-23 JP JP2014107274A patent/JP5808839B2/ja active Active
- 2014-11-13 JP JP2014231022A patent/JP6169554B2/ja active Active
-
2015
- 2015-09-30 US US14/871,144 patent/US10116960B2/en active Active
- 2015-09-30 US US14/871,274 patent/US9942565B2/en active Active
-
2016
- 2016-07-11 JP JP2016136703A patent/JP6321091B2/ja active Active
-
2017
- 2017-03-07 RU RU2017107462A patent/RU2658880C1/ru active
-
2018
- 2018-02-23 US US15/903,390 patent/US10397608B2/en active Active
- 2018-04-04 JP JP2018072261A patent/JP6484740B2/ja active Active
- 2018-04-04 JP JP2018072262A patent/JP6479237B2/ja active Active
- 2018-05-31 RU RU2018120140A patent/RU2687031C1/ru active
-
2019
- 2019-02-18 JP JP2019026729A patent/JP6663520B2/ja active Active
- 2019-04-23 RU RU2019112302A patent/RU2710947C1/ru active
- 2019-04-23 RU RU2019112301A patent/RU2710946C1/ru active
- 2019-04-23 RU RU2019112303A patent/RU2738786C2/ru active
- 2019-07-12 US US16/510,188 patent/US10841613B2/en active Active
- 2019-07-12 US US16/510,217 patent/US10841614B2/en active Active
-
2020
- 2020-02-14 JP JP2020023595A patent/JP6828199B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2275677C2 (ru) * | 2003-06-30 | 2006-04-27 | Интел Корпорейшн | Способ, устройство и команда для выполнения знаковой операции умножения |
WO2005088972A1 (en) * | 2004-03-11 | 2005-09-22 | Daeyang Foundation | Method, medium, and filter removing a blocking effect |
US20050243920A1 (en) * | 2004-04-28 | 2005-11-03 | Tomokazu Murakami | Image encoding/decoding device, image encoding/decoding program and image encoding/decoding method |
US20080247462A1 (en) * | 2007-04-03 | 2008-10-09 | Gary Demos | Flowfield motion compensation for video compression |
US20100128168A1 (en) * | 2008-11-25 | 2010-05-27 | Stmicroelectronics Asia Pacific Ptd. Ltd. | Apparatus and method for coding block boundary detection using interpolated autocorrelation |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2710946C1 (ru) | Внутреннее предсказание с низкой сложностью для кодирования видеосигнала | |
AU2015264787B2 (en) | Low-complexity intra prediction for video coding | |
AU2018263981A1 (en) | Low-complexity intra prediction for video coding |