Снижение скорости в битах сигнала видеоизображения для распространения* в реальном времени приложений цифрового изображения для большого экрана с целью демонстрации в театральной среде



Дата24.02.2016
өлшемі124.41 Kb.
#16475

Рек. МСЭ-R BT.1687-1

Рекомендация МСЭ-R BT.1687-1

Снижение скорости в битах сигнала видеоизображения для распространения* в реальном времени приложений цифрового изображения для большого
экрана с целью демонстрации в театральной среде

(Вопрос МСЭ-R 15/6)

(2004-2006)

Сфера применения

В настоящей Рекомендации рассматривается снижение скорости в битах сигнала видеоизображения для распространения в реальном времени приложений цифрового изображения для большого экрана с целью демонстрации в театральной среде, и в ней содержатся примеры скоростей передачи для сигналов, компрессированных с применением стандартов MPEG-2 и MPEG-4/AVC, используемых в LSDI приложениях. Системы цифрового изображения LSDI, расположенные в основной полосе частот, определены в Рекомендации МСЭ-R BT.1680.

Ассамблея радиосвязи МСЭ,

учитывая,

a) что крайне желательно при распространении и демонстрации программы с цифровым изображением для большого экрана (LSDI) сохранять творческий замысел и качество изображения, присущие мастер-копии для распространения1, насколько это позволяют условия демонстрации программы;

b) что в Рекомендации МСЭ-R BT.1680 описаны рекомендованные системы цифрового изображения, которые удовлетворяют требованиям LSDI приложений с целью демонстрации в театральной среде и должны использоваться для распространения этих приложений;

c) что при распространении LSDI приложений необходимо снижать битовую скорость сигнала программы с целью сокращения требуемой пропускной способности и уменьшения времени и стоимости передачи, не ухудшая качество программы, воспринимаемой зрителем;

d) что человеческое зрение имеет гораздо большую степень обнаружения ярких деталей, чем цветных;

e) что рабочей группой ИСО/МЭК JTC 1/SC 29/WG 11 выполнены и описаны обширные исследования битовой скорости, требуемой для обеспечения фактически прозрачной компрессии видеосигнала2 с различными алгоритмами компрессии и для различных систем обработки изображения3;

f) что в этих испытаниях подтверждено, что кодирование MPEG-2 на MP@HL с оптимизированным кодером4 со скоростью 20 Мбит/с является фактически прозрачным относительно качества источника для систем изображения, указанных в Рекомендации МСЭ-R BT.1680, при скорости кадров 25 или 30 Гц с прогрессивной или чересстрочной разверткой;

g) что система сжатия видеосигнала MPEG-2 легко доступна и широко используется сегодня и она отвечает требованиям МСЭ в области патентной политики;

h) что недавно разработана новая система сжатия видеосигнала, созданная на основе MPEG-2 и получившая название MPEG-4/AVC (Рекомендация МСЭ-T H.264), и даже в первоначальной реализации кодеков этой системы она обеспечивает примерно вдвое более эффективное сжатие, чем MPEG-2;

j) что недавно разработано несколько дополнений к исходной версии системы кодирования источника MPEG-4/AVC, известных как "Расширения диапазона достоверности" (FRExt), которые способны обеспечить еще более высокую эффективность кодирования, поддерживая кодирование изображений размером 1080/1920 пикселов при частоте кадров 50 и 60 кадров в секунду;

k) что применения системы кодирования источника MPEG-4/AVC может оказаться привлекательной возможностью для LSDI приложений, принимая во внимание, что для доставки LSDI программ потребуется намного меньшая битовая скорость, хотя кодеки MPEG-4/AVC значительно сложнее и, следовательно, можно ожидать, что они будут и несколько дороже;

l) что MPEG-4/AVC предлагает большую гибкость в выборе параметров кодирования изображения, например структура 4:4:4, 10 или 12 битов на отсчет и частоты кадров более 72 Гц;

m) что несколько стран в настоящее время создают службы для демонстрации LSDI программ в театральной среде или планируют создать их в ближайшем будущем,

рекомендует

1 чтобы на первых этапах реализации LSDI приложений, предназначенных для демонстрации в театральной среде, на входных и выходных интерфейсах распределительной сети LSDI использовался цифровой видеосигнал, который соответствует Рекомендации МСЭ R BT.1680;

2 чтобы, учитывая тот факт, что человеческое зрение имеет гораздо большую степень обнаружения ярких деталей, чем цветных, при распространении LSDI программ с целью демонстрации в театральной среде использовалось видеокодирование со структурой 4:2:0 или, предпочтительно, со структурой 4:2:2;

3 чтобы, поскольку сигнал LSDI программы после его распространения, как правило, не будет подвергаться постпроизводственной творческой обработке изображения, при распространении LSDI программ с целью демонстрации в театральной среде предпочтительно использовалось межкадровое снижение скорости в битах, поскольку оно обеспечивает более высокую эффективность сжатия, чем внутрикадровое кодирование; известно, что, в случае добавления местных программ (по плану монтажа или расписанию вещания) предпочтительно внутрикадровое кодирование и что в таком случае минимальное значение скорости видеопотока может оказаться выше;

4 чтобы, поскольку снижение скорости в битах, используемое в канале распространения, должно быть фактически прозрачным относительно качества мастер-копии для распространения при данных условиях демонстрации, то при распространении в реальном времени LSDI программ, предназначенных для демонстрации в театральной среде, в качестве решения на ближайшее будущее рассматривался метод межкадрового снижения битовой скорости MPEG-2 на MP@HL (HiQ) с минимальной чистой битовой скоростью видеосигнала порядка 20 Мбит/с (применение кодирования 4:2:2 @ HL потребует чуть более высокой битовой скорости);

5 чтобы применение метода снижения битовой скорости MPEG-4/AVC рассматривалось как чрезвычайно полезная альтернатива, особенно, когда желательно иметь намного меньшую чистую битовую скорость для доставки LSDI программ и допустимо использование несколько более сложных кодеков;

ПРИМЕЧАНИЕ 1. – Рекомендация МСЭ-T H.264 существует в электронной форме и доступна по адресу: http://www.itu.int/md/R03-SG06-C-0211/en.



6 чтобы своевременно была проанализирована возможность использования кодеков, обеспечивающих еще более эффективное сжатие, которые могут появиться в будущем, когда они будут отвечать патентной политике МСЭ и будут тщательно проверены, широко доступны и, желательно, совместимы с кодеками MPEG-2 и MPEG-4/AVC.

Дополнение 1
(Информативное)

Примерные параметры и минимальные средства для различных членов семейства кодов источника LSDI систем обработки изображения,


описанных в Рекомендации МСЭ-R BT.709, со ссылками
на MPEG-4/AVC (Рекомендация МСЭ-T H.264)

В настоящем Дополнении представлены примерные параметры и минимальные средства для метода кодирования источника MPEG-4/AVC (Рекомендация МСЭ-T H.264), которые могут быть использованы для сжатия сигналов различных систем обработки изображения семейства LSDI, описанных в Рекомендации МСЭ-R BT.709-5 (Часть 2). В нем также даются сведения о требуемой скорости по битам для фактически прозрачной транспортировки этих сигналов, когда источник закодирован подобным методом.




Член семейства по
Рек. МСЭ-R BT.709


Параметры и минимальные средства MPEG 4/AVC

Скорость по битам для фактически прозрачной транспортировки

1 920 × 1 080 × 24/25p

Уровень 4

Средства кодирования Высокие 10

Средства основного профиля X

Формат кодирования цвета 4:2:0 X

Глубина 8-битового отсчета X

Адаптивность преобразования
8 × 8 относительно 4 × 4 X

Матрицы округления квантования X

Раздельное управление QP в Cb и Cr X

Формат монохромного видеосигнала X

Глубина 9 и 10-битового отсчета X

Формат кодирования цвета 4:2:2

Глубина 11 и 12-битового отсчета

Формат кодирования цвета 4:4:4

Преобразование остаточного цвета

Предиктивное кодирование без потерь



9–11 Мбит/с – Качество записи

7–10 Мбит/с – Качество распространения



1 920 × 1 080 × 60/50i

Уровень 4

Средства кодирования Высокие 4:2:2

Средства основного профиля X

Формат кодирования цвета 4:2:0 X

Глубина 8-битового отсчета X

Адаптивность преобразования
8 × 8 относительно 4 × 4 X

Матрицы округления квантования X

Раздельное управление QP в Cb и Cr X

Формат монохромного видеосигнала X

Глубина 9 и 10-битового отсчета X

Формат кодирования цвета 4:2:2 X

Глубина 11 и 12-битового отсчета

Формат кодирования цвета 4:4:4

Преобразование остаточного цвета

Предиктивное кодирование без потерь



10–15 Мбит/с – Качество записи

8–12 Мбит/с – Качество распространения



1 920 × 1 080 × 60/50p

Уровень 4.2

Средства кодирования Высокие 4:2:2

Средства основного профиля X

Формат кодирования цвета 4:2:0 X

Глубина 8-битового отсчета X

Адаптивность преобразования
8 × 8 относительно 4 × 4 X

Матрицы округления квантования X

Раздельное управление QP в Cb и Cr X

Формат монохромного видеосигнала X

Глубина 9 и 10-битового отсчета X

Формат кодирования цвета 4:2:2 X

Глубина 11 и 12-битового отсчета

Формат кодирования цвета 4:4:4

Преобразование остаточного цвета

Предиктивное кодирование без потерь



18–20 Мбит/с – Формат передачи

ПРИМЕЧАНИЕ. – Использование 10 битовых отсчетов может не привести к увеличению битовой скорости относительно той, что требуется для 8-битовых отсчетов.



1 920 × 1 080 × 24/25p

Уровень 4

Средства кодирования Высокие 4:2:2

Средства основного профиля X

Формат кодирования цвета 4:2:0 X

Глубина 8-битового отсчета X

Адаптивность преобразования
8 × 8 относительно 4 × 4 X

Матрицы округления квантования X

Раздельное управление QP в Cb и Cr X

Формат монохромного видеосигнала X

Глубина 9 и 10-битового отсчета X

Формат кодирования цвета 4:2:2 X

Глубина 11 и 12-битового отсчета

Формат кодирования цвета 4:4:4

Преобразование остаточного цвета

Предиктивное кодирование без потерь



8–10 Мбит/с – Передача

Режим "кинофильм" высокого качества



Прилагаемый документ 1

Информация о методе кодирования источника MPEG-4/AVC


[Sullivan et al., 2004]

Рекомендация МСЭ-T H.264/MPEG-4 (Часть 10) Улучшенное видеокодирование (обычно называемое H.264/AVC) – это последний стандарт из серии международных стандартов кодирования изображений. В настоящее время это наиболее эффективный и соответствующий последним достижениям стандарт, он был разработан объединенной группой видеоинженеров (JVT), состоящей из группы экспертов МСЭ-Т по видеокодированию (VCEG) и группы экспертов ИСО/МЭК по вопросам кинотехники (MPEG).

Как и в предыдущих стандартах, его техническое решение обеспечивает актуальный баланс между эффективностью кодирования, сложностью реализации и затратами, который базируется на технологии СБИС (центральные процессоры, цифровые процессоры, прикладные интегральные схемы, перепрограммируемые микросхемы и т. д.) современного уровня.

При этом, был создан стандарт, который улучшил эффективность кодирования как минимум вдвое (в среднем) относительно MPEG-2, сохранив затраты в допустимых пределах.

В июле 2004 года к этому стандарту была добавлена новая поправка, получившая название Расширения диапазона достоверности (FRExt, поправка 1), которая показывает еще более высокую эффективность кодирования относительно MPEG-2, и для некоторых ключевых приложений, в потенциале достигая показателя не менее 3:1.

Имея широкий спектр приложений, исходный стандарт H.264/AVC (разработка которого была завершена в мае 2003 г.), был, главным образом, нацелен на изображение "развлекательного качества", с 8 битовым квантованием и форматом цветовых отсчетов 4:2:0. Из-за ограничения во времени он не включал в себя поддержку использования в жестких условиях профессионального телевидения, его техническое решение не было нацелено на самое высокое разрешение. Для таких приложений, как доставка программ по каналам связи, распространение программ и студийные монтаж и постобработка, может потребоваться:

– использовать источники с разрешающей способностью более 8-битов на отсчет;

– использовать более высокую разрешающую способность для воспроизведения цвета, чем применяется в потребительских приложениях (т. е. использовать форматы квантования цвета 4:2:2 или 4:4:4, в отличие от формата квантования цвета 4:2:0);

– выполнять монтаж исходного материала, например смешивание по альфа-каналу (процесс смешивания нескольких видеосцен, более известный при передаче прогноза погоды, где он используется для наложения изображения диктора на изображение карты или метеосводки);

– использовать очень высокие битовые скорости;

– использовать очень высокое разрешение;

– достигать очень высокой достоверности – даже воспроизводить некоторые части изображения без потерь;

– избегать ошибок трансформации цветового пространства из-за ошибок округления;

– использовать цветовое представление RGB.

Проект FRExt создал комплект, состоящий из четырех новых профилей, которые все вместе называются высокими профилями:

1) высокий профиль (HP), поддерживающий 8-битовое квантование видеосигнала с форматом отсчетов 4:2:0, предназначенный для потребительского использования с качеством high-end и для других приложений, использующих видео высокой точности без необходимости расширения цветовых форматов или увеличения точности квантования;

2) высокий профиль 10 (Hi10P), поддерживающий квантование видеосигнала с форматом 4:2:0 и точностью представления до 10 битов на отсчет;

3) высокий профиль 4:2:2 (H422P), поддерживающий квантование цветового сигнала с форматом 4:2:2 и точностью представления до 10 битов на отсчет;

4) высокий профиль 4:4:4 (H444P), поддерживающий квантование цветового сигнала с форматом до 4:4:4, точностью представления до 12 битов на отсчет и дополнительно поддерживающий эффективное безошибочное кодирование и целочисленное преобразование остаточного цвета для кодирования RGB видеосигнала, и при этом избегающий ошибок трансформации цветового пространства.

Поскольку стандарт FRExt еще довольно молод, и некоторые из его преимуществ являются скорее субъективными, чем объективными, измерить его возможности довольно затруднительно. Одним существенным параметром является результат субъективной оценки качества, выполненный Ассоциацией "Blu-ray Disc" (BDA). Итоговые результаты отчета об испытаниях, информация о котором дана в сноске, показаны на рис. 1.

Эти испытания, выполненные на кинопрограмме со скоростью 24 кадра в секунду с прогрессивной разверткой и растром 1 920 × 1 080, показывают следующие номинальные результаты (которые не следует считать точно статистически доказанными):

– Высокий профиль стандарта FRExt, как правило, показывает лучшее качество изображения, чем MPEG-2, используя при этом не более одной трети битов (8 Мбит/с против 24 Мбит/с).

– Высокий профиль стандарта FRExt, как правило, показывает прозрачное (т. е. трудно отличимое от оригинального видеоматериала без компрессии) качество изображения при скорости только 16 Мбит/с.

Оценка качества (3,0), считающаяся приемлемой в этой организации для использования в целом ряде носителей информации высокой точности, была существенно превышена при использовании скорости не более 8 Мбит/с. Кроме того, наблюдались наилучшие показатели качества для метода кодирования H.264/AVC, использованного в данных испытаниях. Таким образом, вполне вероятно, что может использоваться скорость по битам много ниже 8 Мбит/с и при этом будет сохраняться оценка качества 3,0, которая определена как показатель достаточного качества и названа "приемлемая точность" в таких приложениях с высокими требованиями.

РИСУНОК 1

Сравнение MPEG-2 и H.264

Результат примера испытания объективного сравнения (PSNR), выполненного компанией FastVDO5, показан на рис. 2. Эти объективные результаты подтверждают высокое качество высокого профиля. (Опять-таки, субоптимальное использование В-кадров делает показанное на рисунке качество более низким для FRExt.)

РИСУНОК 2

Сравнение PSNR


Справочные документы

SULLIVAN, G.J., TOPIWALA, P. and LUTHRA, A. [August, 2004] The H.264/AVC Advanced Video Coding Standard: Overview and Introduction to the Fidelity Range Extensions. Presented at the SPIE Conference on Applications of Digital Image Processing XXVII, Special Session on Advances in the New Emerging Standard: H.264/AVC.

WEDI, T. and KASHIWAGI, Y. [July 2004] Subjective quality evaluation of H.264/AVC FRExt for HD movie content. Joint Video Team document JVT-L033.

_______________



*МСЭ определяет "распространение" следующим образом: "Передача телевизионных программ, для которых не ожидается дальнейшей пост-производственной обработки".

1Термин "мастер-копия для распространения" используется здесь для обозначения мастер-копии программы, полученной из первого оригинала, после того как она была подготовлена (по содержанию и качеству) для конкретной среды распространения.

2МСЭ определяет "прозрачное снижение битовой скорости видеосигнала" как "процесс уменьшения битовой скорости видеосигнала, который не влияет на субъективное качество звуковых и видеопоследовательностей".

3Например, см. Документ ИСО/МЭК JTC 1/SC 29/WG 11 – MPEG2003/N6231, декабрь 2003 г.,
Waikoloa – Отчет об официальных испытаниях системы AVC (ИСО/МЭК 14496-10 – Рек. МСЭ-T H.264).

4 Термин "оптимизированный кодер" используется здесь для обозначения кодера, совместимого с MPEG-2, созданного аппаратно и реализующего улучшенные решения, то есть оптимизированного для "контрольной модели" кодера MPEG-2 TM5, который реализован программно и был одобрен рабочей группой ИСО/МЭК JTC 1/SC 29/WG 11 как "опорный".

5FastVDO – это компания, которая специализируется на технологиях для сред передачи и программном обеспечении инфраструктуры. Находится в Колумбии, Мэриленд, США.



Достарыңызбен бөлісу:




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет