Рек. МСЭ-R BT.1687-1
Рекомендация МСЭ-R BT.1687-1
Снижение скорости в битах сигнала видеоизображения для распространения* в реальном времени приложений цифрового изображения для большого
экрана с целью демонстрации в театральной среде
(Вопрос МСЭ-R 15/6)
(2004-2006)
Сфера применения
В настоящей Рекомендации рассматривается снижение скорости в битах сигнала видеоизображения для распространения в реальном времени приложений цифрового изображения для большого экрана с целью демонстрации в театральной среде, и в ней содержатся примеры скоростей передачи для сигналов, компрессированных с применением стандартов MPEG-2 и MPEG-4/AVC, используемых в LSDI приложениях. Системы цифрового изображения LSDI, расположенные в основной полосе частот, определены в Рекомендации МСЭ-R BT.1680.
Ассамблея радиосвязи МСЭ,
учитывая,
a) что крайне желательно при распространении и демонстрации программы с цифровым изображением для большого экрана (LSDI) сохранять творческий замысел и качество изображения, присущие мастер-копии для распространения1, насколько это позволяют условия демонстрации программы;
b) что в Рекомендации МСЭ-R BT.1680 описаны рекомендованные системы цифрового изображения, которые удовлетворяют требованиям LSDI приложений с целью демонстрации в театральной среде и должны использоваться для распространения этих приложений;
c) что при распространении LSDI приложений необходимо снижать битовую скорость сигнала программы с целью сокращения требуемой пропускной способности и уменьшения времени и стоимости передачи, не ухудшая качество программы, воспринимаемой зрителем;
d) что человеческое зрение имеет гораздо большую степень обнаружения ярких деталей, чем цветных;
e) что рабочей группой ИСО/МЭК JTC 1/SC 29/WG 11 выполнены и описаны обширные исследования битовой скорости, требуемой для обеспечения фактически прозрачной компрессии видеосигнала2 с различными алгоритмами компрессии и для различных систем обработки изображения3;
f) что в этих испытаниях подтверждено, что кодирование MPEG-2 на MP@HL с оптимизированным кодером4 со скоростью 20 Мбит/с является фактически прозрачным относительно качества источника для систем изображения, указанных в Рекомендации МСЭ-R BT.1680, при скорости кадров 25 или 30 Гц с прогрессивной или чересстрочной разверткой;
g) что система сжатия видеосигнала MPEG-2 легко доступна и широко используется сегодня и она отвечает требованиям МСЭ в области патентной политики;
h) что недавно разработана новая система сжатия видеосигнала, созданная на основе MPEG-2 и получившая название MPEG-4/AVC (Рекомендация МСЭ-T H.264), и даже в первоначальной реализации кодеков этой системы она обеспечивает примерно вдвое более эффективное сжатие, чем MPEG-2;
j) что недавно разработано несколько дополнений к исходной версии системы кодирования источника MPEG-4/AVC, известных как "Расширения диапазона достоверности" (FRExt), которые способны обеспечить еще более высокую эффективность кодирования, поддерживая кодирование изображений размером 1080/1920 пикселов при частоте кадров 50 и 60 кадров в секунду;
k) что применения системы кодирования источника MPEG-4/AVC может оказаться привлекательной возможностью для LSDI приложений, принимая во внимание, что для доставки LSDI программ потребуется намного меньшая битовая скорость, хотя кодеки MPEG-4/AVC значительно сложнее и, следовательно, можно ожидать, что они будут и несколько дороже;
l) что MPEG-4/AVC предлагает большую гибкость в выборе параметров кодирования изображения, например структура 4:4:4, 10 или 12 битов на отсчет и частоты кадров более 72 Гц;
m) что несколько стран в настоящее время создают службы для демонстрации LSDI программ в театральной среде или планируют создать их в ближайшем будущем,
рекомендует
1 чтобы на первых этапах реализации LSDI приложений, предназначенных для демонстрации в театральной среде, на входных и выходных интерфейсах распределительной сети LSDI использовался цифровой видеосигнал, который соответствует Рекомендации МСЭ R BT.1680;
2 чтобы, учитывая тот факт, что человеческое зрение имеет гораздо большую степень обнаружения ярких деталей, чем цветных, при распространении LSDI программ с целью демонстрации в театральной среде использовалось видеокодирование со структурой 4:2:0 или, предпочтительно, со структурой 4:2:2;
3 чтобы, поскольку сигнал LSDI программы после его распространения, как правило, не будет подвергаться постпроизводственной творческой обработке изображения, при распространении LSDI программ с целью демонстрации в театральной среде предпочтительно использовалось межкадровое снижение скорости в битах, поскольку оно обеспечивает более высокую эффективность сжатия, чем внутрикадровое кодирование; известно, что, в случае добавления местных программ (по плану монтажа или расписанию вещания) предпочтительно внутрикадровое кодирование и что в таком случае минимальное значение скорости видеопотока может оказаться выше;
4 чтобы, поскольку снижение скорости в битах, используемое в канале распространения, должно быть фактически прозрачным относительно качества мастер-копии для распространения при данных условиях демонстрации, то при распространении в реальном времени LSDI программ, предназначенных для демонстрации в театральной среде, в качестве решения на ближайшее будущее рассматривался метод межкадрового снижения битовой скорости MPEG-2 на MP@HL (HiQ) с минимальной чистой битовой скоростью видеосигнала порядка 20 Мбит/с (применение кодирования 4:2:2 @ HL потребует чуть более высокой битовой скорости);
5 чтобы применение метода снижения битовой скорости MPEG-4/AVC рассматривалось как чрезвычайно полезная альтернатива, особенно, когда желательно иметь намного меньшую чистую битовую скорость для доставки LSDI программ и допустимо использование несколько более сложных кодеков;
ПРИМЕЧАНИЕ 1. – Рекомендация МСЭ-T H.264 существует в электронной форме и доступна по адресу: http://www.itu.int/md/R03-SG06-C-0211/en.
6 чтобы своевременно была проанализирована возможность использования кодеков, обеспечивающих еще более эффективное сжатие, которые могут появиться в будущем, когда они будут отвечать патентной политике МСЭ и будут тщательно проверены, широко доступны и, желательно, совместимы с кодеками MPEG-2 и MPEG-4/AVC.
Дополнение 1
(Информативное)
Примерные параметры и минимальные средства для различных членов семейства кодов источника LSDI систем обработки изображения,
описанных в Рекомендации МСЭ-R BT.709, со ссылками
на MPEG-4/AVC (Рекомендация МСЭ-T H.264)
В настоящем Дополнении представлены примерные параметры и минимальные средства для метода кодирования источника MPEG-4/AVC (Рекомендация МСЭ-T H.264), которые могут быть использованы для сжатия сигналов различных систем обработки изображения семейства LSDI, описанных в Рекомендации МСЭ-R BT.709-5 (Часть 2). В нем также даются сведения о требуемой скорости по битам для фактически прозрачной транспортировки этих сигналов, когда источник закодирован подобным методом.
Член семейства по
Рек. МСЭ-R BT.709
|
Параметры и минимальные средства MPEG 4/AVC
|
Скорость по битам для фактически прозрачной транспортировки
|
1 920 × 1 080 × 24/25p
|
Уровень 4
Средства кодирования Высокие 10
Средства основного профиля X
Формат кодирования цвета 4:2:0 X
Глубина 8-битового отсчета X
Адаптивность преобразования
8 × 8 относительно 4 × 4 X
Матрицы округления квантования X
Раздельное управление QP в Cb и Cr X
Формат монохромного видеосигнала X
Глубина 9 и 10-битового отсчета X
Формат кодирования цвета 4:2:2
Глубина 11 и 12-битового отсчета
Формат кодирования цвета 4:4:4
Преобразование остаточного цвета
Предиктивное кодирование без потерь
|
9–11 Мбит/с – Качество записи
7–10 Мбит/с – Качество распространения
|
1 920 × 1 080 × 60/50i
|
Уровень 4
Средства кодирования Высокие 4:2:2
Средства основного профиля X
Формат кодирования цвета 4:2:0 X
Глубина 8-битового отсчета X
Адаптивность преобразования
8 × 8 относительно 4 × 4 X
Матрицы округления квантования X
Раздельное управление QP в Cb и Cr X
Формат монохромного видеосигнала X
Глубина 9 и 10-битового отсчета X
Формат кодирования цвета 4:2:2 X
Глубина 11 и 12-битового отсчета
Формат кодирования цвета 4:4:4
Преобразование остаточного цвета
Предиктивное кодирование без потерь
|
10–15 Мбит/с – Качество записи
8–12 Мбит/с – Качество распространения
|
1 920 × 1 080 × 60/50p
|
Уровень 4.2
Средства кодирования Высокие 4:2:2
Средства основного профиля X
Формат кодирования цвета 4:2:0 X
Глубина 8-битового отсчета X
Адаптивность преобразования
8 × 8 относительно 4 × 4 X
Матрицы округления квантования X
Раздельное управление QP в Cb и Cr X
Формат монохромного видеосигнала X
Глубина 9 и 10-битового отсчета X
Формат кодирования цвета 4:2:2 X
Глубина 11 и 12-битового отсчета
Формат кодирования цвета 4:4:4
Преобразование остаточного цвета
Предиктивное кодирование без потерь
|
18–20 Мбит/с – Формат передачи
ПРИМЕЧАНИЕ. – Использование 10 битовых отсчетов может не привести к увеличению битовой скорости относительно той, что требуется для 8-битовых отсчетов.
|
1 920 × 1 080 × 24/25p
|
Уровень 4
Средства кодирования Высокие 4:2:2
Средства основного профиля X
Формат кодирования цвета 4:2:0 X
Глубина 8-битового отсчета X
Адаптивность преобразования
8 × 8 относительно 4 × 4 X
Матрицы округления квантования X
Раздельное управление QP в Cb и Cr X
Формат монохромного видеосигнала X
Глубина 9 и 10-битового отсчета X
Формат кодирования цвета 4:2:2 X
Глубина 11 и 12-битового отсчета
Формат кодирования цвета 4:4:4
Преобразование остаточного цвета
Предиктивное кодирование без потерь
|
8–10 Мбит/с – Передача
Режим "кинофильм" высокого качества
|
Прилагаемый документ 1
Информация о методе кодирования источника MPEG-4/AVC
[Sullivan et al., 2004]
Рекомендация МСЭ-T H.264/MPEG-4 (Часть 10) Улучшенное видеокодирование (обычно называемое H.264/AVC) – это последний стандарт из серии международных стандартов кодирования изображений. В настоящее время это наиболее эффективный и соответствующий последним достижениям стандарт, он был разработан объединенной группой видеоинженеров (JVT), состоящей из группы экспертов МСЭ-Т по видеокодированию (VCEG) и группы экспертов ИСО/МЭК по вопросам кинотехники (MPEG).
Как и в предыдущих стандартах, его техническое решение обеспечивает актуальный баланс между эффективностью кодирования, сложностью реализации и затратами, который базируется на технологии СБИС (центральные процессоры, цифровые процессоры, прикладные интегральные схемы, перепрограммируемые микросхемы и т. д.) современного уровня.
При этом, был создан стандарт, который улучшил эффективность кодирования как минимум вдвое (в среднем) относительно MPEG-2, сохранив затраты в допустимых пределах.
В июле 2004 года к этому стандарту была добавлена новая поправка, получившая название Расширения диапазона достоверности (FRExt, поправка 1), которая показывает еще более высокую эффективность кодирования относительно MPEG-2, и для некоторых ключевых приложений, в потенциале достигая показателя не менее 3:1.
Имея широкий спектр приложений, исходный стандарт H.264/AVC (разработка которого была завершена в мае 2003 г.), был, главным образом, нацелен на изображение "развлекательного качества", с 8 битовым квантованием и форматом цветовых отсчетов 4:2:0. Из-за ограничения во времени он не включал в себя поддержку использования в жестких условиях профессионального телевидения, его техническое решение не было нацелено на самое высокое разрешение. Для таких приложений, как доставка программ по каналам связи, распространение программ и студийные монтаж и постобработка, может потребоваться:
– использовать источники с разрешающей способностью более 8-битов на отсчет;
– использовать более высокую разрешающую способность для воспроизведения цвета, чем применяется в потребительских приложениях (т. е. использовать форматы квантования цвета 4:2:2 или 4:4:4, в отличие от формата квантования цвета 4:2:0);
– выполнять монтаж исходного материала, например смешивание по альфа-каналу (процесс смешивания нескольких видеосцен, более известный при передаче прогноза погоды, где он используется для наложения изображения диктора на изображение карты или метеосводки);
– использовать очень высокие битовые скорости;
– использовать очень высокое разрешение;
– достигать очень высокой достоверности – даже воспроизводить некоторые части изображения без потерь;
– избегать ошибок трансформации цветового пространства из-за ошибок округления;
– использовать цветовое представление RGB.
Проект FRExt создал комплект, состоящий из четырех новых профилей, которые все вместе называются высокими профилями:
1) высокий профиль (HP), поддерживающий 8-битовое квантование видеосигнала с форматом отсчетов 4:2:0, предназначенный для потребительского использования с качеством high-end и для других приложений, использующих видео высокой точности без необходимости расширения цветовых форматов или увеличения точности квантования;
2) высокий профиль 10 (Hi10P), поддерживающий квантование видеосигнала с форматом 4:2:0 и точностью представления до 10 битов на отсчет;
3) высокий профиль 4:2:2 (H422P), поддерживающий квантование цветового сигнала с форматом 4:2:2 и точностью представления до 10 битов на отсчет;
4) высокий профиль 4:4:4 (H444P), поддерживающий квантование цветового сигнала с форматом до 4:4:4, точностью представления до 12 битов на отсчет и дополнительно поддерживающий эффективное безошибочное кодирование и целочисленное преобразование остаточного цвета для кодирования RGB видеосигнала, и при этом избегающий ошибок трансформации цветового пространства.
Поскольку стандарт FRExt еще довольно молод, и некоторые из его преимуществ являются скорее субъективными, чем объективными, измерить его возможности довольно затруднительно. Одним существенным параметром является результат субъективной оценки качества, выполненный Ассоциацией "Blu-ray Disc" (BDA). Итоговые результаты отчета об испытаниях, информация о котором дана в сноске, показаны на рис. 1.
Эти испытания, выполненные на кинопрограмме со скоростью 24 кадра в секунду с прогрессивной разверткой и растром 1 920 × 1 080, показывают следующие номинальные результаты (которые не следует считать точно статистически доказанными):
– Высокий профиль стандарта FRExt, как правило, показывает лучшее качество изображения, чем MPEG-2, используя при этом не более одной трети битов (8 Мбит/с против 24 Мбит/с).
– Высокий профиль стандарта FRExt, как правило, показывает прозрачное (т. е. трудно отличимое от оригинального видеоматериала без компрессии) качество изображения при скорости только 16 Мбит/с.
Оценка качества (3,0), считающаяся приемлемой в этой организации для использования в целом ряде носителей информации высокой точности, была существенно превышена при использовании скорости не более 8 Мбит/с. Кроме того, наблюдались наилучшие показатели качества для метода кодирования H.264/AVC, использованного в данных испытаниях. Таким образом, вполне вероятно, что может использоваться скорость по битам много ниже 8 Мбит/с и при этом будет сохраняться оценка качества 3,0, которая определена как показатель достаточного качества и названа "приемлемая точность" в таких приложениях с высокими требованиями.
РИСУНОК 1
Сравнение MPEG-2 и H.264
Результат примера испытания объективного сравнения (PSNR), выполненного компанией FastVDO5, показан на рис. 2. Эти объективные результаты подтверждают высокое качество высокого профиля. (Опять-таки, субоптимальное использование В-кадров делает показанное на рисунке качество более низким для FRExt.)
РИСУНОК 2
Сравнение PSNR
Справочные документы
SULLIVAN, G.J., TOPIWALA, P. and LUTHRA, A. [August, 2004] The H.264/AVC Advanced Video Coding Standard: Overview and Introduction to the Fidelity Range Extensions. Presented at the SPIE Conference on Applications of Digital Image Processing XXVII, Special Session on Advances in the New Emerging Standard: H.264/AVC.
WEDI, T. and KASHIWAGI, Y. [July 2004] Subjective quality evaluation of H.264/AVC FRExt for HD movie content. Joint Video Team document JVT-L033.
_______________
Достарыңызбен бөлісу: |