Новые способы измерения уровня аудиосигналов и регулирования громкости в телерадиовещании
Борис Меерзон
Вступление
В настоящее время телевизионное вещание является одним из самых популярных и эффективных видов СМИ.
Излишне говорить о том, что изображение на экране телевизора, само по себе, передаёт телезрителю весьма большой объём информации. Но общее впечатление о телевизионной передаче формируется не только на основе оценки качества самой “картинки”, - наряду с этим огромную роль играет качество сопровождающего картинку звука. Самое технически совершенное изображение оставит зрителя равнодушным и будет совершенно обесценено, если оно сопровождается плохим и неразборчивым звуком.
В литературе описан психологический феномен, полученный в ходе проведения субъективных экспертиз телевизионных передач и много говорящий о роли звука в телевидении: даже хорошая “картинка”, если она сопровождается плохим звуком, оценивается экспертами ниже, чем она же воспринимается в сопровождении звука более высокого качества.
К сожалению, телезрители часто жалуются на то, что техническое качество звукового сопровождения наших, отечественных телевизионных передач далеко не всегда безупречно. Одной из главных проблем и общей бедой телевизионного вещания (не только отечественного, но и зарубежного), являются неожиданные резкие “скачки” громкости звука в телепередачах.
Очень часто телезрители обращают внимание на неоправданные содержанием программы завышения или занижения громкости. Режущие слух перепады громкости замечаются не только при переключении с одной программы на другую, но даже внутри одной и той же передачи. И это вызывает постоянные нарекания телезрителей.
Особенно болезненно воспринимается большая разница громкости в кинофильмах при переходе к рекламе. Происходит это потому, что в процессе производства рекламных роликов звук в них подвергается сильному сжатию по динамическому диапазону (компрессии). Делается это заведомо, чтобы сделать рекламу громче и этим привлечь к ней внимание телезрителя. Но телевизионная реклама, иногда неожиданно врываясь в программу, звучит громче по сравнению с ней децибел на 15, а то и на все 18! И это очень раздражает слушателя.
Прыжки громкости в передачах замечались и в прошлые годы, когда рекламы в вещательных передачах и в помине не было. Несбалансированность звука часто проявлялась, например, на радио. Наиболее это было заметно в передачах, в которых перемежались речевые и музыкальные фрагменты. Преобладание громкости музыкальных фрагментов над речевыми было иногда столь сильным, что слушатель был вынужден много раз в течение одной передачи подстраивать громкость своего приёмника. И причины этого явления для специалистов секретом отнюдь не являются.
Историческая справка
Традиционно, ещё с того времени, когда вещание было только аналоговым, выравнивание громкости радиовещательных и телевизионных передач проводилось на основании показаний измерителей уровня, регистрирующих максимальные величины электрического уровня сигнала (leveling).
При этом установилось неукоснительное правило: учитывая сравнительно узкий (не более 40 дБ) динамический диапазон, разрешённый аналоговой аппаратурой того времени, для его наиболее рационального использования звукорежиссёр должен был вручную строго поддерживать и нормировать уровень передачи по пикам сигнала, ориентируясь на максимальные показания измерителя уровня. Все элементы программы, вне зависимости от их содержания, “загонялись” в единый, достаточно узкий динамический диапазон, чётко ограниченный сверху уровнем, превышение которого могло бы повлечь за собой перемодуляцию передатчика. Такой метод поддержания уровня по дозволенному максимуму был оправдан тем, что это позволяло улучшить в передаче соотношение сигнал/шум.
Это правило проведения аналоговых передач, как говорится, въелось в плоть и кровь работников вещания, как на радио, так и на телевидении и действует до сих пор.
Но, при обмене программами между вещательными организациями разных стран не всегда принималось во внимание, что в разных студиях телерадиовещания для контроля уровня звукового сигнала могут использоваться измерители уровня с разными техническими характеристиками. А, как известно, показания приборов сильно зависят от их баллистических (скоростных) характеристик.
Приборы, даже совершенно одинаково откалиброванные по эффективному значению напряжения измерительного синусоидального сигнала, могут, если они имеют разное время интеграции (время, за которое прибор усредняет сигнал), на реальных программах давать существенно отличающиеся друг от друга показания уровня. Это трудно предусмотреть заранее, т.к. показания эти зависят от содержания программы, от её временной структуры, т.е. наличия в ней коротких выбросов и частоты их повторения.
Исторически сложилось так, что в вещательных студиях стран Америки, Австралии и некоторых других в основном используется VU-метры (Volume Units meter), имеющие время интеграции 300 мс и относящиеся к измерителям уровня т.н. средних значений. Этот прибор, из-за своей большой инерционности не успевает отреагировать на короткие импульсы уровня и игнорирует их.
В качестве альтернативы VU-метру, Международная электротехническая комиссия в документе IEC 60268-10, совместно с Европейским вещательным союзом (EBU), рекомендовали более быстродействующий прибор с малым временем интеграции (5 мс)
По международной классификации такие более быстродействующие приборы относятся к классу т.н. пиковых програмных измерителей - РРМ (peak program meter).
Эти приборы дают звукорежиссёру возможность следить за самыми короткими из воспринимаемых на слух выбросами текущего уровня, которые, при превышении допустимого предела, могут вызвать неприятные нелинейные искажения.
Правда, и эти приборы обладают некоторой инерцией, и поэтому на самые короткие, незаметные для слуха пики сигнала, длительностью менее 5 мс, не реагируют. Поэтому, их можно назвать пиковыми только условно, а более точное их наименование QPPM - измерители квазипиковых значений (quasi-peak program meter).
Измерители квазипиковых значений уровня звукового сигнала (QPPM) стандартизованы в России для измерений параметров звукового сигнала и применяются во всех отечественных студиях РВ и ТВ (ГОСТ 21185-75).
Таким образом, в мировом вещательном сообществе ещё со времен аналогового вещания не было единообразного подхода к контролю уровня звукового сигнала: и на радио и на телевидении вещатели разных стран ориентировались на одну из этих двух основных разновидностей приборов: либо на QPPM (квазипиковые), либо на VU-метры (средних значений).
Вот в этом различии контрольных приборов и состояла одна из серьёзных технологических проблем, затрудняющих унификацию уровней звукового вещания: более инерционные приборы занижали показания уровня, а приборы с меньшим временем интеграции, наоборот, завышали их.
Попытки выйти из этого положения осуществлялись давно. Делалось это самыми разными способами. Например, на радио уже лет 40 тому назад применялись в вещании различные модификации автоматических регуляторов уровня – компрессоров и лимитеров. Чисто аппаратным методом предельно сжимался динамический диапазон передачи и “под одну гребёнку” выравнивались пиковые значения сигнала по всей программе, без оглядки на её содержание. До сегодняшнего дня, на большинстве аналоговых FM-радиоканалов, громкость, в основном, выравнивается этим самым примитивным способом, с помощью компрессирования и лимитирования.
Такой способ проведения передач действительно может обеспечить постоянство максимального электрического уровня сигнала и дать возможность приблизительно выровнять среднюю громкость программы. Но подмена звукорежиссёра автоматическим прибором проблему нормализации уровня вещательных передач кардинально не решает. Ведь, при этом нивелируются все художественные нюансы звучания, передача становится “плоской” и невыразительной.
Известно, например, что использование компрессии звука при показе кинофильмов по телевидению приводит к снижению их привлекательности для телезрителей. Как показывают опросы телевизионной аудитории, любители кино в этих случаях просто отказываются от услуг телевидения и предпочитают воспользоваться альтернативой: ранее – прокатом DVD, в настоящее время – сервисом "видео на заказ" (VOD), предоставляемым интернет-телевидением (IPTV), скачиванием телефильмов и сериалов с торрент-серверов, либо их он-лайн просмотром. Таким образом, для высококачественного художественного вещания и, в первую очередь, телевизионного, способ автоматического сжатия динамического диапазона и нормализации уровня по пикам представляется весьма сомнительным.
Даже разработки “умных” автоматов, т.н. “стабилизаторов уровня”, которые, на основе анализа характера сигнала могут отличить музыку от речи и автоматически вносить необходимые поправки по их уровню, до сегодняшнего дня среди вещателей особого одобрения не завоевали и остаются вопросом дискуссионным.
Решение проблемы согласования показаний измерителей уровня с разными характеристиками было достигнуто только в начале 1990-х годов в результате разработки международных рекомендаций по использованию при калибровке каналов передачи системы поправок к показаниям приборов, имеющих разное время интеграции.
Так, в 1992 году Международный телекоммуникационный союз (ITU) опубликовал рекомендацию ITU-R BS. 645-2 “Тест-сигнал и измерения для использования в международных каналах звукового вещания”. В этом документе рекомендовалось настройку звуковых уровней в каналах вещания всегда производить по эталонному, т.н. “выравнивающему” или “установочному” сигналу (Alignment signal (AS). Этот синусоидальный сигнал частоты 1 кГц с уровнем Alignment level (AL) соответствовал нулевому показанию (0 дБ) по шкале самого инерционного из измерителей уровня - VU-метра.
При калибровке канала по установочному уровню предлагалось учитывать тот факт, что прибор средних значений (VU-метр) на коротких пиках уровня (длительностью 5 – 10 мс) существенно занижает свои показания, а ещё более короткие пики вовсе игнорирует. По данным статистики, это занижение показаний VU-метра на коротких пиках реальных программ может иногда достигать 9 дБ по сравнению с показаниями на синусоидальном установочном сигнале.
Поэтому в точке канала, где уровень контролируется по прибору квазипиковых значений (QPPM), по шкале этого прибора необходимо иметь запас по уровню, некую "защитную зону" от перегрузки (т.н. headroom) не менее 9 дБ, которую необходимо предусмотреть при калибровке канала. Другими словами, диаграмму уровней надо установить так, чтобы уровень установочного сигнала (0 дБ по шкале VU-метра) соответствовал бы отметке -9 дБ по показаниям QPPM.
В этом случае на реальных программах независимо от того, каким прибором пользовался звукорежиссёр при их создании, квазипиковые значения уровня по QPPM никогда не превысят 0 дБ, т.е. своего номинального или максимально допустимого значения (PML, Permitted Maximum Level). Разница в 9 дБ (headroom) между уровнем установочного сигнала AL и номинальным или "максимально допустимым" уровнем передачи PML хорошо знакома всем вещателям, но поправка в 9 дБ решала проблему только при аналоговых передачах.
Однако с появлением новых технологий вещания рекомендация ITU-R BS. 645-2 потребовала дополнений. При переходе радио и телевидения на цифровое вещание можно было бы наконец ожидать решения проблемы громкости передач. Однако этого не произошло. Более того, более широкий динамический диапазон, доступный при цифровом вещании, эту проблему ещё более обострил. Пришлось считаться с тем, что цифровой сигнал благодаря своей специфике требует нового подхода к измерениям текущего уровня.
В цифровых цепях даже мгновенные, неощутимые на слух пики уровня передачи становятся причиной сильнейших искажений, выражающихся в щелчках и тресках. Поэтому не показывающий пики короче 5 мс квазипиковый прибор, вполне удовлетворявший по точности требованиям аналогового вещания, для контроля уровня цифрового сигнала оказался непригоден.
Цифровой сигнал необходимо измерять практически безынерционным измерителем, реагирующим на импульсы длительностью менее 0,1 мс, т.е. дающим возможность измерить мгновенные значения сигнала. В литературе измерители мгновенных пиковых значений стали называться "истинно-пиковыми" (True peak) или SPPM (Sample peak program meter) т.е. "измерителями пиков программного уровня с точностью до семпла". Измерители мгновенных значений имеют шкалу, отградуированную в dBFS, т.е. в децибелах относительно полной цифровой шкалы уровня сигнала. Этот уровень, обозначенный на шкале прибора отметкой 0 dBFS, является пределом, превышение которого вызывает цифровое ограничение (клиппирование) сигнала и сопровождающие его необратимые искажения.
Измерения уровня цифрового сигнала имеет принципиальное отличие от измерений сигнала аналогового. Если определение уровня аналогового сигнала сводится в конечном счёте к измерению величины его напряжения (реже мощности), выраженной в децибелах по отношению к величине напряжения (мощности), выбранной за нулевое значение, то уровень цифрового сигнала ни вольтами, ни ваттами не определяется. Нельзя также уровень цифрового сигнала выразить в децибелах по абсолютной шкале в dBu, т.е. по отношению к абсолютному нулевому уровню (0 dBu), за который принимается напряжение 0,775 В эфф.
Цифровой сигнал физической размерности не имеет. Каждой выборке цифрового сигнала присваивается номер соответствующей зоны цифрового квантования. А общее число зон квантования и абсолютная величина полной шкалы уровней цифрового сигнала определяются разрядностью квантования и зависит только от параметров конкретного АЦП. Но главная особенность измерителей уровня мгновенных значений заключается в том, что эти приборы из-за своей мгновенной реакции для регулирования громкости звучания при вещании вовсе не пригодны. Сфера их использования ограничивается чисто техническими функциями – калибровкой каналов передачи и контролем за пиками цифрового сигнала, чтобы они (пики) никогда бы они не превысили 0 dBFS, т.е. точку клиппирования. Разумеется, показания таких приборов очень сильно отличаются от показаний приборов инерционных. Поэтому внедрение в РВ и ТВ цифровых технологий ещё более усложнило проблему унификации поддержания уровней передач.
В настоящее время международный обмен программами, как правило, осуществляется в цифровом формате. Но при этом следует учитывать, что каналы передачи часто состоят из последовательно включённых как цифровых, так и аналоговых участков. При этом в студиях вещания и в различных вещательных организациях используются самые разные измерители уровня, - и инерционные (VU, QPPM), и безынерционные (True peak).
Таким образом, инженерам вещания пришлось решать новую задачу по согласованию цифровых и аналоговых уровней. Этому согласованию посвящены рекомендации, изложенные в документах Европейского вещательного союза (EBU) R68-2000 и американского Общества телевизионных и киноинженеров (SMPTE) RP 155-2004. Обе эти рекомендации основываются на уже существующем правиле калибровки всех звеньев тракта международных трансляций по эталонному синусоидальному установочному сигналу (AL), аналоговая величина которого должна быть выражена путём её сопоставления с цифровой шкалой измерителя мгновенных значений, отградуированного в dBFS.
По рекомендации (EBU) R68-2000, установочный уровень по цифровой шкале должен быть ниже полной шкалы цифрового квантования на 18 дБ, т.е. должен равняться -18 dBFS, а по американскому стандарту (SMPTE) RP 155-2004 тот же уровень по цифровой шкале должен равняться -20 dBFS. Обе эти величины цифрового значения установочного уровня мало отличаются друг от друга и обе эти рекомендации приняты и используются в разных странах.
Однако несмотря на то, что все перечисленные международные рекомендации по калибровке каналов телевидения опубликованы, в том числе в интернете, и широко всем доступны, на наших отечественных телевизионных каналах на практике путаница в правилах поддержания уровней передач существует и поныне. Может быть, это частично происходит из-за того, что человеку, недостаточно знакомому с историей проблемы, трудно не запутаться в многочисленных переводах на русский язык рекомендаций по этой тематике, опубликованных, в основном, по-английски. Тем более что переводы этих документов часто выполнены так, что оставляют читателю возможность трактовать их текст достаточно вольно.
Но самая главная причина постоянных “скачков” громкости, особенно заметных в передачах, в которых чередуются речевые и музыкальные фрагменты, лежит значительно глубже, нежели разнобой в используемых в разных странах измерителях уровня.
По мере совершенствования технологии вещания изменялись и методы контроля уровней передач, но в основном они оставались верными одному устоявшемуся принципу - с помощью приборов измерялись максимальные электрические значения уровня аудиосигнала и по ним нормализовался уровень передачи.
Но этот метод измерений и нормализации уровня аудиосигнала далеко не всегда даёт звукорежиссёру возможность объективно оценить громкость, чтобы выравнивать её в передачах разных жанров таким образом, чтобы слушатель чувствовал бы себя комфортно.
Дело в том, что на основании измерений максимальных величин электрического уровня аудиосигнала VU-метром или QPPM-метром и нормализации уровня по пикам проблема выравнивания громкости передач в принципе решена быть не может, т.к. субъективное восприятие слушателем громкости звука (loudness), далеко не всегда однозначно определяется величиной электрического уровня передачи (level).
Современный взгляд на решение проблемы (Рекомендация ITU-R 1770-2)
Известно, что на восприятие громкости звука, помимо физической величины электрического сигнала, влияет целый ряд психофизиологических (психоакустических) свойств восприятия: временная структура звука (наличие и частота повторения в нём коротких импульсов), спектральный состав звуковых колебаний, эффект взаимной звуковой маскировки и многое другое. Здесь нельзя сбрасывать со счетов даже экранирующий эффект головы слушателя.
Поэтому необходимо перейти от парадигмы “нормализация уровня аудиосигнала” к новой парадигме - “нормализация громкости”, под которой надо понимать измерения уровня аудиосигнала по новому методу, учитывающему и правильно отражающему субъективно воспринимаемую громкость звучания. Для реализации этого нового подхода к проведению радио- и телевизионных передач необходим не обычный измеритель уровня (level meter), а прибор – измеритель громкости (loudness meter), который измеряет “взвешенные” значения уровня аудиосигнала c учётом всех психофизиологических факторов, влияющих на субъективное восприятие громкости звучания.
Новый метод измерений уровня аудиосигнала, адекватных его громкости, разработан и впервые изложен в Рекомендации Международного телекоммуникационного союза ITU–R BS.1770. В связи с новизной метода и отсутствием практического опыта работы с ним эта рекомендация с момента разработки первой редакции в 2006 году постоянно совершенствовалась и претерпела ряд изменений. Её последняя версия была опубликована в 2011 году.
Разработаны также дополнительные требования к приборам “Измерителям громкости”, которые должны по своим техническим характеристикам отличаться от традиционных “Измерителей уровня”, применяющихся до настоящего времени в студиях звукозаписи и эфирной трансляции. Предлагаемый алгоритм оценки громкости достаточно прост, его можно изложить кратко, если не касаться некоторых технических подробностей и не приводить математический аппарат, на основе которого строится весь процесс измерений.
Состоит этот алгоритм из четырёх этапов:
- К-взвешивание частоты;
- расчёт среднеквадратичного значения сигнала;
- суммирование сигналов с взвешиванием по каналам (тыловые каналы имеют больший вес, а канал LFE исключается;
- стробирование по блокам 400 мс (с перекрытием на 75%) с использованием двух пороговых значений: -70 LKFS и -10 дБ относительно уровня, полученного в результате измерений программы.
Упрощённая схема измерений громкости, в одинаковой мере пригодная для монофонических, стереофонических и многоканальных систем, приведена на рис.1.
На приведённой блок-схеме показаны входы пяти основных каналов системы Surround Sound – 5.1 (левого, центрального, правого, левого тылового и правого тылового); что позволяет осуществлять контроль записей, имеющих от одного до пяти каналов. Канал "точка один" для низкочастотных звуковых эффектов (LFE) в этом случае не учитывается. Если программа имеет менее пяти каналов, некоторые входы не используются.
На первом этапе работы алгоритма применяется двухступенчатая фильтрация сигнала с помощью фильтра взвешивания по кривой К, т.н. "К"- взвешивания.
Фильтр “K”-взвешивания осуществляет две ступени фильтрации. Первая ступень – предварительный сглаживающий фильтр, который учитывает акустическое экранирующее воздействие головы на принимаемые ушами сигналы. Частотная характеристика этого фильтра показана на рисунке 2.
Во второй ступени К-фильтра применяется алгоритм Leq (RLB), задачей которого является определенное взвешивание частотных составляющих звука, соответствующее чувственному восприятию спектрального содержимого сигнала. Это фильтр высших частот второго порядка, осуществляющий взвешивание по B-кривой c коррекцией по нижним частотам. В данном случае он используется в качестве одного из возможных вариантов метода измерений Эквивалентного уровня звукового давления (Leq) со спектральным взвешиванием. В результате обработки этим фильтром, частотные компоненты аудиосигнала становятся адекватными их слуховому восприятию. Частотная характеристика фильтра RLB изображена на рисунке 3.
В документе ITU-R 1770 рекомендуется после спектральной обработки в фильтре К-взвешивания цифровые значения громкости обозначать в LKFS, т.е. в единицах громкости, взвешенных по кривой "K", по отношению к номинальной полной шкале измерений. Единица LKFS эквивалентна децибелу, поскольку увеличение уровня сигнала на 1 дБ соответствует увеличению уровня громкости на 1 LKFS.
После спектральной обработки сигнала его взвешенные значения измеряются в определённых временных интервалах поблочно. Для расчёта измеренного значения громкости интервал измерений делится на множество перекрывающихся интервалов-блоков. Каждый блок это множество непрерывных отсчётов звукового сигнала за время продолжительностью T = 400 мс. Перекрытие блоков должно составлять 75% длительности одного блока.
На основании измерений, проделанных в данных временных интервалах, вычисляется для них среднеквадратичное значение энергии и устанавливаются два порога: абсолютный порог громкости на уровне -70 LKFS и второй порог – на 10 дБ ниже громкости, которая получена по результатам проделанных измерений. Среднеквадратичные значения громкости всех каналов суммируются с определёнными коэффициентами (более высокими для тыловых каналов и более низкими – для фронтальных). Суммарный сигнал логарифмируется и выводится на прибор индикации, отградуированный в единицах громкости (Рис.4).
Но при этом те кратковременные падения громкости в отдельных измерительных блоках, которые по уровню оказываются ниже второго установленного на основании измерений порога, из результатов суммирования исключаются, чтобы не занизить общий результат вычисления средней громкости передачи в целом. Это осуществляется благодаря применению т.н. функции gating, аналогичной прибору Gate (пороговый фильтр), который в звукорежиссуре используется в качестве шумоподавителя, производя отключение канала, когда сигнал становится меньше определённого порогового значения.
Следует отметить, что для измерений, предусмотренных рекомендацией ITU-R BS.1770, должны использоваться “Измерители истинно пиковых значений”. Здесь, во избежание путаницы в терминологии, надо пояснить, что прибор, названный в рекомендации ITU-R 1770 “Измерителем истинно пиковых значений” (True peak), несколько отличается от описанных в начале статьи безынерционных пиковых измерителей, именуемых так же. В данном контексте “Измеритель истинно пиковых значений” работает с более высокой по сравнению с аудиосигналом частотой дискретизации (обычно четырехкратной), чтобы уловить пики сигнала, попавшие между семплов, которые, тем не менее, могут превысить 0 dBFS и, таким образом, вызвать искажения сигнала. Так, при стандартизованной для радио и телевизионного вещания частоты дискретизации 48 кГц измерения громкости должны производиться прибором с собственной частотой дискретизации 192 кГц.
Нормирование громкости и максимально допустимый уровень аудиосигнала (Рекомендация EBU R 128-2011)
Положения, изложенные в рекомендации Международного телекоммуникационного союза ITU-R BS. 1770-2, легли в основу дальнейших разработок документов по практическому внедрению нового способа измерения аудиосигналов. Так, в августе 2011 года была опубликована рекомендация Европейского вещательного Союза EBU R 128, в которой суммировались все наработанные за последние годы идеи по совершенствованию методов контроля качества звукового вещания.
В этой рекомендации, озаглавленной “Нормирование громкости и максимально допустимый уровень аудиосигнала”, подчёркивалось, что:
- нормализация аудиосигналов по пикам приводила к значительным различиям в громкости между каналами вещания;
- показания стандартизованного в европейских странах документом EBU Tech Doc 3205-E и обычно использующегося измерителя квазипиковых значений уровня QPPM не отражает громкость сигнала, т.к. это прибор изначально не предназначался для регистрации среднего значения сигнала;
- при быстром росте цифрового производства фонограмм и цифровой дистрибуции аудиоконтента нормирование разрешённого максимального уровня аудиосигнала, определённое документом ITU-R BS. 645, не соответствует современным требованиям и изжило себя;
- документом ITU-R BS. 1770 определён международный стандарт измерения громкости аудиопрограмм, вводящий новый параметр аудиосигнала – единицу громкости.
В соответствии с вышеизложенным, Европейский вещательный союз рекомендует при измерениях аудиосигнала пользоваться новой единицей уровня LU (Loudness Unit) и LUFS (единицей громкости относительно полной шкалы). (Наименование “LUFS”, соответствует международной конвенции по терминологии и эквивалентно наименованию LKFS, которое используется ITU-R BS.1770-2).
Рекомендуется для полной характеристики передачи производить измерения по трём основным параметрам:
- Громкости программы ( Program Loudness);
- Диапазону громкости (Loudness Range);
- Максимальному мгновенному уровню (Maximum True Peak Level).
Основные правила измерений этих параметров сводятся к следующим пунктам:
- За номинальное значение громкости программы документом EBU R 128 рекомендуется принимать уровень равный -23 LUFS, а в случаях, когда точное поддержание номинального уровня недостижимо (например, при живой трансляции), допустимое отклонение от номинального уровня не должно превышать ± 1,0 LU.
- Аудиосигнал передачи должен быть, как правило, измерен как единое целое без выделения отдельных специфических фрагментов, таких, как речь, музыка или звуковые эффекты.
- Максимально допустимый мгновенный уровень передачи должен быть равен -1 dBTP (децибелы истинного пика).
- Все измерения должны производиться измерителями, специфицированными соответствующими документами: ITU-R BS.1770, EBU Tech Doc 3341 и EBU Tech Doc 3342.
Завершая этот обзор, нельзя не сказать о том, что известная американская компания Dolby Laboratories, один из признанных лидеров звуковой индустрии, для выбора номинального (опорного) уровня громкости разработала и использует при производстве фильмов и программ в формате Dolby Digital альтернативный метод, названный ими Dialogue Intelligence. Концепция этого метода основывается на моделировании поведения зрителя, находящегося дома у своего телевизора.
При просмотре телепрограмм зритель настраивает уровень громкости так, чтобы речь персонажей фильма (диалоги) или участников телепрограммы были бы хорошо слышны и чётко различимы. Скорее всего, зритель не будет увеличивать громкость своего телевизора, пока в программе нет диалогов. Также мала вероятность того, что он снизит уровень громкости из-за короткого всплеска громкости, вызванного, например, ружейным выстрелом.
Таким образом, выбор фрагмента, по которому человек устанавливает громкость, можно перепоручить измерительному прибору, способному распознавать те фрагменты программы, которые являются определяющими для установки громкости. Эту функцию и исполняет алгоритм Dialogue Intelligence, с требуемой периодичностью проводящий оценку громкости и помогающий оператору выбрать тот фрагмент программы, по которому можно установить оптимальную центральную громкость передачи.
И последнее замечание. На момент написания этой статьи некоторые радиотелевизионные компании Германии (NDR), Австрии (ORF), Бельгии (RTBF) и др. уже накопили определенный опыт использования нового метода измерений уровня громкости и его нормализации.
К сожалению, измерительная аппаратура, соответствующая требованиям, изложенным в рекомендациях ITU-R BS.1770 и EBU R 128, в наших отечественных студиях стала появляться лишь недавно и в единичных экземплярах. Для того чтобы данные рекомендации смогли бы быть внедрены на практике, работникам вещания надо переходить на новые методики проведения передач постепенно по мере того, как это окажется возможным.
В любом случае, есть уверенность в том, что результаты этой “маленькой революции” в телевизионном вещании не преминут весьма благотворно сказаться для огромной аудитории телезрителей.
Литература:
- 1. EBU Tech Doc 3205-E. Стандарт Европейского вещательного союза. “Пиковый программный измеритель для контроля международных трансляций”.
2. ITU-R BS. 645. “Тест сигнал и измерения звуковых программ в системах международных коммуникаций”.
3. ITU-R BS. 1770. ”Алгоритмы измерений громкости аудио программ и истинно-пикового аудио уровня”
4. EBU Tech Doc 3341. “Измерение громкости: Способ EBU , измерений в добавление к нормализации громкости в соответствии с EBU R 128”.
5. EBUTech Doc 3342. “Диапазон громкости: описание добавления к нормализации громкости в соответствии с EBU R 128”.
6. EBU Tech Doc 3343. “Практическое руководство для производства и внедрения в соответствии с EBU R 128”.
7. EBU Tech Doc 3344. “Практическое для распределения программ в соответствии с EBU R 128”.
8. F. Kramerer. ORF EBU Technical Review-2010