ЗВУКА ВОСПРОИЗВЕДЕНИЕ И ЗАПИСЬ
ЗВУКА ВОСПРОИЗВЕДЕНИЕ И ЗАПИСЬ, воспроизведение натуральных звучаний электромеханическими средствами и сохранение их в форме, позволяющей восстанавливать их с максимальной верностью оригиналу. Более подробная информация о физических принципах, лежащих в основе затрагиваемых ниже вопросов акустики, содержится в статьях: ЗВУК И АКУСТИКА; УХО; СЛУХ; МУЗЫКАЛЬНЫЕ ИНСТРУМЕНТЫ; МУЗЫКАЛЬНЫЕ ГАММЫ.
ВОСПРОИЗВЕДЕНИЕ ЗВУКА
Запись и воспроизведение звука – это область, в которой наука сочетается с искусством (звукорежиссера). Здесь есть две важные стороны: верность воспроизведения (как отсутствие нежелательных искажений) и пространственно-временная организация звучаний, поскольку задача воспроизведения звука электромеханическими средствами состоит не только в том, чтобы воссоздать звук, максимально приближенный к воспринимаемому в студии или концертном зале, но и в том, чтобы преобразовать его с учетом той акустической обстановки, в которой он будет прослушиваться.
В графическом представлении простейшую форму имеют звуковых колебания чистых тонов типа создаваемых камертоном. Им соответствуют синусоидальные кривые. Но большинство реальных звучаний имеет неправильную форму, которая однозначно характеризует звучание, так же, как отпечатки пальцев – человека. Всякое звучание может быть разложено на чистые тона разных частот (рис. 1). Эти тона состоят из основного тона и обертонов (гармоник). Основным тоном (с низшей частотой) определяется высота ноты. По обертонам мы различаем музыкальные инструменты, даже когда на них берется одна и та же нота. Обертоны особенно важны тем, что они создают тембр инструмента и определяют характер его звучания.
Диапазон основных тонов большинства источников звука довольно узок, благодаря чему можно легко понимать речь и улавливать мотив, даже если у воспроизводящей аппаратуры ограниченная частотная полоса. Полнота же звучания обеспечивается лишь при наличии всех обертонов, а для их воспроизведения необходимо, чтобы не искажались соотношения между уровнями основного тона и обертонов, т.е. частотная характеристика воспроизводящей системы должна быть линейной во всем диапазоне слышимых частот. Именно такую характеристику (наряду с отсутствием искажений) и имеют в виду, когда говорят о высокой точности звуковоспроизведения (системы hi-fi).
Громкость.
Восприятие громкости звука зависит не только от его интенсивности, но и от многих других факторов, в число которых входят и субъективные, не поддающиеся количественной оценке. Важное значение имеет обстановка, окружающая слушателя, уровень внешнего шума, высота и гармоническая структура звучания, громкость предыдущего звучания, эффект «маскирования» (под впечатлением предыдущего звучания ухо становится менее чувствительным к другим звучаниям близкой частоты) и даже эстетическое отношение слушателя к музыкальному материалу. Нежелательные звуки (шумы) могут казаться более громкими, чем желательные той же интенсивности. Даже восприятие высоты звучания может зависеть от интенсивности звука.
Восприятие различий в высоте музыкальных тонов определяется не абсолютной величиной частотных интервалов, а их отношением. Например, отношение двух частот, различающихся на октаву, в любой части звукоряда равно 2:1. Точно так же наша оценка изменений громкости определяется отношением (а не разностью) интенсивностей, так что изменения громкости воспринимаются как одинаковые, если одинаковы изменения логарифма интенсивности звука.
Поэтому уровень громкости звука измеряется по логарифмической шкале (на практике – в децибелах). Уши человека способны воспринимать звук в колоссальном диапазоне мощности от порога слышимости (0 дБ) до порога болевого ощущения (120 дБ), соответствующего отношению интенсивностей 1012. Современное оборудование способно воспроизводить изменения громкости в пределах порядка 90 дБ. Но воспроизводить весь диапазон слышимости практически и не требуется. Большинство слушает музыку примерно на уровне негромкой речи, и вряд ли кому-нибудь было бы по себе в домашних условиях при нормальной громкости оркестра или рок-группы.
Поэтому необходимо регулировать диапазон громкости, особенно при воспроизведении классической музыки. Это можно делать, постепенно понижая громкость перед крещендо (по партитуре) при сохранении нужного динамического диапазона. Для других музыкальных материалов, таких, как рок- и поп-музыка, широко применяются компрессоры, автоматически сужающие динамический диапазон усиливаемых сигналов. Но в дискотеках уровень звука нередко превышает 120 дБ, что может вызвать повреждение слуха и привести к полной глухоте. В этом отношении группа повышенного риска – поп-музыканты и звукооператоры. Особенно опасны наушники, так как они концентрируют звук.
Большинство слушателей широковещательных программ предпочитают, чтобы все программы озвучивались примерно на одном и том же уровне громкости и им самим не нужно было регулировать громкость. Но громкость – субъективное восприятие. Некоторым громкая музыка способна досаждать больше, чем речь, хотя неразборчивая речь иногда сильнее раздражает, чем музыка той же громкости.
Балансировка звука.
В основе хорошего звуковоспроизведения лежит сбалансированность разных источников звука. Проще говоря, в случае одного источника звука суть хорошего звуковоспроизведения в том, чтобы сбалансировать прямой звук, приходящий к микрофону, с влиянием окружающей акустики и обеспечить правильный баланс между прозрачностью звучания и его полнотой, допускающий нужную степень подчеркивания в тех местах, где это требуется.
Микрофонная техника.
Первая задача звукорежиссера состоит в том, чтобы выбрать подходящее студийное помещение. Если приходится использовать неприспособленное помещение, то оно должно быть, как минимум, в 1,5 раза больше места, отводимого исполнителям. Следующий шаг – выработка общей схемы расположения микрофонов. При воспроизведении музыкальных программ это необходимо сделать, консультируясь с дирижером и исполнителями. Микрофонов должно быть как можно меньше, поскольку наложение их звуковых полей способно снизить прозрачность звука. Правда, во многих случаях нужный эффект достигается только при использовании большого числа микрофонов.
Комбинации музыкальных инструментов редко бывают настолько сбалансированы, чтобы это отвечало требованиям прослушивания в домашних условиях. Акустика жилого помещения может оказаться далекой от идеала. Поэтому необходимо ознакомить руководителя оркестра с требованиями балансировки при воспроизведении с помощью микрофонов.
Организация воспроизводимых звучаний определяется типом микрофона, его приближенностью к источнику и обработкой его выходного сигнала. Вопрос о близости расположения микрофона к источнику звука нужно решать, учитывая соотношение между прямым и побочными звуками (включая реверберацию) других, более мощных инструментов и качество звука. Большинство инструментов дают разные звучания на разных расстояниях и в разных направлениях. Чтобы получить резкую «атаку», которая требуется от поп-музыки, и обеспечить хорошее различение инструментов, приходится прибегать к многомикрофонной схеме. При этом предъявляются высокие требования к звукорежиссеру; он должен иметь музыкальную подготовку или хотя бы уметь читать партитуру.
Бинауральный слух.
Человек легко определяет направление на источник звука, поскольку звук обычно достигает одного уха раньше, чем другого. Мозг улавливает эту малую разницу во времени и небольшое различие в интенсивности звучания и по ним определяет направление на источник звука.
Мы можем также определять, что звук пришел спереди, сзади, сверху или снизу. Это объясняется тем, что наши уши по-разному передают частотный состав звуков, приходящих в разных направлениях (а также тем, что слушатель редко держит голову абсолютно неподвижно и в вертикальном положении). Этим объясняется и то, что люди с глухотой на одно ухо сохраняют все-таки некоторую способность судить о направлении на источник звука.
Бинауральный слух выработался у человека в качестве защитного механизма, но эта способность разделять звуки – важное условие понимания музыки. Если эту способность использовать при звукозаписи, то увеличивается впечатление верности и чистоты при воспроизведении.
Стереофонический звук.
Двухканальная стереофоническая система, рассчитанная на прослушивание через звуковые колонки, создает для бинаурального слуха раздельные звуковые потоки, которые несут информацию о направлении распространения первичного звука.
В своей простейшей форме стереосистема состоит из двух микрофонов, расположенных рядом друг с другом и направленных под углом 45° к источнику звука. Сигналы микрофонов подаются на две звуковые колонки, разнесенные примерно на 2 м и одинаково удаленные от слушателя. Такая система создает «звуковую сцену» между колонками, на которой локализуются источники звука, расположенные перед микрофонами. Возможность локализации перед микрофонами источников звука, их разделения и отделения от реверберации намного повышает естественность и чистоту воспроизведения.
Такой подход дает удовлетворительные результаты только тогда, когда источник звука внутренне хорошо сбалансирован и благоприятны акустические условия. На практике обычно приходится использовать более двух микрофонов и микшировать (объединять) их сигналы для улучшения музыкального баланса, увеличения акустического разделения и придания звучанию необходимой степени атаки.
Типичный комплект аппаратуры для классического оркестра состоит из стереопары микрофонов (для создания общей звуковой картины оркестра) и нескольких местных микрофонов, установленных ближе к отдельным группам инструментов. Выходные сигналы местных микрофонов тщательно микшируются с сигналом стереопары так, чтобы обеспечивалось необходимое акцентирование каждой группы инструментов без нарушения общего баланса. Кроме того, их выходные сигналы панорамируются в кажущееся положение, которое при использовании основной пары микрофонов соответствовало бы их реальному расположению на сцене. (Панорамирование – это изменение углового направления на источник звука. Оно сочетается с регулировкой уровня посредством потенциометра.)
Многомикрофонные схемы еще шире применяются в случае легкой, а тем более поп-музыки, где обычно обходятся без общих микрофонных систем. И действительно, нет смысла гоняться за нюансами, если результат может быть достигнут при использовании переносного оборудования со звуковыми колонками, разнесенными всего лишь на шаг. Кроме того, запись поп-музыки производится, как правило, не в натуральной форме. Каждая группа инструментов, а то и каждый музыкант обслуживается отдельным микрофоном. Все инструменты рок-ансамбля – электронные. Звук разных инструментов, в том числе и клавишных синтезаторов, можно записывать либо с помощью микрофонов, установленных перед соответствующими колонками, либо путем прямой подачи сигналов первичных микрофонов на студийный пульт микширования. Эти сигналы могут быть либо сразу микшированы, либо предварительно записаны на отдельных дорожках многодорожечного магнитофона. Добавляется искусственная реверберация, осуществляется частотная коррекция и т.д. В результате оказывается мало сходства со звуком, воспринимаемым в студии, даже если все записывалось одновременно.
Выходной сигнал панорамируется и регулируется (потенциометром) для создания определенного впечатления о положении источника звука, которое может совершенно не соответствовать фактическому положению музыкантов в студии. Но, что интересно, даже если стереофонический звук не соответствует реальной ситуации, он дает эффект, намного превосходящий эффект монофонического звука.
Квадрафония.
Улучшенное приближение к реальности можно получить методом квадрафонии, при котором четыре канала подключаются к четырем колонкам, попарно размещенным впереди слушателей и позади них. В простейшем варианте квадрафоническую систему можно рассматривать как две стереофонические, включенные навстречу друг другу. Сложные системы с матрицированием могут воспроизводить четыре канала с одной дорожки фонограммы при сохранении совместимости с воспроизведением стереозаписи.
Звуковое окружение.
В телевидении важное значение имеет так называемая система звукового окружения. Стереофонический звуковой сигнал с левым (А) и правым (В) каналами матрицируется путем их суммирования (в фазе), что дает сигнал М (моносигнал), и вычитания (сложения в противофазе), что дает сигнал S (стереосигнал). Сигнал А + В соответствует средней точке источника звука и совместим с монофоническими системами воспроизведения, а сигнал А – В несет информацию направленности. Система звукового окружения формирует также разностную компоненту М – S, которая содержит «внесценический» звук, а также реверберацию, и передается на колонки, размещенные сзади слушателя. Система звукового окружения проще квадрафонической системы, но позволяет получить эффект погруженности в звуковую среду с помощью обычного стереосигнала.
Стереозвук для телевидения.
Стереофоническая запись звука применяется в видеокассетах и в телевещании (особенно спутниковом) для телевизоров, снабженных специальным декодером.
Может показаться, что стереозвук не очень подходит для телевидения, поскольку, как отмечалось выше, для эффективной стереофонии требуются две колонки, расположенные на расстоянии примерно 2 м друг от друга. Кроме того, из-за малых размеров экрана взгляд телезрителя направлен в основном в его центр, так что требуется иллюстрация расстояния по глубине, а не по ширине.
Тем не менее, когда мы смотрим телевизор, мы знаем, что видим лишь малый сегмент источника звука. Точно так же, как в реальной жизни, когда, глядя в определенном направлении, мы не можем выключить звуки нашего окружения, нет ничего неестественного в том, что звуковая картина выходит за пределы телевизионного экрана.
Коррекция звука.
Как это ни парадоксально, но в аппаратуре с высокой верностью воспроизведения обычно предусматриваются устройства для искажения звука. Они называются эквалайзерами и предназначены для выравнивания (путем устранения дефектов) амплитудно-частотной характеристики сигнала. Коррекцию частотной характеристики проводят также для внесения в нее искажений, обеспечивающих нужную пространственно-временную организацию звучаний. Примером может служить т.н. «фильтр присутствия», который изменяет кажущееся расстояние до источника звука. Наш слух связывает ощущение близости (присутствия) с преобладанием частот в полосе от 3 до 5 кГц, соответствующей шипящим звукам (сибилянтам). В музыке подъем характеристики в полосе от 3 до 5 кГц может создать эффект атаки, хотя и ценой огрубления звука.
Другой тип частотного корректора, позволяющего создать эффект присутствия, – это параметрический эквалайзер. Такое устройство позволяет ввести на частотной характеристике подъем или провал, регулируемый в пределах 14 дБ. При этом частоту и ширину полосы можно изменять в пределах всего спектра звуковых частот. Такой вид регулирования частотной характеристики может выполняться весьма точно и использоваться, например, для коррекции акустического резонанса в студии или в зале либо для подавления грохота или шипения.
Еще более сложный вид коррекции частотной характеристики осуществляется графическим эквалайзером. При таком способе весь звуковой спектр делится на узкие полосы с центральными частотами, разделенными с интервалами в октаву или треть октавы. Для каждой полосы имеется свой регулировочный движок, дающий увеличение или уменьшение примерно до 14 дБ. Название «графический» связано с тем, что при выполнении коррекции положение регулировочных движков на пульте приблизительно соответствует форме частотной характеристики. Графические эквалайзеры особенно подходят для компенсации акустического окрашивания резонансами в студии или зале для прослушивания. Колонки, дающие плоскую амплитудно-частотную характеристику в безэховой камере, в других условиях могут звучать совсем по-иному. Графические эквалайзеры позволяют улучшить озвучивание в таких случаях.
Уровень звука.
Звуковой материал почти любого вида – записываемый, усиливаемый или передаваемый по радио или телевидению – нуждается в регулировке громкости. Это нужно для того, чтобы 1) не выйти за пределы динамического диапазона системы; 2) выделить и сбалансировать из эстетических соображений различные звучания данного источника звука; 3) установить диапазон громкости основного материала; 4) согласовать уровни громкости материала, записанного в разное время.
Регулировку громкости лучше всего проводить, прослушивая материал через хорошую колонку и учитывая при этом показания измерителя уровня. Одних же показаний измерителя уровня при монтаже фонограмм недостаточно в силу субъективного характера восприятия звука. Такой измеритель нужен для калибровки слуха.
Микширование сигналов микрофонов.
При монтаже фонограммы обычно производится микширование выходных сигналов микрофонов и других преобразователей звука, число которых при записи может достигать 40. Микширование производится двумя основными способами. При микшировании в режиме реального времени можно для упрощения сгруппировать микрофоны, относящиеся, например, к вокальной группе, и регулировать уровень их звучания групповым звукомикшером. В другом варианте сигналы отдельных микрофонов направляются на входы многоканального магнитофона для последующего сведения в один стереофонический сигнал.
Второй способ позволяет точнее выбирать точки микширования, работая не в присутствии музыкантов, причем на многодорожечных магнитофонах можно воспроизводить одни дорожки при одновременной синхронной записи на других. Поэтому изменения можно вносить в нужные места фонограммы без переписывания всей программы. Все это можно делать без копирования оригинальной записи, так что она остается образцом для сравнения до окончательного микширования.
Автоматизированное микширование звука.
Чтобы обеспечить высокую точность на заключительной операции перехода от многих дорожек записи к одной, некоторые звукорежиссерские пульты оснащают автоматическими микшерами. В таких системах в компьютер вводятся данные всех электронных регуляторов уровня при первой попытке микширования. Затем запись воспроизводится с автоматическим выполнением этих функций микширования. В ходе воспроизведения могут быть произведены нужные регулировки и скорректированы параметры программы компьютера. Такой процесс повторяется до достижения нужного результата. После этого выходной сигнал сводится в программную стереофонограмму.
Автоматическое управление.
Автоматическое микширование не следует путать с автоматическим управлением, которое выполняется с использованием ограничителей и компрессоров, поддерживающих звуковой сигнал в требуемых пределах. Ограничитель – это устройство, которое пропускает программу без изменений, пока не достигается некоторый порог. Когда же сигнал на входе превышает данный порог, коэффициент усиления системы понижается и сигнал более не усиливается. Ограничители обычно используются в передатчиках для защиты электронных схем от перегрузки, а в ЧМ-передатчиках – для предотвращения чрезмерной девиации частоты с наложением на соседние каналы.
Компрессоры, т.е. регуляторы, автоматически осуществляющие сужение динамического диапазона усиливаемых сигналов, действуют аналогично ограничителям, понижая коэффициент усиления системы, но делают это менее резко. Упрощенные компрессоры имеются во многих кассетных магнитофонах. Компрессоры же, используемые в профессиональной звукозаписи, снабжаются органами управления для оптимизации их действия. Но никакое автоматическое регулирование не в состоянии заменить тонкости и остроты восприятия, присущих человеку.
Динамическое шумоподавление.
При аналоговой звукозаписи всегда возникают трудности с шумами, в основном в форме шипения. Для подавления системного шума записывать программу всегда следует при достаточно высоком уровне громкости. Для этого применяется метод компандирования, т.е. сужения динамического диапазона программы при записи и расширения его при воспроизведении. Это позволяет повышать средний уровень при записи, а при воспроизведении понижать уровень сравнительно тихих пассажей (и вместе с ними шума). При разработке эффективной системы компандирования возникают трудности двоякого рода. Одна из них – это трудность согласования компрессора и экспандера во всем диапазоне частот и громкости. Другая – предотвращение повышения и понижения уровня шума вместе с уровнем сигнала, так как это делает шум более заметным. В системах шумоподавления Долби весьма остроумно решаются эти проблемы несколькими разными способами. В них учитывается эффект «маскирования»: чувствительность слуха на той или иной частоте существенно понижается во время и непосредственно после более громких звучаний на близких частотах (рис. 2).
«Долби А».
Метод «Долби А» – это промежуточная обработка, осуществляемая на входе и выходе звукозаписывающей аппаратуры, результатом которой является нормальная (плоская) характеристика на выходе. Метод «Долби А» применяется главным образом в профессиональной звукозаписи, в особенности на многодорожечные магнитофоны, в которых уровень шума повышается с увеличением числа используемых дорожек.
Проблема согласования компрессора и экспандера решается созданием двух параллельных путей – одного через линейный усилитель, а другого через дифференциальную цепь, выходной сигнал которой добавляется к «прямому» сигналу при записи и вычитается при воспроизведении, в результате чего действие компрессора и экспандера оказывается взаимно дополняющим. Дифференциальная схема разбивает частотный спектр на четыре полосы и каждую полосу обрабатывает отдельно, так что подавление осуществляется только там, где это требуется, т.е. в полосе, в которой сигнал программы недостаточно громок, чтобы маскировать шум. Так, например, музыка обычно концентрируется в нижней и средней полосах частот, а шипение магнитной ленты – на высоких частотах и слишком удалено по частоте, чтобы эффект маскирования был существенным.
«Долби В».
Метод «Долби В» применяется главным образом в бытовой аппаратуре, в частности в кассетных магнитофонах. В отличие от метода «Долби А», записи по методу В выполняются с характеристикой Долби, рассчитанной на воспроизведение на аппаратуре с дополнительной характеристикой. Как и при методе «Долби А», здесь имеются прямой путь для программы и боковая цепь. В боковую входит компрессор с предваряющим активным фильтром верхних частот на частоты от 500 Гц и выше.
В режиме записи компрессор повышает уровень сигналов, лежащих ниже порогового значения, и они добавляются к сигналу боковой ветви. Активный фильтр создает в своей полосе пропускания усиление, нарастающее до 10 дБ на частоте 10 кГц. Таким образом, высокочастотные сигналы низкого уровня записываются с превышением первоначального уровня, достигающим 10 дБ. Подавитель выбросов предотвращает воздействие переходных процессов на постоянную времени компрессора.
Декодер системы «Долби В» аналогичен кодеру, используемому при записи, но в нем выходной сигнал боковой ветви компрессора суммируется с сигналом основной цепи в противофазе, т.е. вычитается из него. При воспроизведении уровень высокочастотных сигналов низкого уровня, а также уровень шипения магнитной ленты и системный шум, добавляющиеся при записи, понижаются, что приводит к повышению отношения сигнал/шум на величину до 10 дБ.
Важное различие между методом Долби и простой системой введения предыскажений (повышения высокочастотной характеристики) при записи и коррекции предыскажений при воспроизведении состоит в том, что характеристика «Долби В» влияет только на звуковые сигналы низкого уровня. Материал, закодированный по методу «Долби В», можно воспроизводить на аппаратуре, не имеющей системы шумоподавления Долби, если понизить высокочастотную характеристику для компенсации характеристики Долби, но это приводит к потере высоких частот в более громких пассажах.
«Долби С».
Метод «Долби С» представляет собой дальнейшее усовершенствование метода «Долби В», позволяющее понизить шум на величину до 20 дБ. В нем используются два компрессора, включенные последовательно, при записи и два дополняющих экспандера при воспроизведении. Первый каскад работает при уровнях сигналов, сравнимых с уровнями в системе «Долби В», а второй чувствителен к сигналам, уровень которых на 20 дБ ниже. Система «Долби С» начинает действовать примерно со 100 Гц и обеспечивает понижение шума на 15 дБ на частотах около 400 Гц, тем самым ослабляя эффект модуляции средних частот высокочастотными сигналами.
Система DBX.
Система шумоподавления DBX – это система взаимно дополняющей обработки на входе и выходе магнитофона. При кодировании и декодировании в ней используется коэффициент компрессии 2:1. Согласование компрессора и экспандера упрощается благодаря единому коэффициенту компрессии, а также благодаря тому, что оценка уровня производится по полной мощности сигнала. В системе DBX используется то обстоятельство, что основная часть мощности программы обычно концентрируется на средних и низких частотах, а на высоких частотах большая мощность бывает лишь при высоком общем уровне громкости. В сигнал, подаваемый на компрессор, вводятся сильные предыскажения (с нарастающим повышением уровня в области высоких частот) для повышения общей мощности при записи. При воспроизведении же предыскажения устраняются путем понижения уровня на высоких частотах, а вместе с ним и уровня шумов. Во избежание перегрузки фонограммы мощными предыскаженными высокочастотными сигналами такие предыскажения вводятся в сигнал боковой цепи компрессора, в результате чего при высоких уровнях записываемый уровень высокочастотных сигналов с увеличением частоты понижается, а с уменьшением – повышается. Система DBX может повысить отношение сигнал/шум на высоких частотах на 30 дБ.
ЗВУКОЗАПИСЬ
В идеале процесс записи звука от входа записывающего устройства до выхода устройства воспроизведения должен быть «прозрачным», т.е. ничто не должно изменяться, кроме времени воспроизведения. Многие годы эта цель казалась недостижимой. Системы звукозаписи были ограничены в диапазоне и неизбежно вносили те или иные искажения. Но исследования привели к огромным улучшениям, и, наконец, с появлением цифровой звукозаписи достигнут почти идеальный результат.
Цифровая звукозапись.
При цифровой звукозаписи аналоговый звуковой сигнал преобразуется в код из последовательностей импульсов, которые соответствуют двоичным числам (0 и 1) и характеризуют амплитуду волны в каждый момент времени. Цифровые аудиосистемы обладают огромными преимуществами перед аналоговыми системами в отношении динамического диапазона, робастности (информационной надежности) и сохранения качества при записи и копировании, передаче на расстояние и мультиплексировании и т.п.
Аналого-цифровое преобразование.
Процесс преобразования из аналоговой формы в цифровую состоит из нескольких шагов.
Дискретизация.
Периодически с фиксированной частотой повторения делаются дискретные отсчеты мгновенных значений волнового процесса. Чем выше частота отсчетов, тем лучше. По теореме Найквиста, частота дискретизации должна не менее чем вдвое превышать наивысшую частоту в спектре обрабатываемого сигнала. Чтобы не допустить искажений, связанных с дискретизацией, на входе преобразователя необходимо установить фильтр нижних частот с очень крутой характеристикой и частотой отсечки, равной половине частоты дискретизации. К сожалению, идеальных фильтров нижних частот не существует, и фильтр с очень крутой характеристикой будет вносить искажения, которые могут свести на нет преимущества цифровой техники. Дискретизацию обычно проводят с частотой 44,1 кГц, которая позволяет применять практически приемлемый фильтр для защиты от искажений. Частота 44,1 кГц была выбрана потому, что она совместима с частотой строчной развертки телевидения, а все ранние цифровые записи производились на видеомагнитофонах.
Эта же частота 44,1 кГц является стандартной частотой дискретизации для проигрывателей компакт-дисков и большей части бытовой аппаратуры, за исключением устройств записи на цифровую аудиоленту (DAT), в которых используется частота 48 кГц. Такая частота выбрана специально для того, чтобы воспрепятствовать нелегальному переписыванию компакт-дисков на цифровую магнитную ленту. В профессиональном оборудовании используется главным образом частота 48 кГц. В цифровых системах, применяемых для целей вещания, обычно работают с частотой 32 кГц; при таком выборе полезный диапазон частот ограничивается величиной 15 кГц (из-за предела дискретизации), но частота 15 кГц считается достаточной для целей вещания.
Квантование.
Следующий шаг состоит в том, чтобы преобразовать дискретные отсчеты в код. Это преобразование выполняется путем измерения амплитуды каждого отсчета и сравнения ее со шкалой дискретных уровней, называемых уровнями квантования, величина каждого из которых представлена числом. Амплитуда отсчета и уровень квантования редко в точности совпадают друг с другом. Чем больше уровней квантования, тем выше точность измерений. Различия между амплитудами отсчетов и квантования проявляются в воспроизводимом звуке как шум.
Кодирование.
Уровни квантования считаются в виде единиц и нулей. 16-разрядный двоичный код (такой же, как используемый для компакт-дисков) дает 65536 уровней квантования, что позволяет иметь отношение сигнал/шум квантования выше 90 дБ. Получаемый сигнал отличается высокой робастностью, так как от воспроизводящего оборудования требуется лишь распознать два состояния сигнала, т.е. определять, превышает ли он половину максимально возможного значения. Поэтому цифровые сигналы можно многократно записывать и усиливать, не опасаясь ухудшения их качества.
Цифро-аналоговое преобразование.
Чтобы цифровой сигнал преобразовать в звуковой, его нужно сначала преобразовать в аналоговую форму. Такое преобразование обратно аналого-цифровому преобразованию. Цифровой код преобразуется в последовательность уровней (соответствующих исходным уровням дискретизации), которые сохраняются и считываются с использованием исходной частоты дискретизации.
Передискретизация.
Аналоговый выходной сигнал цифро-аналогового преобразователя непосредственно использовать нельзя. Его нужно сначала пропустить через фильтр нижних частот, чтобы не допустить искажений, связанных с гармониками частоты дискретизации. Один из способов устранения этой трудности – передискретизация: частота дискретизации повышается путем интерполяции, что дает дополнительные отсчеты.
Коррекция ошибок.
Одно из основных преимуществ цифровых систем состоит в возможности исправлять или маскировать ошибки и дефектные места, причиной которых могут быть грязь или недостаточное количество магнитных частиц при записи, что вызывает щелчки и пропуски звука, к которым человеческое ухо особенно чувствительно. Для исправления ошибок предусматривается проверка на четность, для чего к каждому двоичному числу добавляется бит проверки на четность, чтобы число единиц было четным (или нечетным). Если из-за ошибки произошла инверсия, то число единиц не будет четным (или нечетным). Проверка на четность обнаружит это, и либо будет повторен предыдущий отсчет, либо будет выдано значение, промежуточное между предыдущим и следующим отсчетами. Такая процедура называется маскировкой ошибок.
Компакт-диск (CD).
Компакт-диск оказался первой общедоступной цифровой аудиосистемой. Это миниатюрная грампластинка диаметром 120 мм с цифровой записью на одной стороне, воспроизводимой на лазерном проигрывателе.
Полностью записанный диск звучит 74 мин. Он дает почти идеальное воспроизведение с частотной характеристикой от 20 Гц до 20 кГц и с превышающими 90 дБ динамическим диапазоном, отношением сигнал/шум и разделением между каналами. Проблема детонационного искажения звука для него не существует, так же как и проблема износа. Диски прочны, не требуют особой осторожности в обращении, не боятся пыли (в небольших количествах) и даже царапин, так как все это не наносит ущерба качеству воспроизведения.
Первый оригинал компакт-диска (мастер-диск) изготавливают методом фотолитографии, используя лазер для выжигания питов (микроуглублений) на поверхности фоторезиста, нанесенного на стеклянный диск. В процессе производства питы становятся выступами отражающей нижней поверхности пластиковых дисков, на которую затем наносится слой прозрачного пластика толщиной 1,2 мм.
Длина питов и расстояние между ними несут цифровую информацию. Питы идут по спирали длиной 5,7 км, которая начинается в центральной части диска, закручивается по часовой стрелке и доходит до края. Шаг спирали равен 1,6 мкм (примерно 1/40 диаметра человеческого волоса и около 1/60 среднего шага канавок записи на долгоиграющей пластинке). Информация в цифровом коде считывается лазерным лучом. Там, где луч попадает в промежутки между выступами, он отражается обратно и светоделительной призмой направляется на фотоприемник. Когда же считывающий лазерный луч попадает на выступ, он при отражении диффузно рассеивается (рис. 3). Поскольку компакт-диск представляет собой цифровую систему, выходной сигнал фотоприемника имеет лишь два значения: 0 и 1.
Принцип действия компакт-диска требует предельной точности фокусировки лазерного луча и трекинга (отслеживания дорожки). Обе функции осуществляются оптическими средствами. Сервомеханизмы фокусировки и трекинга должны очень быстро действовать, чтобы компенсировать деформацию диска, его эксцентриситет и другие физические дефекты. В одном из конструктивных решений используется двухкоординатное устройство с двумя катушками, установленными под прямым углом в магнитном поле. Они обеспечивают перемещение объектива по вертикали для фокусировки и по горизонтали для трекинга.
Специальная система кодирования преобразует 8-разрядный звуковой сигнал в 14-разрядный. Такое преобразование, уменьшая требуемую полосу, облегчает выполнение операций записи и воспроизведения, вводя при этом дополнительную информацию, необходимую для синхронизации. Здесь же проводится исправление ошибок, благодаря чему компакт-диск еще менее восприимчив к мелким дефектам. В большинстве проигрывателей для улучшения цифро-аналогового преобразования предусматривается передискретизация.
В начале музыкальной программы на компакт-диск записывается сообщение о содержании диска, точках начала отдельных отрывков, а также о их числе и длительности звучания каждого отрывка. Между отрывками размещаются метки начала музыки, которые могут быть пронумерованы от 1 до 99. Длительность воспроизведения, выраженная в минутах, секундах и 1/75 долях секунды, закодирована на диске и считывается в обратном порядке перед каждым отрывком. Присваивание имен и автоматический выбор дорожек выполняются с помощью двух субкодов, указываемых в сообщении. Сообщение выдается при вставлении диска в проигрыватель (рис. 4).
Компакт-диск легко тиражировать. Как только сделан первый оригинал записи, копии можно штамповать в больших количествах.
В 1997 появилась и к концу века получила распространение оптическая технология хранения информации на многослойных двусторонних цифровых универсальных дисках DVD. Это, по-существу, более емкий (до 4Гб) и более быстрый компакт-диск, который может содержать аудио, видео и компьютерные данные. DVD-ROM читается соответствующим дисководом, подключенным к компьютеру.
Устройства цифровой магнитной записи звука.
Большой прогресс был достигнут и в области устройств цифровой магнитной записи. Диапазон частот (ширина полосы), требуемый для цифровой записи, намного выше, чем для аналоговой. Для цифровой записи/воспроизведения необходима полоса пропускания шириной от 1 до 2 МГц, что намного шире диапазона обычных магнитофонов.
Запись без магнитной ленты.
Легкодоступные компьютеры с большим объемом памяти и дисковые накопители, позволяющие выполнять монтаж фонограммы в цифровой форме, дают возможность осуществлять звукозапись без использования магнитной ленты. Одно из преимуществ такого метода – легкость синхронизации записей для отдельных дорожек в многодорожечной записи. Компьютеры управляют звуком во многом так же, как текстовые процессоры словами, обеспечивая практически мгновенный вызов фрагментов в режиме произвольного доступа. Они позволяют также регулировать длительность аудиоматериала в некоторых случаях в пределах 50% без изменения высоты тона или, наоборот, изменять высоту тона без изменения длительности.
Система «Синклавир» и устройство прямой записи на диск могут выполнить почти все функции студии многодорожечной звукозаписи без использования магнитной ленты. Компьютерная система такого типа предоставляет память с оперативным доступом. Жесткие диски обеспечивают оперативный доступ к библиотекам звукозаписей. Для хранения отдельных коллекций редакционных материалов, библиотек звукозаписей и материалов для обновления программных средств используются гибкие диски высокой плотности. Оптические диски служат для массового хранения записей звуковой информации с возможностью оперативного доступа к ним. Оперативная память (ОЗУ) используется для записи, редактирования и воспроизведения коротких инструментальных звучаний или звуковых эффектов; для этих задач имеется достаточный объем памяти, а дополнительная система оперативной памяти позволяет работать с многодорожечными фонограммами (до 200 дорожек). Система «Синклавир» управляется компьютерным терминалом с 76-нотной клавиатурой, чувствительной к скорости и давлению. В другом варианте управления используется мышь, которая вместе с монитором позволяет оператору точно выбирать точку фонограммы для проведения модификации, монтажа или стирания.
Устройство прямой записи на диск может быть выполнено в виде автономных 4-, 8- и 16-дорожечных установок. В такой установке для записи звука используется комплект связанных жестких дисков. 16-дорожечная установка подобного типа позволяет осуществить запись длительностью до 3 ч при частоте дискретизации 50 кГц.
См. также ИЗОБРАЖЕНИЙ ЗАПИСЬ И ВОСПРОИЗВЕДЕНИЕ; КОМПЬЮТЕР.
Кинг Г. Руководство по звукотехнике. Л., 1980
Бугров В.А. Теория фонограмм. М., 1984
Щербина В.И. Цифровая звукозапись. М., 1989
Колесников В.М. Лазерная звукозапись и цифровое радиовещание. М., 1991
Оптические дисковые системы. М., 1991
Бродский М.А. Аудио- и видеомагнитофоны. Минск, 1995
Ответь на вопросы викторины «Физика»