Преобразование звуковой информации

Содержание

1. Профессиональная обработка звука. Звук и звуковая волна

2. Программа обработки звука Audacity

3. Цифровая и аналоговая запись. Аналогово-цифровое преобразование. Микширование

4. Импульсная и частотная модуляция. Хранение оцифрованного звука

5. Теорема Котельникова - Найквиста. Алиазинг

6. Сэмплирование

7. Аппаратура

8. Программное обеспечение

10. Саундтреки

Список используемой литературы

1. Профессиональная обработка звука. Звук и звуковая волна

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное "сворачивание" сигнала из спектра в волну.

3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или "объёмности" звука.

4. Временные преобразования. Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Echo (эхо). Реализуется с помощью временных преобразований. Фактически для получения эха необходимо на оригинальный входной сигнал наложить его задержанную во времени копию. Для того, чтобы человеческое ухо воспринимало вторую копию сигнала как повторение, а не как отзвук основного сигнала, необходимо время задержки установить равным примерно 50 мс. На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного повторения звука (многоголосного эха). Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто задержанные копии сигнала, а приглушенные по амплитуде.

Reverberation (повторение, отражение). Эффект заключается в придании звучанию объемности, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. Практически, с помощью реверберации можно "оживить", например, фонограмму, сделанную в заглушенном помещении. От эффекта "эхо" реверберация отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного. Иными словами, блок реверберации упрощенно представляет собой петлю, где выход блока подключен к его входу, таким образом уже обработанный сигнал каждый цикл снова подается на вход смешиваясь с оригинальным сигналом.

Chorus (хор). В результате его применения звучание сигнала превращается как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта аналогична схеме создания эффекта эха с той лишь разницей, что задержанные копии входного сигнала подвергаются слабой частотной модуляции (в среднем от 0.1 до 5 Гц) перед смешиванием со входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.

"Обычный" аналоговый звук представляется в аналоговой аппаратуре непрерывным электрическим сигналом. Компьютер оперирует с данными в цифровом виде. Это означает, что и звук в компьютере представляется в цифровом виде.

Цифровой звук - это способ представления электрического сигнала посредством дискретных численных значений его амплитуды. Допустим, мы имеем аналоговую звуковую дорожку хорошего качества (говоря "хорошее качество" будем предполагать нешумную запись, содержащую спектральные составляющие из всего слышимого диапазона частот - приблизительно от 20 Гц до 20 КГц) и хотим "ввести" ее в компьютер (то есть оцифровать) без потери качества. Звуковая волна - это некая сложная функция, зависимость амплитуды звуковой волны от времени. Эту функцию описывают путем хранения ее дискретных значений в определенных точках. Иными словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двум координатным осям - амплитудной и временной. Таким образом, оцифровка сигнала включает в себя два процесса - процесс дискретизации (осуществление выборки) и процесс квантования. Процесс дискретизации - это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени.

Квантование - процесс замены реальных значений сигнала приближенными с определенной точностью. Таким образом, оцифровка - это фиксация амплитуды сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению). Записанные значения амплитуды сигнала называются отсчетами. Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота дискретизации) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме мы получим.

Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить.

Однако, надо иметь в виду, что память компьютера не бесконечна, так что каждый раз при оцифровке необходимо находить какой-то компромисс между качеством (напрямую зависящим от использованных при оцифровке параметров) и занимаемым оцифрованным сигналом объемом.

А также, частота дискретизации устанавливает верхнюю границу частот оцифрованного сигнала, а именно, максимальная частота спектральных составляющих равна половине частоты дискретизации сигнала. Попросту говоря, чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой не менее 44.1 КГц.

Существуют и другие проблемы и нюансы, связанные с оцифровкой звука. Не сильно углубляясь в подробности отметим, что в "цифровом звуке" из-за дискретности информации об амплитуде оригинального сигнала появляются различные шумы и искажения. Так, например, джиттер (jitter) - шум, появляющийся в результате того, что осуществление выборки сигнала при дискретизации происходит не через абсолютно равные промежутки времени, а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то немного позднее. А так как входной сигнал постоянно меняется, то такая ошибка приводит к "захвату" не совсем верного уровня сигнала. В результате во время проигрывания оцифрованного сигнала может ощущаться некоторое дрожание и искажения. Появление джиттера является результатом не абсолютной стабильности аналогово-цифровых преобразователей. Для борьбы с этим явлением применяют высокостабильные тактовые генераторы. Еще одной неприятностью является шум дробления. При квантовании амплитуды сигнала происходит ее округление до ближайшего уровня. Такая погрешность вызывает ощущение "грязного" звучания.

На практике, процесс оцифровки (дискретизация и квантование сигнала) остается невидимым для пользователя - всю черновую работу делают разнообразные программы, которые дают соответствующие команды драйверу (управляющая подпрограмма операционной системы) звуковой карты. Любая программа (будь то встроенный в Windows Recorder или мощный звуковой редактор), способная осуществлять запись аналогового сигнала в компьютер, так или иначе оцифровывает сигнал с определенными параметрами, которые могут оказаться важными в последующей работе с записанным звуком, и именно по этой причине важно понять как происходит процесс оцифровки и какие факторы влияют на ее результаты.

2. Программа обработки звука Audacity

Порой недостаточно просто записать звук, часто возникает необходимость в его редакции: от изменения громкости до сложных эффектов. Существует ряд программ, которые успешно справляются с данной задачей и кроме того имеют возможность извлекать звуковую информацию с компакт-дисков и, наоборот, записывать аудио CD.

Среди таких программ лидируют Sound Forge, Wave Lab, Cool Edit.

Для работы со звуком в общеобразовательной школе можно предложить кроссплатформенный бесплатный аудиоредактор Audacity.

Audacity - бесплатный, простой в использовании звуковой редактор для:

записи звука;

оцифровки аналоговых записей (кассет, грампластинок);

редактирования файлов в форматах Ogg Vorbis, MP3 и WAV;

физического редактирования нескольких файлов (вырезание, склейка, сведение);

изменения скорости и высоты тона записи и многое др.

3. Цифровая и аналоговая запись. Аналогово-цифровое преобразование. Микширование

Для преобразования дискретизованного сигнала в аналоговый вид, пригодный для обработки аналоговыми устройствами (усилителями и фильтрами) и последующего воспроизведения через акустические системы, служит цифроаналоговый преобразователь (ЦАП). Процесс преобразования представляет собой обратный процесс дискретизации: имея информацию о величине отсчетов (амплитуды сигнала) и беря определенное количество отсчетов в единицу времени, путем интерполирования происходит восстановление исходного сигнала.

Сначала в качестве простейшего звукового устройства в компьютере использовался встроенный динамик (PC speaker). Этот динамик присоединен к порту на материнской плате, у которого есть два положения - 1 и 0. Если этот порт быстро-быстро включать и выключать, то из динамика можно извлечь более-менее правдоподобные звуки. Воспроизведение различных частот достигается за счет того, что диффузор динамика обладает конечной реакцией и не способен мгновенно перескакивать с места на место, таким образом, он "плавно раскачивается" вследствие скачкообразного изменения напряжения на нем. И если колебать его с разной скоростью, то можно получить колебания воздуха на разных частотах. Естественной альтернативой динамику стал так называемый Covox - это простейший ЦАП, выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают перевод цифрового представления сигнала в аналоговый - то есть в реальные значения амплитуды. Covox прост в изготовлении и поэтому он пользовался успехом у любителей вплоть до того времени, когда звуковая карта стала доступной всем.

В современном компьютере звук воспроизводится и записывается с помощью звуковой карты - подключаемой, либо встроенной в материнскую плату компьютера. Задача звуковой карты в компьютере - ввод и вывод аудио. Практически это означает, что звуковая карта является тем преобразователем, который переводит аналоговый звук в цифровой и обратно. Если описывать упрощенно, то работа звуковой карты может быть пояснена следующим образом. Предположим, что на вход звуковой карты подан аналоговый сигнал и карта включена (программно). Сначала входной аналоговый сигнал попадает в аналоговый микшер, который занимается смешением сигналов и регулировкой громкости и баланса. Микшер необходим, в частности, для предоставления возможности пользователю управлять уровнями. Затем отрегулированный и сбалансированный сигнал попадает в аналогово-цифровой преобразователь, где сигнал дискретизуется и квантуется, в результате чего в компьютер по шине данных направляется бит-поток, который и представляет собой оцифрованный аудио сигнал. Вывод аудио информации почти аналогичен вводу, только происходит в обратную сторону. Поток данных, направленный в звуковую карту, преодолевает цифро-аналоговый преобразователь, который образует из чисел, описывающих амплитуду сигнала, электрический сигнал; полученный аналоговый сигнал может быть пропущен через любые аналоговые тракты для дальнейших преобразований, в том числе и для воспроизведения. Надо отметить, что если звуковая карта оборудована интерфейсом для обмена цифровыми данными, то при работе с цифровым аудио никакие аналоговые блоки карты не задействуются.

4. Импульсная и частотная модуляция. Хранение оцифрованного звука

Для хранения цифрового звука существует много различных способов. Во-первых, блок оцифрованной аудио информации можно записать в файл "как есть", то есть последовательностью чисел (значений амплитуды). В этом случае существуют два способа хранения информации.

Первый - PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд (бывают знаковое или беззнаковое представления). Именно в таком виде записаны данные на всех аудио CD.

Второй способ - ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) - запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

Во-вторых, можно сжать или упростить данные так, чтобы они занимали меньший объем памяти, нежели будучи записанными "как есть". Тут тоже имеются два пути.

Кодирование данных без потерь (lossless coding) - это способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К такому способу уплотнения данных прибегают в тех случаях, когда сохранение оригинального качества данных критично. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия. Подобные кодеры - это своего рода архиваторы данных (как ZIP, RAR и другие), только предназначенные для сжатия именно аудио.

Имеется и второй путь кодирования - кодирование данных с потерями (lossy coding). Цель такого кодирования - любыми способами добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем объеме упакованных данных. Это достигается путем использования различных алгоритмов "упрощающих" оригинальный сигнал (выкидывая из него "ненужные" слабослышимые детали), что приводит к тому, что декодированный сигнал фактически перестает быть идентичным оригиналу, а лишь похоже звучит. Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I, II, III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). Надо особо подчеркнуть, что в основе всех lossy-кодеров лежит использование так называемой психоакустической модели, которая как раз и занимается "упрощением" оригинального сигнала. Говоря точнее, механизм подобных кодеров выполняет анализ кодируемого сигнала, в процессе которого определяются участки сигнала, в определенных частотных областях которых имеются неслышные человеческому уху нюансы (замаскированные или неслышимые частоты), после чего происходит их удаление из оригинального сигнала. Таким образом, степень сжатия оригинального сигнала зависит от степени его "упрощения"; сильное сжатие достигается путем "агрессивного упрощения" (когда кодер "считает" ненужными множественные нюансы), такое сжатие, естественно, приводит к сильной деградации качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания. Говоря о способах хранения звука в цифровом виде нельзя не вспомнить и о носителях данных. Всем привычный аудио компакт-диск, появившийся в начале 80-х годов, широкое распространение получил именно в последние годы (что связано с сильным удешевлением носителя и приводов). А до этого носителями цифровых данных являлись кассеты с магнитной лентой, но не обычные, а специально предназначенные для так называемых DAT-магнитофонов. Эти магнитофоны использовались, в основном, в студиях звукозаписи. Преимущество таких магнитофонов было в том, что, не смотря на использование привычных носителей, данные на них хранились в цифровом виде и практически никаких потерь при чтении/записи на них не было (что очень важно при студийной обработке и хранении звука). Сегодня появилось большое количество различных носителей данных, кроме привычных всем компакт дисков. Носители совершенствуются и с каждым годом становятся более доступными и компактными. Это открывает большие возможности в области создания мобильных аудио проигрывателей.

5. Теорема Котельникова - Найквиста. Алиазинг

где - максимальная скорость передачи H - ширина полосы пропускания канала, выраженная в Гц, М - количество уровней сигнала, которые используются при передаче. Например, из этой формулы видно, что канал с полосой 3 кГц не может передавать двухуровневые сигналы быстрее 6000 бит/сек.

Эта теорема также показывает, что, например, бессмысленно сканировать линию чаще, чем удвоена ширина полосы пропускания. Действительно, все частоты выше этой отсутствуют в сигнале, а потому вся информация, необходимая для возобновления сигнала будет собрана при таком сканировании.

Однако теорема Котельникова Найквиста не учитывает шум в канале, который измеряется как отношение мощности полезного сигнала к мощности шума: S/N. Эта величина измеряется в децибелах: 10log10 (S/N) dB. Например, если отношение S/N равняется 10, то говорят о шуме в 10 dB если отношение равняется 100, то - 20 dB.

На случай канала с шумом есть теорема Шенона, по которой максимальная скорость передачи данных по каналу с шумом равняется:

H log2 (1+S/N) бит/сек, где S/N - соотношение сигнал-шум в канале.

Здесь неважно количество уровней в сигнале. Эта формула устанавливает теоретический предел, который редко достигается на практике. Например, по каналу с полосой пропускания в 3000 Гц и уровнем шума 30 dB (это характеристики телефонной линии) нельзя передать данные быстрее, чем со скоростью 30 000 бит/сек.

Алиазинг (муар) - вид помех, появляющихся, когда растр объекта или ряд регулярных линий на нем интерферируется с растром пикселей цифрового сенсора. Также эффект алиазинга состоит в искажении диагональной линии, которая кажется на изображении ступенчатой. Для решения этой проблемы существуют системы Anti-aliasing. Они основаны на фильтре, который стоит перед сенсором, но могут строиться и на обработке изображения процессором фотокамеры. Они сильно уменьшают эффект ступенчатости, но могут оставлять впечатление размытости.

6. Сэмплирование

Сэмплирование - это запись образцов звучания (сэмплов) того или иного реального музыкального инструмента. Сэмплирование является основой волнового синтеза (WT-синтеза) музыкальных звуков. Если при частотном синтезе (FM-синтезе) новые звучания получают за счет разнообразной обработки простейших стандартных колебаний, то основой WT-синтеза являются заранее записанные звуки традиционных музыкальных инструментов или звуки, сопровождающие различные процессы в природе и технике. С сэмплами можно делать все, что угодно. Можно оставить их такими, как есть, и WT-синтезатор будет звучать голосами, почти неотличимыми от голосов инструментов-первоисточников. Можно подвергнуть сэмплы модуляции, фильтрации, воздействию эффектов и получить самые фантастические, неземные звуки.

В принципе, сэмпл - это ни что иное, как сохраненная в памяти синтезатора последовательность цифровых отсчетов, получившихся в результате аналого-цифрового преобразования звука музыкального инструмента. Если бы не существовала проблема экономии памяти, то звучание каждой ноты можно было бы записать в исполнении каждого музыкального инструмента. А игра на таком синтезаторе представляла бы собой воспроизведение этих записей в необходимые моменты времени. Сэмплы хранятся в памяти не в том виде, в каком они получаются сразу же после прохождения АЦП. Запись подвергается хирургическому воздействию, делится на характерные части (фазы): начало, протяженный участок, завершение звука. В зависимости от применяемой фирменной технологии эти части могут делиться на еще более мелкие фрагменты. В памяти хранится не вся запись, а лишь минимально необходимая для ее восстановления информация о каждом из фрагментов. Изменение протяженности звучания производится за счет управления числом повторений отдельных фрагментов.

В целях еще большей экономии памяти был разработан способ синтеза, позволяющий хранить сэмплы не для каждой ноты, а лишь для некоторых. В этом случае изменения высоты звучания достигается путем изменения скорости воспроизведения сэмпла.

Для создания и воспроизведения сэмплов служит синтезатор. В наши дни синтезатор конструктивно реализован в одном-двух корпусах микросхем, которые представляет собой специализированный процессор для осуществления всех необходимых преобразовании. Из закодированных и сжатых с помощью специальных алгоритмов фрагментов он собирает сэмпл, задает высоту его звучания, изменяет в соответствии с замыслом музыканта форму огибающей колебания, имитируя либо почти неощутимое касание, либо удар по клавише или струне. Кроме того, процессор добавляет различные эффекты, изменяет тембр с помощью фильтров и модуляторов.

В звуковых картах находят применение несколько синтезаторов различных фирм.

Наряду с сэмплами, записанными в ПЗУ звуковой карты, в настоящее время стали доступными наборы сэмплов (банки), созданные как в лабораториях фирм, специализирующихся на синтезаторах, так и любителями компьютерной музыки. Эти банки можно найти на многочисленных лазерных дисках и в Internet.

7. Аппаратура

Немаловажная часть разговора о звуке связана с аппаратурой. Существует много различных устройств для обработки и ввода/вывода звука. Касательно обычного персонального компьютера следует подробнее остановиться на звуковых картах. Звуковые карты принято делить на звуковые, музыкальные и звукомузыкальные. По конструкции же все звуковые платы можно разделить на две группы: основные (устанавливаемые на материнской плате компьютера и обеспечивающие ввод и вывод аудио данных) и дочерние (имеют принципиальное конструктивное отличие от основных плат - они чаще всего подключаются к специальному разъему, расположенному на основной плате). Дочерние платы служат чаще всего для обеспечения или расширения возможностей MIDI-синтезатора.

Звукомузыкальные и звуковые платы выполняются в виде устройств, вставляемых в слот материнской платы (либо уже встроены в нее изначально). Визуально они имеют обычно два аналоговых входа - линейный и микрофонный, и несколько аналоговых выходов: линейные выходы и выход для наушников. В последнее время карты стали оснащаться также и цифровым входом и выходом, обеспечивающим передачу аудио между цифровыми устройствами. Аналоговые входы и выходы обычно имеют разъемы, аналогичные разъемам головных наушников (1/8”). Вообще, входов у звуковой платы немного больше, чем два: аналоговые CD, MIDI и другие входы. Они, в отличие от микрофонного и линейного входов, расположены не на задней панели звуковой платы, а на самой плате; могут иметься и другие входы, например, для подключения голосового модема. Цифровые входы и выходы обычно выполнены в виде интерфейса S/PDIF (интерфейс цифровой передачи сигналов) с соответствующим разъемом (S/PDIF - сокращение от Sony/Panasonic Digital Interface - цифровой интерфейс Sony/Panasonic). S/PDIF - это "бытовой" вариант более сложного профессионального стандарта AES/EBU (Audio Engineering Society / European Broadcast Union). Сигнал S/PDIF используется для цифровой передачи (кодирования) 16-разрядных стерео данных с любой частотой дискретизации. Помимо перечисленного, на звукомузыкальных платах имеется MIDI-интерфейс с разъемами для подключения MIDI-устройств и джойстиков, а также для подсоединения дочерней музыкальной карты (хотя в последнее время возможность подключения последней становится редкостью). Некоторые модели звуковых карт для удобства пользователя оснащаются фронтальной панелью, устанавливаемой на лицевой стороне системного блока компьютера, на которой размещаются разъемы, соединенные с различными входами и выходами звуковой карты.

Определим несколько основных блоков, из которых состоят звуковые и звукомузыкальные платы.

1. Блок цифровой обработки сигналов (кодек). В этом блоке осуществляются аналого-цифровые и цифро-аналоговые преобразования (АЦП и ЦАП). От этого блока зависят такие характеристики карты, как максимальная частота дискретизации при записи и воспроизведении сигнала, максимальный уровень квантования и максимальное количество обрабатываемых каналов (моно или стерео). В немалой степени от качества и сложности составляющих этого блока зависят и шумовые характеристики.

2. Блок синтезатора. Присутствует в музыкальных картах. Выполняется на основе либо FM-, либо WT-синтеза, либо на обоих сразу. Может работать как под управлением собственного процессора, так и под управлением специального драйвера.

3. Интерфейсный блок. Обеспечивает передачу данных по различным интерфейсам (например, S/PDIF). У чисто звуковой карты этот блок чаще отсутствует.

4. Микшерный блок. В звуковых платах микшерный блок обеспечивает регулировку:

уровней сигналов с линейных входов;

уровней с MIDI входа и входа цифрового звука;

уровня общего сигнала;

панорамирования;

тембра.

Что такое MIDI-синтезатор? Название этого устройства пошло от его основного предназначения - синтеза звука. Основных методов синтеза звука существует всего два: FM (Frequency modulation - частотная модуляция) и WT (Wave Table - таблично-волновой). В основе FM-синтеза лежит идея, что любое даже самое сложное колебание является по сути суммой простейших синусоидальных. Таким образом, можно наложить друг на друга сигналы от конечного числа генераторов синусоид и путем изменения частот синусоид получать звуки, похожие на настоящие. Таблично-волновой синтез основывается на другом принципе. Синтез звука при использовании такого метода достигается за счет манипуляций над заранее записанными (оцифрованными) звуками реальных музыкальных инструментов. Эти звуки (они называются сэмплами) хранятся в постоянной памяти синтезатора.

Надо отметить, что поскольку MIDI-данные - это набор команд, то музыка, которая написана с помощью MIDI, также записывается с помощью команд синтезатора. Иными словами, MIDI-партитура - это последовательность команд: какую ноту играть, какой инструмент использовать, какова продолжительность и тональность ее звучания и так далее. Знакомые многим MIDI-файлы (. MID) есть нечто иное, как набор таких команд. Естественно, что поскольку имеется великое множество производителей MIDI-синтезаторов, то и звучать один и тот же файл может на разных синтезаторах по-разному (потому что в файле сами инструменты не хранятся, а есть лишь только указания синтезатору какими инструментами играть, в то время как разные синтезаторы могут звучать по-разному).

8. Программное обеспечение

Наиболее важный класс программ - редакторы цифрового аудио. Основные возможности таких программ это, как минимум, обеспечение возможности записи (оцифровки) аудио и сохранение на диск. Развитые представители такого рода программ позволяют намного больше: запись, многоканальное сведение аудио на нескольких виртуальных дорожках, обработка специальными эффектами (как встроенными, так и подключаемыми извне - об этом позже), очистка от шумов, имеют развитую навигацию и инструментарий в виде спектроскопа и прочих виртуальных приборов, управление/управляемость внешними устройствами, преобразование аудио из формата в формат, генерация сигналов, запись на компакт диски и многое другое. Некоторые из таких программ: Cool Edit Pro (Syntrillium), Sound Forge (Sonic Foundry), Nuendo (Steinberg), Samplitude Producer (Magix), Wavelab (Steinberg), Dart.

Специализированные реставраторы аудио позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудио-кассет, и провести другую корректировку аудио. Программы подобного рода: Dart, Clean (от Steinberg Inc), Audio Cleaning Lab. (от Magix Ent), Wave Corrector.

9. Задержка. Модуляционные эффекты. Реверберация

Дилэй (Delay) в переводе означает "задержка". Необходимость в этом эффекте возникла с появлением стереофонии. Сама природа слухового аппарата человека предполагает в большинстве ситуаций поступление в мозг двух звуковых сигналов, отличающихся временем прихода. Если источник звука находится "перед глазами", на перпендикуляре, проведенном к линии, проходящей через уши, то прямой звук от источника достигает обоих ушей в одно и то же время. Во всех остальных случаях расстояния от источника до ушей различны, поэтому либо одно, либо другое ухо воспринимает звук первым.

Время задержки (разницы во времени приема сигналов ушами) будет максимальным в том случае, когда источник расположен напротив одного из ушей. Так как расстояние между ушами около 20 см, то максимальная задержка может составлять около 8 мс. Этим величинам соответствует волна звукового колебания с частотой около 1,1 кГц. Для более высокочастотных звуковых колебаний длина волны становится меньше, чем расстояние между ушами, и разница во времени приема сигналов ушами становится неощутимой. Предельная частота колебаний, задержка которых воспринимается человеком, зависит от направления на источник. Она растет по мере того, как источник смещается от точки, расположенной напротив одного из ушей, к точке, расположенной перед человеком.

Дилэй применяется, прежде всего, в том случае, когда запись голоса или акустического музыкального инструмента, выполненную с помощью единственного микрофона, встраивают в стереофоническую композицию. Этот эффект служит основой технологии создания стереозаписей. Дилэй может применяться и для получения эффекта однократного повторения каких-либо звуков. Величина задержки между прямым сигналом и его задержанной копией в этом случае выбирается большей, чем естественная задержка в 8 мс. Для коротких и резких звуков время задержки, при котором основной сигнал и его копия различимы меньше, чем для протяженных звуков. Для произведений, исполняемых в медленном темпе, задержка может быть больше, чем для быстрых композиций,

При определенных соотношениях громкостей прямого и задержанного сигнала может иметь место психоакустический эффект изменения кажущегося расположения источника звука на стереопанораме.

Этот эффект реализуется с помощью устройств, способных осуществлять задержку акустического или электрического сигналов. Таким устройством сейчас чаще всего служит цифровая линия задержки, представляющая собой цепочку из элементарных ячеек - триггеров задержки. Для наших целей достаточно знать, что принцип действия триггера задержки сводится к следующему: двоичный сигнал, поступивший в некоторый тактовый момент времени на его вход, появится на его выходе не мгновенно, а только в очередной тактовый момент. Общее время задержки в линии тем больше, чем больше триггеров задержки включено в цепочку, и тем меньше, чем меньше тактовый интервал (чем больше тактовая частота). В качестве цифровых линий задержки можно использовать запоминающие устройства.

Разумеется, для применения цифровой линии задержки сигнал должен быть сначала преобразован в цифровую форму. А после прохождения его копии через линию задержки происходит обратное, цифро-аналоговое преобразование. Исходный сигнал и его задержанная копия могут быть раздельно направлены в различные стереоканалы, но могут быть и смешаны в различных пропорциях. Суммарный сигнал может быть направлен либо в один из стереоканалов, либо в оба.

В звуковых редакторах дилэй реализуется программным (математическим) путем за счет изменения относительной нумерации отсчетов исходного сигнала и его копии.

В основу звуковых эффектов флэнжер (Flanger) и фэйзер (Phaser) также положена задержка сигнала.

Эффект повторного звучания может быть вызван и распространением звука от источника к приемнику различными путями (например, звук может приходить, во-первых, напрямую и, во-вторых, отразившись от препятствия, находящегося чуть в стороне от прямого пути). И в том, и в другом случаях время задержки остается постоянным. В реальной жизни этому соответствует маловероятная ситуация, когда источник звука, приемник звука и отражающие предметы неподвижны относительно друг друга. При этом частота звука не изменяется, каким бы путем и в какое бы ухо он не приходил.

Если же какой-либо из трех элементов подвижен, то частота принимаемого звука не может оставаться той же, что и частота звука переданного. Это есть ни что иное, как проявление эффекта Доплера.

И флэнжер, и фэйзер имитируют проявления взаимного перемещения трех элементов: источника, приемника и отражателя звука. По сути дела, и тот, и другой эффекты представляют собой сочетание задержки звукового сигнала с частотной или фазовой модуляцией. Разница между ними чисто количественная, флэнжер отличается от фейзера тем, что для первого эффекта время задержки копии (или времена задержек копий) и изменение частот, сигнала значительно большее, чем для второго. Образно говоря, флэнжер наблюдался бы в том случае, когда певец мчался бы к зрителю, сидящему в зале, со скоростью автомобиля. А вот для того, чтобы ощутить фэйзер в его, так сказать, первозданном виде, движущегося источника звука не требуется, зрителю достаточно часто-часто вертеть головой из стороны в сторону.

Упомянутые количественные отличия эффектов приводят и к отличиям качественным: во-первых, звуки, обработанные ими, приобретают различные акустические и музыкальные свойства, во-вторых, эффекты реализуются различными техническими средствами.

Значения времени задержек, характерных для флэнжера, существенно превышают период звукового колебания, поэтому для реализации эффекта используют многоразрядные и многоотводные цифровые линии задержки. С каждого из отводов снимается свой сигнал, который в свою очередь подвергается частотной модуляции.

Для фэйзера, наоборот, характерно очень маленькое время задержки. Оно столь мало, что оказывается сравнимо с периодом звукового колебания. При столь малых относительных сдвигах принято говорить уже не о задержке копий сигнала во времени, а о разности их фаз. Если эта разность фаз не остается постоянной, а изменяется по периодическому закону, то мы имеем дело с эффектом фейзера. Так что можно считать фейзер предельным случаем флэнжера.

Чтобы получить флэнжер, вместо одной акустической системы использовали несколько систем, размещенных на различных расстояниях от слушателей. В необходимые моменты производили поочередное подключение источника сигнала к акустическим системам таким образом, что создавалось впечатление приближения или удаления источника звука. Задержку звука выполняли и с помощью магнитофонов со сквозным трактом запись/ воспроизведение. Одна головка записывает, другая - воспроизводит звук с задержкой на время, необходимое для перемещения ленты от головки к головке. Для частотной модуляции особых мер можно было и не придумывать. Каждому аналоговому магнитофону присущ естественный недостаток, называемый детонацией, которая проявляется в виде "плавания" звука. Стоило чуть-чуть специально усилить этот эффект, изменяя напряжение, питающее двигатель, и получалась частотная модуляция.

Для реализации фэйзера методами аналоговой техники использовали цепочки фазовращателей, управляемых электрическим путем. А иногда можно было наблюдать и такую картину: в акустической системе, подключенной к ЭМИ или электрогитаре, вдруг начинало вращаться что-то вроде вентилятора. Звук пересекался с подвижными лопастями и отражался от них, получалась фазовая модуляция.

Реверберация [Reverb] относится к наиболее интересным и популярным звуковым эффектам. Сущность реверберации заключается в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные временные интервалы. Этим реверберация напоминает дилэй. Однако при реверберации число задержанных копий сигнала может быть значительно больше, чем для дилэя. Теоретически число копий может быть бесконечным. Кроме того, при реверберации, чем больше время запаздывания копии сигнала, тем меньше ее амплитуда (громкость). Эффект зависит от того, каковы временные промежутки между копиями сигналов и какова скорость уменьшения уровней их громкости. Если промежутки между копиями малы, то получается собственно эффект реверберации. Возникает ощущение объемного гулкого помещения. Звуки музыкальных инструментов становятся сочными, объемными, с богатым тембровым составом. Голоса певцов приобретают напевность, недостатки, присущие им, становятся малозаметными.

Если промежутки между копиями велики (более 100 мс), то правильнее говорить не об эффекте реверберации, а об эффекте "эхо". Интервалы между соответствующими звуками при этом становятся различимыми. Звуки перестают сливаться, кажутся отражениями от удаленных преград.

Основным элементом, реализующим эффект реверберации, является устройство, создающее эхо-сигнал.

Эхо-камера представляет собой комнату с сильно отражающими стенами, в которую помещен источник звукового сигнала (громкоговоритель) и приемник (микрофон). Преимущество эхо-камеры состоит в том, что затухание звука происходит в ней естественным путем (что очень трудно обеспечить другими способами). В то время как звук продолжает реверберировать в трех измерениях, исходная волна разбивается на множество отраженных, которые достигают микрофона за уменьшающиеся промежутки времени.

Наряду с эхо-камерами для имитации реверберации использовали стальные пластины, точнее, довольно большие по размеру листы. Колебания в них вводили и снимали с помощью устройств, по конструкции и принципу действия похожих на электромагнитные головные телефоны. Для получения удовлетворительной равномерности амплитудно-частотной характеристики толщина листа должна быть выдержана с точностью, которую не обеспечивают обычные технологии проката стали. Реверберация здесь была не трехмерной, а плоской. Сигнал имел характерный металлический оттенок.

В середине 60-х годов для получения эффекта реверберации стали применять пружинные ревербераторы. С помощью электромагнитного преобразователя, соединенного с одним из концов пружины, в ней возбуждались механические колебания, которые с задержкой достигали второго конца пружины, связанного с датчиком. Эффект повторения звука обусловлен многократным отражением волн механических колебаний от концов пружины.

На смену этим несовершенным устройствам пришли ревербераторы магнитофонные. Принцип формирования в них эхо-сигнала состоит в том, что исходный сигнал записывается на ленту записывающей магнитной головкой, а через время, необходимое для перемещения ленты к воспроизводящей головке, считывается ею. Через цепь обратной связи уменьшенный по амплитуде задержанный сигнал вновь подается на запись, что и создает эффект многократного отражения звука с постепенным затуханием. Качество звука определяется параметрами магнитофона. Недостаток магнитофонного ревербератора заключается в том, что при приемлемых скоростях протяжки ленты удается получить только эффект эха. Для получения собственно реверберации требуется либо еще сильнее сблизить магнитные головки (чего не позволяет сделать их конструкция), либо значительно увеличить скорость движения ленты.

С развитием цифровой техники и появлением интегральных микросхем, содержащих в одном корпусе сотни и тысячи цифровых триггеров (о которых мы уже говорили) появилась возможность создавать высококачественные цифровые ревербераторы. В таких устройствах сигнал может быть задержан на любое время, необходимое как для получения реверберации, так и для получения эха.

В звуковых картах реверберация, в конечном счете, основана именно на цифровой задержке сигналов.

Наблюдая этапы развития средств реверберации, можно предположить, что когда-нибудь появятся и математические модели пружинных и магнитофонных ревербераторов. Ведь не исключено, что есть люди, испытывающие ностальгические чувства по отношению к звукам музыки, окрашенным дребезгом пружин или шипением магнитной ленты.

10. Саундтреки

Саундтреки - это музыка к фильмам. Этот жанр считается очень выгодным: для оркестрантов (сыграл один раз, а получил как за целую гастрольную поездку), для дирижера (для солидных фильмов обычно и оркестры приглашаются хорошие, а руководить такими - одно удовольствие), для композитора (услышать свою партитуру в великолепном исполнении - такое сейчас мало кому удается).

Самые яркие саундтреки становятся символом фильма, оркестровые темы путешествуют из серии в серию (тот же марш из "Звездных войн" открывает все "эпизоды"), Джеймс Хорнер стал настолько известным именно из-за своей музыки к Титанику, кстати, он сам и дирижировал оркестром. В корпорации Sony есть отдел, который занимается исключительно продажей музыки к фильмам. Он так и называется: Sony music soundtrax.

Обычно саундтреки исполняются только один раз - при записи в студии. Но для хитов делаются исключения. Например, весной этого года в московской консерватории исполнялась музыка к фильму "Пианино". Был аншлаг.

Слово саундтрэк так прочно вошло в повседневный язык, что часто слышишь что-то вроде: "Шостакович. Романс из саундтрэка к кинофильму "Овод".

Sony Cinescore - программа для создания профессиональных саундтреков и озвучивания видеоматериалов. Cinescore автоматически генерирует неограниченное число музыкальных композиций, используя легальные темы, охватывающие практически все музыкальные жанры и направления. Можно создавать аудиодорожку определенной длины, увеличивать или уменьшать темп, чтобы музыка соответствовала происходящему на экране. В базе программы множество свободно распространяемых музыкальных тем.

Cinescore устанавливает новые уровни индивидуального приспособления к требованиям пользователя, качества и точности в мире профессионального создания саундтреков. Обеспечивается возможность автоматического создания неограниченного числа музыкальных композиций с использованием наборов бесплатных тем в широком разнообразии популярных стилей.

Cinescore генерирует неограниченное число полностью оркестрованных композиций, индивидуально подобранных для видеосюжета в точном соответствии с заданной длительностью. Можно отрегулировать параметры, такие как настроение, темп и интенсивность для создания из сложных песен любых коротких и приятных аранжировок саундтреков. ПО Cinescore предоставляет необходимые инструментальные средства и гибкость для создания индивидуального звучания песен с полным управлением звуковым сопровождением.

С помощью программы можно получить полный контроль над медиасредствами и создать свой индивидуальный саундтрек с возможностью точной подстройки уровня, панорамирования, высоты тона и темпа.

Программа Cinescore импортирует разнообразные файловые форматы для простого создания проектов, включая AVI, AIF, BMP, JPG, MP3, видео MPEG 1 и MPEG 2, PCA, PSD, QT, SWF, WAV и WMV. Можно создавать динамичные и эффектные музыкальные треки для фильмов, слайд-шоу, рекламные ролики и радиопрограммы одним щелчком мыши, осуществлять экспорт в популярных форматах, таких как MPEG-2 для DVD и MPEG-4 для портативных медиа-плееров.

Список используемой литературы

Чеппел Д. Создаём свою компьютерную студию звукозаписи. Триумф, 2007.

Червяков А. Звукозапись и обработка звука в программе Audacity.

Козюренко Ю.И. Звукозапись с микрофона. Altex, 2008.

Севашко А.В. Звукорежиссура и запись фонограмм. Профессиональное руководство. Altex, 2008.

Журнал Stereo&Video