Психоакустическое восприятие и midi-интерфейсы

МИНИСТЕРСТВО КУЛЬТУРЫ РФ

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧЕРЕЖДЕНИЕ

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

КИНО И ТЕЛЕВИДЕНИЯ»

СПбГУКиТ

кафедра ТЭ

РЕФЕРАТ

по дисциплине «Аудиотехника»

Выполнил

студент 713 гр

факультета АВТ

Комаров А.С

г. Санкт-Петербург 2010г.

Оглавление

Введение

1. Основы психоакустического восприятия звуковых сигналов

Свойства восприятия

Пределы восприятия звука

2. MIDI-студии, интерфейс MIDI

Стандарты MIDI

Аппаратная спецификация MIDI

Применения MIDI

Список использованной литературы

Введение

Звукотехника является одной из областей массовой технологической деятельности, при которой средствами электроники осуществляется обработка, накопление и распространение в электрической форме сигналов звукового диапазона частот. Современная звукотехника направлена на удовлетворение потребностей человека в знаниях, культуре, образовании. Благодаря повсеместному распространению звукотехнических устройств в сочетании со средствами массовой аудиовизуальной информации и коммуникации формируется та содержательная часть окружающей человека искусственной акустической среды, которая оказывает, как правило, позитивное рациональное и эмоциональное воздействие на людей.

Современная звукотехника развивается в двух основных направлениях. Во-первых, это все более расширяющееся применение интегральных схем и, во-вторых, использование цифровой техники не только для управления и регулирования, но и для передачи сигналов. Современные способы передачи и записи звука, реализованные, например, в системе компакт-диск, потребовали аналоговых усилителей с весьма высокими показателями качества: динамическим диапазоном до 100 Дб и коэффициентом нелинейных искажений около 0,002. Управляющие звенья, где все чаще используются средства цифровой техники, это такие электронные устройства, как, например, переключатели, регуляторы громкости, тембра и т.д. Быстро прогрессирующие возможности интегральной схемотехники прежде всего используются в указанных областях.

При обработке сигналов в электронных звуковых устройствах стремятся по возможности более полно сохранить содержащуюся в сигналах информацию. При этом объективная оценка качества звукотехнических устройств осуществляется по следующим основным показателям:

    линейные искажения (неравномерность амплитудно- и фазочастотной характеристик);

    нелинейные искажения и паразитная модуляция (появление новых составляющих в частотном спектре сигнала, вариации уровня и частоты подаваемых сигналов - детонация);

    относительный уровень помех (отношение сигнал/помеха).

Совершенствующиеся методы анализа звукотехнических схем позволяют вскрывать все новые причины, приводящие к искажениям при воспроизведении. Решающую роль при анализе электронных схем звукового оборудования играют расчеты и моделирование на ЭВМ, а при конструировании - машинное проектирование. Значителен прогресс и в технике звукотехнических измерений. Только благодаря новым методам и средствам измерений стало возможным объективное подтверждение самых различных эффектов, предсказуемых на основе расчетов.

1. Основы психоакустического восприятия звуковых сигналов

Восприятие (перцепция, от лат. perceptio) — познавательный процесс, формирующий субъективную картину мира.

Свойства восприятия

    Предметность — объекты воспринимаются не как бессвязный набор ощущения, а составляют образы конкретных предметов.

    Структурность — предмет воспринимается сознанием уже в качестве абстрагированной от ощущений смоделированной структуры.

    Апперцептивность — на восприятие оказывает влияние общее содержание психики человека.

    Контактность (константность) — на восприятие оказывают влияние обстоятельства, в которых оно происходит. Но несмотря на это восприятие остается относительно неизменным.

    Активность — в любой момент времени мы воспринимаем только один объект. Природа активности восприятия обусловлена самой природой нашего сознания.

    Осмысленность — предмет сознательно воспринимается, мысленно называется (связывается с определённой категорией), относится к определённому классу

Осмысление состоит из этапов:

    Селекция — выделение из потока информации объекта восприятия

    Организация — объект идентифицируется по комплексу признаков

    Категоризация и приписывание объекту свойств объектов этого класса

Факторы восприятия

Внешние:

    Размер

    Интенсивность (в физическом или эмоциональном плане)

    Контрастность (противоречие с окружением)

    Движение

    Повторяемость

    Новизна и узнаваемость

Внутренние:

    Установка восприятия — ожидание увидеть то, что должно быть увидено по прошлому опыту.

    Потребности и мотивация — человек видит то, в чём нуждается или что считает важным.

    Опыт — человек воспринимает тот аспект стимула, которому научен прошлым опытом.

    Я-концепция — восприятие мира группируется вокруг восприятия себя.

    Личностные особенности — оптимисты видят мир и события в позитивном свете, пессимисты, напротив, — в неблагоприятном.

Результатом процесса восприятия становится построенный образ.

Образ — субъективное видение реального мира, воспринимаемого при помощи органов чувств.

Получив образ, человек (или другой субъект) производит определение ситуации, то есть оценивает её, после чего принимает решение о своём поведении.

Аку́стика (от греч. ἀκούω (аку́о) — слышу) — наука о звуке, изучающая физическую природу звука и проблемы, связанные с его возникновением, распространением, восприятием и воздействием. Акустика является одним из направлений физики (механики), исследующее упругие колебания и волны от самых низких (от 0 Гц) до высоких частот, занимающаяся проблемами создания и распространения механических колебаний; также, она тесно связана с психофизикой, музыкальной психологией, гигиенической акустикой и др.

Акустика является междисциплинарной наукой, использующей для решения своих проблем широкий круг дисциплин: математику, физику, психологию, архитектуру, электронику, биологию, медицину, гигиену, теорию музыки и др.

Психоаку́стика — наука, изучающая психологические и физиологические особенности восприятия звука человеком.

Во многих приложениях акустики и обработки звуковых сигналов необходимо знать, что́ люди слышат. Звук, который образуют волны давления воздуха, может быть точно измерен современным оборудованием. Однако понять, как эти волны принимаются и отображаются в нашем головном мозге — задача не такая простая. Звук — это непрерывный аналоговый сигнал, который (в предположении, что молекулы воздуха бесконечно малы) может теоретически переносить бесконечное количество информации (так как существует бесконечное число частот, содержащих информацию об амплитуде и фазе).

Понимание процессов восприятия позволяет учёным и инженерам сосредоточиться на возможностях слуха и не учитывать менее важные возможности других систем. Важно также отметить, что вопрос «что человек слышит» — не только вопрос о физиологических возможностях уха, но во многом также вопрос психологии, чёткости восприятия.

Пределы восприятия звука

Человеческое ухо номинально слышит звуки в диапазоне от 16 до 20 000 Гц. Верхний предел имеет тенденцию снижаться с возрастом. Большинство взрослых людей не могут слышать звук частотой выше 16 кГц. Ухо само по себе не реагирует на частоты ниже 20 Гц, но они могут ощущаться через органы осязания.

Частотное разрешение звука в середине диапазона —около 2 Гц. То есть, различимо изменение частоты звука более чем на 2 Гц. Однако, есть возможность уловить ещё меньшую разницу. Например, в случае, если оба тона приходят одновременно, в результате сложения двух колебаний возникает модуляция амплитуды сигнала с частотой, равной разности исходных частот. Этот эффект известен также как биение.

Диапазон громкости воспринимаемых звуков огромен. Наша барабанная перепонка в ухе чувствительна только к изменению давления. Громкость звука принято измерять в децибелах (дБ). Нижний порог слышимости определён как 0 Дб, а определение верхнего предела слышимости относится скорее к вопросу, при какой громкости начнётся разрушение уха. Этот предел зависит от того, как долго по времени мы слушаем звук. Ухо способно переносить кратковременное повышение громкости до 120 дБ без последствий, но долговременное восприятие звуков громкостью более 80 дБ может вызвать потерю слуха.

Более тщательные исследования нижней границы слуха показали, что минимальный порог, при котором звук остаётся слышен, зависит от частоты. Этот график получил название абсолютный порог слышимости. В среднем, он имеет участок наибольшей чувствительности в диапазоне от 1 кГц до 5 кГц, хотя с возрастом чувствительность понижается в диапазоне выше 2 кГц.

Кривая абсолютного порога слышимости является частным случаем более общих — кривых одинаковой громкости. Кривые одинаковой громкости — это линии, на которых человек ощущает звук разных частот одинаково громкими. Кривые были впервые получены Флетчером и Мэнсоном (H Fletcher and W A Munson), и опубликованы в труде «Loudness, its definition, measurement and calculation» в J.Acoust. Soc Am.5, 82-108 (1933). Позже более точные измерения выполнили Робинсон и Датсон (D W Robinson and R S Dadson «A re-determination of the equal-loudness relations for pure tones» in Br. J. Appl. Phys. 7, 166—181 ,1956). Полученные кривые значительно различаются, но это не ошибка, а разные условия проведения измерений. Флетчер и Мэнсон в качестве источника звуковых волн использовали наушники, а Робинсон и Датсон — фронтально расположенный динамик в безэховой комнате.

Измерения Робинсона и Датсона легли в основу стандарта ISO 226 в 1986 г. В 2003 году стандарт ISO 226 был обновлён с учётом данных, собранных из 12 международных студий.

Существует также способ восприятия звука без участия барабанной перепонки — так называемый микроволновый слуховой эффект, когда модулированное излучение в микроволновом диапазоне (от 1 до 300 ГГц) воздействует на ткани вокруг улитки, заставляя человека воспринимать различные звуки.

Человеческий слух во многом подобен спектральному анализатору, то есть, ухо распознаёт спектральный состав звуковых волн без анализа фазы волны. В реальности фазовая информация распознаётся и очень важна для направленного восприятия звука, но эту функцию выполняют ответственные за обработку звука отделы головного мозга. Разница между фазами звуковых волн приходящих на правое и левое ухо позволяет определять направление на источник звука, причём информация о разности фаз имеет первостепенное значение, в отличие от изменения громкости звука воспринимаемого разными ушами. Эффект фильтрации передаточных функций головы также играет в этом важную роль.

Эффект маскировки

В определённых случаях один звук может быть скрыт другим звуком. Например, разговор на автобусной остановке может быть совершенно невозможен, если подъезжает шумный автобус. Этот эффект называется маскировкой. Говорят, что слабый звук маскируется, если он становится неразличимым в присутствии более громкого звука.

Различают несколько видов маскировки:

    По времени прихода маскирующего и маскируемого звука:

      одновре́менное (моноуральное) маскирование

      вре́менное (неодновременное) маскирование

    По типу маскируещего и маскируемого звуков:

      чистого тона чистым тоном различной частоты

      чистого тона шумом

      речи чистыми тонами

      речи монотонным шумом

      речи импульсными звуками и т. п.

Одновременная маскировка

Любые два звука при одновременном прослушивании оказывают влияние на восприятие относительной громкости между ними. Более громкий звук снижает восприятие более слабого, вплоть до исчезновения его слышимости. Чем ближе частота маскируемого звука к частоте маскирующего, тем сильнее он будет скрываться. Эффект маскировки не одинаков при смещении маскируемого звука ниже или выше по частоте относительно маскирующего. Более низкочастотный звук сильнее маскирует высокочастотный.

Вре́менная маскировка

Это явление похоже на частотную маскировку, но здесь происходит маскировка во времени. При прекращении подачи маскирующего звука маскируемый некоторое время продолжает быть неслышимым. В обычных условиях эффект от временной маскировки длится значительно меньше. Время маскировки зависит от частоты и амплитуды сигнала и может достигать 100 мс.

В случае, когда маскирующий тон появляется по времени раньше маскируемого, эффект называют пост-маскировкой. Когда маскирующий тон появляется позже маскируемого (возможен и такой случай), эффект называют пре-маскировкой.

Постстимульное утомление

Нередко после воздействия громких звуков высокой интенсивности у человека резко снижается слуховая чувствительность. Восстановление обычных порогов может продолжаться до 16 часов. Этот процесс называется «временный сдвиг порога слуховой чувствительности» или «постстимульное утомление». Сдвиг порога начинает появляться при уровне звукового давления выше 75 дБ и соответственно увеличивается при повышении уровня сигнала. Причём наибольшее влияние на сдвиг порога чувствительности оказывают высокочастотные составляющие сигнала.

2. MIDI-студии, интерфейс MIDI

MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов) — стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

Стандарт на аппаратуру и программное обеспечение

Описывает аппаратный интерфейс, который позволяет соединять электронные музыкальные инструменты и компьютеры различных производителей, описывает протоколы связи для передачи данных от одного устройства к другому. MIDI-устройства могут взаимодействовать с программными приложениями, используя коммуникационный протокол MIDI. Используя соответствующий программный MIDI-секвенсор, внешние MIDI-устройства могут посылать информацию на синтезатор звуковой карты. MIDI базируется на пакетах данных, каждый из которых соответствует MIDI-событию (англ. MIDI-events), от нажатия клавиши до простой паузы, эти события разделяются по каналам. Сложная среда MIDI может включать различную аппаратуру, причём каждая часть системы будет отвечать за события на соответствующем канале. Альтернативным вариантом может быть одиночный синтезатор, который сам может управлять всеми каналами.

Стандарты MIDI

General MIDI (GM)

Первый общий стандарт был предложен в 1991 году ассоциацией производителей MIDI-оборудования. Он объединил изделия разношерстных производителей под именем General MIDI (System) Level 1. Сейчас его поддерживает абсолютное большинство моделей электронных синтезаторов, звуковых карт и клавиатур. Так как требования этого стандарта уже давно морально устарели, то, обычно, современные электронные инструменты поддерживают его лишь для базовой совместимости.

GM-файлы звучат на различных моделях существенно по разному. Дело в том, что определяя количество и состав мелодических инструментов не были точно описаны тембровые характеристики GM-инструментов. Поэтому, если для легкой музыки с традиционным составом оркестра звучание более-менее схоже, то, если задействуются инструменты из таких групп, как Synth Pad, Sound Effects и некоторых других, конечный результат может быть обескураживающим.

GS и XG

Два похожих друг на друга стандарта предложили фирмы Roland и Yamaha. GS начал развиваться в 1991 году сразу за GM и в последующем неоднократно расширялся в связи с выпуском новых продвинутых моделей. XG от Ямахи начал активно продвигаться в 1996 году и при его разработке видимо были учтены наработки Роланда. Спецификация XG отличается огромным количеством настроек эффект-процессора.

General MIDI 2 (GM2)

В 1999 году MMA выпустила расширение GM, получившее наименование General MIDI Level 2 (GM2). В новом стандарте расширили полифонию и палитру доступных инструментов до 256, добавили ряд новых контроллеров. В GM2 прослеживается влияние стандартов Роланда и Ямахи. Несмотря на соглашение между этими фирмами General MIDI Level 2 пока не получил широкого распространения.

Спецификация формата данных MIDI

MIDI-данные представляют собой сообщения, или события (events), каждое из которых является командой для музыкального инструмента. Стандарт предусматривает 16 независимых и равноправных логических каналов, внутри каждого из которых действуют свои режимы работы; изначально это было предназначено для однотембровых инструментов, способных в каждый момент времени воспроизводить звук только одного тембра - каждому инструменту присваивался свой номер канала, что давало возможность многотембрового исполнения. С появлением многотембровых (multi-timbral) инструментов они стали поддерживать несколько каналов (современные инструменты поддерживают все 16 каналов и могут иметь более одного MIDI-интерфейса), поэтому сейчас каждому каналу обычно назначается свой тембр, называемый по традиции инструментом, хотя возможна комбинация нескольких тембров в одном канале. Канал 10 по традиции используется для ударных инструментов - различные ноты в нем соответствуют различным ударным звукам фиксированной высоты; остальные каналы используются для мелодических инструментов, когда различные ноты, как обычно, соответствуют различной высоте тона одного и того же инструмента.

Поскольку MIDI-сообщения представляют собой поток данных в реальном времени, их кодировка разработана для облегчения синхронизации в случае потери соединения. Для этого первый байт каждого сообщения, называемый также байтом состояния (status byte), содержит "1" в старшем разряде, а все остальные байты содержат в нем "0" и называются байтами данных (data bytes). Если после получения всех байтов данных последнего сообщения на вход приемника поступает байт, не содержащий "1" в старшем разряде - это трактуется как повторение информационной части сообщения (подразумевается такой же первый байт). Такой метод передачи носит название "Running Status" и широко используется для уменьшения объема передаваемых данных - например, передается один байт команды "Controller Change" с нужным номером канала, а затем - серия байтов данных с номерами и значениями контроллеров для этого канала.

MIDI- сообщения делятся на канальные - относящиеся к конкретному каналу, и системные - относящиеся к системе в целом. Кодировка MIDI сообщений (шестнадцатеричная, n в первом байте обозначает номер канала).

Аппаратная спецификация MIDI

Интерфейс - старт-стопный последовательный "токовая петля" (активный передатчик, 5 мА, токовая посылка - 0, бестоковая - 1), скоростью передачи 31250 +/-1% бит/с и протоколом 8-N-1 (один стартовый бит, 8 битов данных, один бит стопа, без четности). Передатчики и приемники должны обеспечивать длительность фронтов менее 2 мкс.

Каждый инструмент имеет три соединительных разъема: In (вход), Out (выход) и Thru (копия сигнала с In через буфер). Все разъемы - типа female DIN-5 (СГ-5), вид с наружной стороны (стороны соединения):

Контакты 4 и 5 - сигнальные, контакт 2 - экран. Полярность сигналов дается относительно источника тока: контакт 4 - плюс (ток вытекает из вывода), контакт 5 - минус (ток втекает в вывод). Таким образом, для разъемов Out и Thru назначение то же, для разъема In - обратное. Для соединения используется двужильный экранированный кабель длиной до 50 футов (около 15 м). Экран необходим только для защиты от излучаемых помех - кабель практически нечувствителен к наводкам извне. Соединение разъемов на двух концах кабеля - прямое (2-2, 4-4, 5-5).

MIDI студия:

Применения MIDI

Основное применение MIDI - хранение и передача музыкальной информации. Это может быть управление электронными музыкальными инструментами в реальном времени, запись MIDI-потока, формируемого при игре исполнителя, на носитель данных с последующим редактированием и воспроизведением (так называемый MIDI-секвенсор), синхронизация различной аппаратуры (синтезаторы, ритм-машины, магнитофоны, блоки обработки звука, световая аппаратура, дымогенераторы и т.п.).

Устройства, предназначенные только для создания звука по MIDI- командам, не имеющие собственных исполнительских органов, называются тон-генераторами. Многие тон-генераторы имеют панель управления и индикации для установки основных режимов работы и наблюдения за ними, однако создание звука идет под управлением поступающих MIDI-команд.

Устройства, предназначенные только для формирования MIDI- сообщений, не содержащие средств синтеза звука, называются MIDI- контроллерами. Это может быть клавиатура, педаль, рукоятка с несколькими степенями свободы, ударная установка с датчиками способа и силы удара, а также - струнный или духовой инструмент с датчиками и анализаторами способов воздействия и приемов игры. Тон-генератор с достаточными возможностями по управлению может весьма точно воспроизвести оттенки звучания инструмента по сформированному контроллером MIDI-потоку.

Для хранения MIDI-партитур на носителях данных разработаны форматы SMF (Standard MIDI File - стандартный MIDI-файл) трех типов:

    0 - непосредственно MIDI-поток в том виде, в каком он передается по интерфейсу.

    1 - совокупность параллельных "дорожек", каждая из которых обыч- но представляет собой отдельную партию произведения, исполняемую на одном MIDI-канале.

    2 - совокупность нескольких произведений, каждое из которых сос- тоит из нескольких дорожек.

В основном применяется формат 1, позволяющий хранить одно произведение в файле.

Кроме MIDI-событий, файл содержит также "фиктивные события" (Meta Events), используемые только для оформления файла и не передаваемые по интерфейсу - информация о метрике и темпе, описание произведения, названия партий, слова песни и т.п.

Список использованной литературы

1. http://www.ixbt.com

2. http://www.MIDI.ru

3. http://ru.wikipedia.org

4. http://corpuscul.net/

5. http://audioproducer.625-net.ru/