Способы записи аудиоинформации
Министерство образования Республики Беларусь
Учреждение образования ” Гомельский Государственный университет имени Франциска Скорины”
Кафедра вычислительной математики и информатики
Реферат на тему:
«Способы записи аудиоинформации»
Выполнила: студентка группы М-52
Комендантова Е.В.
Принял: Орлов В.В.
Гомель 2002
Содержание
Введение
1. Природа звука
2. Восприятие звуковых раздражений
3. Частота, амплитуда, фаза - характеристики звука
4. Информация аналоговая, цифровая
4.1 Представление и способы передачи цифровой информации
5. Дискретизация звука
6. Способы записи информации
6.1 Бит в бит
6.2 Сжатие
6.3 Структура болванки CD-R
6.4 Запись CD-R
6.5 Запись CD-RW
Список используемых источников
Введение
Среди средств мультимедиа звук - явление особое. Вроде кошки, которая ухитряется существовать сама по себе наперекор всему. Текст и графика вроде бы неплохо сдружились друг с другом и постоянно идут рука об руку. Но при этом и часть своей самобытности потеряли - текст и графика сегодня редко встречаются по отдельности. В связке - другое дело, а вот порознь.
Звук, напротив, постоянно пребывает в одиночном плавании. А всё потому, что слишком жаден до внимания этот вид информации - всё на себя перетягивает. Звучит, к примеру, на странице Internet какая-нибудь мелодия - и вот уже и текст в голову не лезет, и картинки уже не так радуют глаз.
А с другой стороны, по этой же самой причине звук не прощает дилетантского подхода. Огрехи текста или картинки далеко не всякий разглядит. А вот фальшь, низкое качество созданной или обработанной нами композиции любой слушатель с не отдавленным русским медведем ухом в момент почувствует.
1. Природа звука
Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, шелест листьев и завывание ветра, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют, люди начали догадываться очень давно. Замечали, к примеру, что звук создают вибрирующие в воздухе тела. Ещё древнегреческий философ и учёный - энциклопедист Аристотель, исходя из наб- людений, верно объяснил природу звука, полагая, что звучащее тело создаёт попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то уплотняет, то разрежает воздух, а, благодаря упругости воздуха, эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны, достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.
Звук-это волны сжатия и расширения, распространяющиеся в воздухе или иной среде. Они распространяются во всех направлениях от источника звуковых колебаний. Когда волны достигают вашего уха, расположенные в нём чувствительные «элементы» воспринимают эти вибрации, и мы слышим звук.
2. Восприятие звуковых раздражений
Звуковые волны, проходя через наружный слуховой проход, вызывают колебания барабанной перепонки и передаются слуховым косточкам, а с них-на перепонку овального окна, ведущего в преддверие улитки. Возникшее колебание приводит в движение перилимфу (прозрачную жидкость в щелевидном пространстве между лабиринтом перепончатым и костным) и эндолимфу (полость перепончатого лабиринта) внутреннего уха и воспринимается волокнами основной перепонки, несущей на себе клетки кортиева органа (периферический конец слухового анализатора). Высокие звуки с большой частотой колебаний воспринимаются короткими волокнами, расположенными у основания улитки, и передаются волоскам клеток кортиева органа. При этом возбуждаются не все клетки, а только те, которые находятся на волокнах определённой длины. Следовательно, первичный анализ звуковых сигналов начинается уже в кортиевом органе, с которого возбуждение по волокнам слухового нерва передаётся в слуховой центр коры головного мозга в височной доле, где происходит их качественная оценка.
3. Частота, амплитуда - характеристики звука
Каждый звук характеризуется частотой (высотой звука), интенсивностью (громкостью). Частота-это количество звуковых колебаний в секунду; измеряется она в герцах (Гц). Чем больше частота, тем выше звук.
Человеческое ухо воспринимает не все частоты. Очень немногие слышат звуки с частотами ниже 16 Гц и выше 20 Гц. Частота звука самой низкой ноты на рояле равна 27 Гц, а самой высокой - чуть больше кГц. Наивысшая звуковая частота, которую могут передать вещательные ЧМ-радиостанций –15 кГц.
Громкость определяется амплитудой колебаний. Амплитуда звуковых колебаний зависит, в свою очередь, от мощности источника звука. Например, струна пианино при слабом ударе по клавише звучит тихо, поскольку размах её колебаний невелик. Если же ударить по клавише посильнее, размах колебаний струны увеличится. Громкость звука измеряется в децибелах (дБ). Шорох листьев имеет громкость около 20 дБ, обычный уличный шум-около 70, а близкий удар грома-до 120 дБ.
Важными параметрами являются частота квантования звуковых сигналов и раз рядность квантования. Частоты квантования показывают, сколько раз в секунду берутся выборки сигнала для преобразования в цифровой код. Обычно они лежат в пределах от 4–5 Кгц до 45–48 Кгц. Разрядность квантования характеризует число ступеней квантования и измеряется степенью числа 2.
Таблица 1
Частотный диапазон |
Вид сигнала |
Частота квантования |
400 – 3500 Гц |
Речь (едва разборчива) |
5.5 Кгц |
250 – 5500 Гц |
Речь (среднее качество) |
11.025 Кгц |
40 – 10000 Гц |
Качество звучания УКВ–приемника |
22.040 Кгц |
20 – 20000 Гц |
Звук высокого качества |
44.100 Кгц |
4. Информация аналоговая и цифровая
В природе информация распространяется в виде сигналов, а все сигналы, как известно, имеют энергетическую природу. Они могут быть сильнее или слабее, им свойственно явление затухания. Сигналы разной интенсивности несут разную информацию. Информацию такого рода называют аналоговой. Аналоговая информация непрерывна, и мы никогда не встретим два листа на дереве, имеющих одинаковый цвет, или два облака на небе, имеющих одинаковую форму.
В компьютерах информация представляется в виде данных, которые имеют другую природу. Аналоговые сигналы заменяются числовым представлением. Чем больше яркость зелёного цвета на фотографии, тем большим числом в памяти компьютера представляется этот сигнал. То же относится и к красному, и к синему, и к серому цвету. То же относится и к звукам и к другим видам сигналов. Информацию, представленную в такой форме, называют цифровой. Цифровая информация дискретна, поскольку для представления бесконечного многообразия цветов, звуков и форм используется вполне определённое и конечное количество чисел.
Представление аналоговой информации в цифровом виде называется аналого-цифровым преобразованием. Чем больше разных чисел используется для такого преобразования, тем выше дискретность цифровой информации и тем выше её точность, то есть тем ближе цифровая информация к аналоговой.
4.1 Представление и способы передачи цифровой информации
Представление информации в виде цифровых данных не случайно выбрано в качестве основополагающего принципа работы компьютера. У аналоговых сигналов слишком многое зависит от интенсивности, а она постепенно уменьшается в процессе затухания. Другое дело-цифровые данные. Здесь всё просто: сигнал либо есть, либо его нет.
Цифровые данные по проводнику передаются путём смены текущего напряжения: нет напряжения-"0",есть напряжение-"1". Существует два способа передачи информации по физически передающей среде: цифровой и аналоговый.
При цифровом (узкополосном способе передачи) данные.
Передаются в их естественном виде на единой частоте. Он позволяет передавать только цифровую информацию, обеспечивает в каждый данный момент времени возможность использования передающей среды только двумя пользователями и допускает нормальную работу только на ограниченные расстояния. В то же время узкополосной способ передачи обеспечивает высокую скорость обмена данными - до 10 Мбит/с и позволяет создавать легко конфигурируемые вычислительные сети. Подавляющее число локальных вычислительных сетей использует узкополосную передачу.
Аналоговый способ передачи цифровых данных обеспечивает широкополосную передачу за счёт использования в одном канале сигналов различных несущих частот.
При аналоговом способе передачи происходит управление параметрами сигнала несущей частоты для передачи по каналу связи цифровых данных. Сигнал несущей частоты представляет собой гармоническое колебание, описываемое уравнением:
X=Xmax*sin,
где Xmax -амплитуда колебаний; - частота; t -время; -начальная фаза колебаний.
Передать цифровые данные по аналоговому каналу можно, управляя одним из параметров сигнала несущей частоты: амплитудой, частотой или фазой. Так как необходимо передавать данные в двоичном виде, то можно предложить следующие способы управления: амплитудный, частотный, фазовый.
Амплитудная модуляция:"0"-отсутствие сигнала, то есть отсутствие колебаний несущей частоты;"1"-наличие сигнала, то есть наличие колебаний несущей частоты.
Частотная модуляция предусматривает передачу сигналов 0 и 1 на разной частоте. При переходе от 0 к 1 и от 1 к 0 происходит изменение сигнала несущей частоты.
Фазовая модуляция: при переходе от 0 к 1 и от 1 к 0 меняется фаза колебаний, то есть их направление.
5. Дискретизация
Процесс записи и воспроизводства звука в компьютере в самых общих чертах выглядит следующим образом.
В состав звуковой платы входит аналогово-цифровой преобразователь (АЦП или ADC-Analog-to-Digital Converter), который при записи преобразует аналоговые звуковые колебания в понятные компьютеру комбинации битов. Для таких цифровых сигналов компьютер используется либо просто в качестве магнитофона, либо как микшерский пульт, либо как целая студия звукозаписи. При воспроизведении цифро-аналоговый преобразователь превращает записанные и обработанные «цифровые» звуки в нечто слышимое.
Дискретизацией называется первый этап описанного процесса - преобразование исходных аналоговых звуковых сигналов в цифровые, которые можно сохранить, обработать и в последующем воспроизвести. При этом, естественно, сигнал не может быть преобразован целиком в цифровом виде сохраняются его отдельные «фотоснимки» (выборки или мгновенные значения сигнала в определённые моменты времени). Чем выше частота выборок, тем точнее «цифровая копия» звука соответствует оригиналу.
6. Способы записи аудиоинформации
Длительность звучания стандартного компакт-диска составляет 74 минуты. Структура информации на диске следующая. В начале диска располагается так называемая вводная зона. Здесь располагается различная специальная информация о формате диска, структуре и адресах звуковых фрагментов. За этой областью располагается небольшой зазор (около двух секунд) и начинается программная зона, содержащая в себе, собственно, звуковые данные. Выводная зона служит границей диска.
6.1 Бит в бит
Информацию на диск в данном случае записывается как есть, то есть её помещают на 74 минуты. В этом случае получаем большой размер файлов. На обычном компакт-диске, например, частота дискретизации аудио составляет-441000 Гц, а значение сигнала описано 16 битами. Таким образом, на описание одной секунды аудио в формате CD-DA тратится 176400 байт(172 Кбайт), одной минуты-10 Мбайт.
6.2 Сжатие
Применение сжатия позволяет уменьшить размеры файлов. Есть два типа сжатия-с потерями качества и без потерь качества. При упоминании о сжатии аудио подразумевается сжатие с потерями качества. Любое сжатие информации приводит к ухудшению её качества. Однако в процессе эволюции человеческий слух научился адаптироваться к некоторым видам помех, не замечая их присутствия в принимаемой аудиоинформации.
6.3 Структура болванки CD-R
Прежде чем начать описание форматов записи, необходимо обрисовать саму структуру записываемого диска, чтобы понять, какие процессы происходят при его записи. Итак, в структуре CD-R диска можно выделить четыре основных слоя (пятый - изображение, нанесенное на поверхность диска), наносимых поэтапно. Изначально изготавливается пластмассовая основа диска - поликарбонат (Е), которая составляет основную часть CD-R и придает ему необходимую прочность и форму. Далее, на готовую пластмассовую форму наносится активный слой (D) /dye/. Именно этот слой позволяет осуществлять запись на диск и определяет его надежность и качество считывания информации в дальнейшем. На сегодняшний день широко используется два типа активного слоя: цианин и фталоцианин. Цианиновый краситель обладает сине-зеленым (цвет "морской волны") или насыщенно синим оттенком рабочей поверхности, фталоцианин, в большинстве случаев, практически бесцветен, с бледным оттенком салатового или золотистого цвета. Цианиновый краситель более терпим к предельным сочетаниям мощности чтения/записи, чем "золотой" фталоцианиновый, поэтому зачастую диски на основе цианинового слоя проще считывать на некоторых дисководах. Фталоцианин - несколько более современная разработка. Диски на основе этого активного слоя менее чувствительны к солнечному свету и ультрафиолетовому излучению, что способствует увеличению долговечности записанной информации и несколько более надежному хранению в неблагоприятных условиях. После того, как на поликарбонатовую заготовку был нанесен dye, диск покрывается специальным слоем светоотражающего материала (C). В обычных CD-ROM для этой цели применяется алюминий, в CD-R дисках же применяется чистое серебро, позволяющее добиться 65-80%-го коэффициента отражения. Завершающим этапом изготовления диска является нанесение защитного слоя (В), на который в дальнейшем возможно нанесение изображений (А). Наиболее распространенным и простым в изготовлении защитным слоем является специальный лак.
В проигрывателе имеется электродвигатель со следящей систе, мой, обеспечивающей точное считывание дорожки лазерным лучом и неизменную линейную скорость считывания. Поэтому скорость вращения диска непостоянна и изменяется от 500 об. / мин. для внутренней части диска, с которой начинается считывание, до 200 об. / мин. для внешней. Специальный оптико-электронный блок имеет устройства для стабилизации излучения лазера, автоматической фокусировки, слежения за дорожкой при биении диска и выбора треков диска для считывания.
Для считывания информации с CD–ROM используется полупроводниковый диод с фокусирующей и следящей оптической системой. Внутренняя поверхность диска, на которую кладут диск на подставку (в кассету) дисковода, находится не в фокусе оптической системы лазерного излучателя. Диаметр светового пятна от лазера, создающего сходящийся конус света, порядка 1 мм. Поэтому умеренные загрязнения нерабочей поверхности, например, пылинки на ней, отпечатки пальцев и даже небольшие царапины практически не влияют на воспроизведение.
6.4 Запись CD-R
На СD-R информация записывается при помощи CD рекодера. Энергия луча лазера поглощается органическим красителем болванки, вследствие чего он меняет свою отражательную способность. Иногда этот процесс называют "прожигом", что на самом деле не совсем точно отражает процесс формирования "питов" - участков слоя с ухудшенной прозрачностью. Считываются такие болванки немного хуже, чем обычные CD-ROM диски, из-за наличия дополнительного слоя, уменьшающего коэффициент отражения. Большое значение имеет и качество формирования "питов" на диске, что зависит как от свойств органического красителя, так и от самого CD рекордера. Когда лазерный луч высокой интенсивности фокусируется на этом слое, цвет красителя меняется, что, в свою очередь, ведет к изменению отражающей способности данной точки. Под воздействием луча стандартного лазера CD-ROM - с меньшей мощностью, чем записывающий луч CD-R, - изменившие цвет точки отражают меньше света, и это позволяет накопителю распознавать записанные данные. Процесс изменения цвета слоя красителя необратим, поэтому диски CD-R допускают только однократную запись. (Строго говоря, писать на CD-R можно и в несколько сеансов, но всякий раз начинать запись нужно на новом участке диска).
6.5 Запись CD-RW
CD-RW, стандарт перезаписываемых CD-дисков, - это сокращение от CD-Rewritable, т.е. перезаписываемый CD. Разница между CD-RW и CD-R заключается в том, что диски CD-RW могут быть стерты и повторно записаны, в то время как на дисках CD-R возможна только однократная запись. В остальном, они используются так же, как и диски CD-R. Технология записи информации на CD-RW диски немного отличается от CD-R. Приводы CD-RW используют технологию изменения фазы. Вместо создания "пузырьков" и деформаций записываемого слоя красителя используется тонкого слоя материала, отражающая способность которого меняется при внешних воздействиях. Под влиянием лазерного луча умеренной мощности, которая называется мощностью записи (write power), этот слой нагревается, а при остывании его материал кристаллизуется. При нагревании лучом большей мощности (мощность стирания, или erase power) происходит переход материала в аморфное состояние. В кристаллическом состоянии слой лучше отражает свет, и накопитель получает возможность считывать данные. Для считывания данных в накопителях CD-RW используется лазерный луч, мощность которого (мощность чтения, или read power) меньше, чем у записывающих и стирающих лучей.
Список используемых источников
1. Новейший самоучитель работы на компьютере под редакцией С. Симоновича, Москва, 1999, 656 с.
2. Новейшая энциклопедия персонального компьютера 2000 Москва, «Олма-Пресс», 2000, 848 с.
3. Скотт Мюллер «Модернизация и ремонт персонального компьютера» - Москва, Бином, 1997, 886 с.
4. Популярная медицинская энциклопедия главный редактор Б.В. Петровский-Москва,"Советская энциклопедия", 1984, 704 с.
5. Энциклопедический словарь юного физика-Москва, 1984, 352 с.
6. Н.Е. Ковалёв, Л.Д. Шевчук, О.И. Щуренко Биология для подготовительных отделений медицинских институтов-Москва, "Высшая школа", 1986, 384 с.
7. Кинтуель Т. "Руководство программиста по работе со звуком": Перевод с англ. - Москва: ДМК, 2000.
8. Секунов Н.Ю. "Обработка звука на РС: Наиболее полное руководство в подлиннике ". - Санкт-Петербург, 2001.