Немного о форматах. MP3 / MP3 Pro.
Для начала разберемся, какие преимущества есть у mp3 кодера и его разновидности – mp3 pro.Разделим процесс сжатия на 3 этапа:
1. Быстрое преобразование исходного сигнала (фрейма) по методу Фурье (FFT). FFT – это процесс, представляющий исходный сигнал в виде суммы синусоид. Поэтому вместо того чтобы хранить волны в каждом сэмпле, остаётся запомнить только значение амплитуд (Ai) и длин волн (li). Обратное преобразование невозможно, сигнал можно восстановить только приближенно, с потерями.
2. Психоакустическая обработка, задачей которой является выбрать и вырезать из звукового потока информацию, не воспринимаемую человеческим ухом. Вот, тут-то и начинаются самые сложные вычисления, не щадящие качество звучания: в отличие от зрительного восприятия слух намного чувствительнее к различным искажениям и неточностям.
3. Применение математических алгоритмов сжатия. Во время этой операции происходят только числовые преобразования, позволяющие представить конечную информацию в более компактном виде. Преобразования Фурье известны давно и ими не ограничиваются разработчики «кодеров» (программ для сжатия музыки), поэтому появляются новые методики сжатия сигнала за счёт усовершенствования психоакустической модели кодирования. Эти методы основываются на особенностях восприятия звука человеком. Так если сначала подать громкий звук на частоте 800 Гц, то более тихий звук на частоте 1000 Гц уже не будет фиксироваться слухом. Также в модели используется явление снижения чувствительности на период 5-100 миллисекунд после возникновения резкого звука, например взрыва или выстрела.
У mp3 есть ряд неоспоримых преимуществ перед другими форматами - много настроек компрессии, в том числе применение переменного битрейта (variable bit rate), удобные тэги (tags), большое количество плееров воспроизводящих музыку в формате mp3, возможность воспроизводить в потоковом режиме.
В июле 2001 года компанией Coding Technologies вместе с Thomson Multimedia и институтом Fraunhofer, был выпущен кодек MP3Pro, как более мощное развитие старого mp3. Файлы, закодированные кодеком MP3Pro, можно воспроизводить по-прежнему в проигрывателях поддерживающие mp3, но качество при этом заметно хуже. Заметно чувствуется недостаток верхних частот, если не использовать специальный плеер. Это объясняется тем, что файлы MP3Pro имеют два звуковых потока, один из которых и воспроизводят обычные плееры, т.е. – MPEG-1 layer 3. Дело в том, что в MP3Pro используется новая технология – SBR (Spectral Band Replication), предназначенная для более эффективной компрессии и более качественной передачи верхнего частотного диапазона. Как уже было сказано выше, MP3Pro состоит из двух частей, первая с узким диапазоном частот – до 10 Кгц, а вторая с высокими частотами. Настройки MP3Pro более скромные, чем у его предшественника, кодировать файлы можно только до 96 kbps/Joint Stereo. Таким образом, добивается отличное сочетание объём / качество, даже при таком низком битрейте.
VBR и CBR.
При использовании CBR (Constant Bitrate) всем блокам назначается одинаковый объём (Bitrate). Из этого следует, то что, чем сложнее звуковой материал, тем менее качественно он будет звучать. При VBR (Variable Bitrate) каждому отдельному блоку задаётся свой размер. Битрейт, оптимально подходящий для кодирования данного участка композиции (фрейма), кодер выбирает самостоятельно на основе анализа сложности сигнала в каждом отдельном фрейме. Теоретически при таком достоинстве должен получиться mp3 файл с максимально оптимальным размером, но психоакустическая модель кодека не идеальна, и зачастую сложные блоки, требующие большего битрейта, его не получают.
Joint Stereo (совмещённое стерео).
Это алгоритм, позволяющий на основе сигнала одного аудиоканала и частичной информации о втором воссоздать исходный стереосигнал. При этом кодируется лишь общая составляющая каналов, а стерео на высоких частотах искусственно синтезируется путём умножения общего сигнала на известные значения мощности частотных участков. Это чем-то схоже с алгоритмом сжатия zip / rar, т.к. почти вдвое уменьшается объём, необходимый для записи аудио трека. Но, к сожалению, полное восстановление исходного стерео сигнала таким методом невозможно – при синтезе неизбежны ошибки, поэтому такой способ лучше использовать в простых, мало-инструментальных композициях или в фильмах.
OGG Vorbis.
Бесспорным плюсом OGG Vorbis, одного из наиболее перспективных форматов для компрессии аудиоданных, является то, что он изначально полностью открыт и бесплатен. Опубликована полная спецификация метода и формата, регулярно освещаются изменения и дополнения. Кодек поддерживает частоту дискретизации до 48 Кгц, скорость потока до 512 Кбит/с, до 255 каналов, позволяет хранить в файле вместе с композицией текстовую и графическую информацию. Звук в любом случае кодируется с переменным битрейтом (VBR). В методе кодирования используется оригинальное представление стереофонического источника звука в виде его точечного центра и «ширины». Это позволяет кодировать стереоканалы не по одному, а вместе. Поскольку в большинстве композиций каналы взаимозависимы, это оптимизирует размер получаемого файла. В целом метод обеспечивает сжатие на 20-50% лучше, чем MP3 при более высоких субъективных оценках качества. Гибкий переменный битрейт хорошо справляется со своей работой – звук получается не таким смазанным, как у других форматов, чувствуется «прозрачность» даже на ~70 Кбит/с.
Nero Digital Audio (Advanced Audio Codec).
Интересный кодек, но очень редкий. Битрейт может быть как постоянный, так и переменный до 448 Kbit. Существует несколько разновидностей кодека, к примеру, версия от Ahead Nero. Advanced Audio Codec - это разработка института Фраунгофера, создателя формата MP3, в содружестве с несколькими сторонними фирмами. В AAC изначально заложена поддержка частоты дискретизации до 96 Кгц, а максимальное количество каналов увеличено с двух до 48 в расчёте на будущие многоканальные форматы вроде шестиканального Dolby Digital. За счёт использования более сложных алгоритмов психоакустического анализа кодеры работают значительно медленнее, чем в случае с MP3, а проигрыватели также требуют большей мощности процессора. Важной особенностью AAC является так называемые водяные знаки (watermarks) – возможность вносить в аудиофайл различную информацию - имя автора, название трека и прочее, которую невозможно удалить.