Андрей Смирнов
Время чтения: ~23 мин.
Просмотров: 0

Файлы aac

Особенности кодирования

Принцип работы технологии SBR. Создание высокочастотного диапазона с помощью транспозиции (слева). Восстановление высокочастотного диапазона (справа).

Технологии AAC, SBR и Parametric Stereo являются основными компонентами профиля MPEG-4 HE-AAC v2.

  • Кодек AAC используется для кодирования диапазона низких и средних частот.
  • В основе технологии восстановления высоких частот (SBR) лежит выявленная строгая взаимосвязь между характеристиками высокочастотного и низкочастотного диапазонов звукового сигнала. Таким образом, весьма адекватного восстановления высокочастотного диапазона оригинального звукового сигнала можно достигнуть транспозицией (сдвигом) из низкочастотной области в высокочастотную. Перед кодированием осуществляется анализ диапазона высоких частот (выше 7 кГц) в исходном цифровом аудиосигнале и извлекается информация о некоторых его параметрах: например, спектральной огибающей входного сигнала. Затем, после устранения лишних высокочастотных составляющих, на кодер передается небольшой поток данных об устранённых высоких частотах, необходимых для их восстановления, а кодируются только оставшиеся низкие и средние частоты.
  • Параметрическое кодирование стереопанорамы, т.е метод повышающий эффективность кодирования стереосигналов при передаче звуковых данных с низким битрейтом. Входной стереосигнал микшируется в моносигнал, при этом выполняется анализ параметров, описывающих стереопанораму. Стерео параметры требуют незначительную часть (2-3 кбит/с) суммарного выходного потока, необходимого для передачи моносигнала приемлемого качества. Два параметра, используемые для описания стерео информации — панорамы и окружения. Параметр панорамы содержит информацию различия между правым и левым каналов в разных частотных полосах. Аналогично и параметр окружения описывает стереоокружение для группы частотных полос. Для кодирования обоих параметров применяется схожие принципы статистического кодирования в частотно-временной области, применяемые и для SBR-огибающих. Также применяется квантование.

Версии

Сравнение версий кодеков HE-AAC:

Версия Основной товарный знак Особенности кодека Стандарт
HE-AAC v1 aacPlus v1, eAAC, AAC+, CT-aacPlus AAC LC + SBR ISO/IEC 14496-3:2001/Amd 1:2003
HE-AAC v2 aacPlus v2, eAAC+, AAC++, Enhanced AAC+ AAC LC + SBR + PS ISO/IEC 14496-3:2005/Amd 2:2006

AC3 в AAC – лучший конвертер AC3 в AAC для преобразования AC3 в AAC

Я хочу, чтобы этот фильм имел маленький размер, похожий на те, что были найдены на торрент-сайтах. Убедитесь, что вы используете последнюю версию FFmpeg. Для Windows и Linux статические сборки доступны на главной странице. Для управления качеством видео установите параметр crf , который по умолчанию равен Нижний означает лучшее качество, но более высокий размер файла. Попробуйте значения от 19 до 26, чтобы узнать, что лучше всего подходит. Вы также можете установить определенную скорость передачи данных в зависимости от того, какой размер файла вы хотите.

Если ваш аудиопоток использует несколько каналов например, звук 5. Если ваш входной файл имеет несколько потоков видео, аудио и субтитров, ffmpeg по умолчанию не преобразует их всех.

Используйте -map 0 , чтобы проинструктировать ffmpeg, чтобы взять все потоки из входного файла см. FFmpeg Wiki для получения дополнительной информации. Это полезно для сохранения разных языков и субтитров, которые могут быть в оригинале

Обратите внимание, что mkvdts2ac3. Вы увидите их при запуске скрипта

Если вы предпочитаете графический интерфейс вместо команд, я описал, как это сделать: Конвертировать неподдерживаемый звук из видео.

Если это 5. Вы можете скомпенсировать это с помощью фильтра dolby-II, чтобы получить канал объемного звучания вниз, а центральный канал разбит на стерео и объединить их в правый и левый стерео каналы. Toggle navigation. Ubuntu Geeks. Тогда в простейшем случае run: ffmpeg -i input.

Многоканальный звук Если ваш аудиопоток использует несколько каналов например, звук 5. MKV – это просто контейнер. Вы можете иметь видео mpeg-4 внутри контейнера. Мое предложение следующее: нажмите файл в контейнер.

Вы можете сделать это: ffmpeg -i input. Настройка специальных привязок основного режима в emacs Как интернет действительно работает?

Выберите один или несколько файлов на компьютере

Сервис позволяет произвести преобразование (конвертировать) из формата AAC в формат AC3

AAC – это формат звуковых кодированных файлов, который разработан Fraunhofer IIS, AT&T, Dolby и Sony. Его название расшифровывается как аббревиатура от Advanced Audio Coding. Формат AAC является промышленным стандартом и создавался как улучшенная альтернатива самому распространенному формату звуковых файлов MP3. Файлы AAC действительно обладают несколько улучшенными характеристиками по сравнению с MP3. Скажем, этот формат предоставляет возможность улучшенной обработки частот свыше 16 kHz. При этом качество звучания у AAC-файлов более близкое к оригинальным звуковым исходникам.

AC3 – это формат звуковых файлов. Его название – это аббревиатура от Audio Codec 3. Формат разработан Dolby Laboratories, Inc в качестве современной и эффективной технологии сжатия звука. AC3-файлы отличаются многоканальным объемным звуком Dolby Digital. В связи с этим они широко распространены в качестве формата для DVD, кинотеатров и игровых консолей. Однако оценить все преимущества таких файлов можно лишь при наличии соответствующей акустики для объемного звука. Аудиофайл указанного формата может включать в себя до шести звуковых каналов, что создает у слушателя эффект присутствия.

Advanced Audio Coding (AAC) — собственнический (патентованный) формат аудиофайла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах.

Также AAC — это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является одним из наиболее качественных, использующих сжатие с потерями, поддерживаемый большинством современного оборудования, в том числе портативного.

Dolby Digital (AC-3, ATSC A/52) (До́лби Ди́джитал) — система пространственного звуковоспроизведения, разработанная фирмой «Dolby Laboratories, Inc.» («Dolby Labs»), руководимой Реем Долби, пионером аудио- и видеопромышленности.

Формат стандартизирован Advanced Television Systems Committee, ему присвоен код A/52, Dolby Digital (DD) является торговой маркой.

Современные системы Dolby Digital предоставляют шесть каналов объёмного цифрового звука. Левый, центральный и правый фронтальные каналы позволяют точно определить позицию источника звука на экране. Отдельные «разделённые» левый и правый задние боковые каналы усиливают ощущение присутствия, создавая объём. А дополнительный низкочастотный канал добавляет накал действию на экране.

Знакомство с MP3

Функционал MP3 представляет собой закодированную на звуковых дорожках аудиоинформацию. Инженеры Германии создали и получили лицензию на такое хранение файлов, норматив приобрел популярность во всем мире.

По факту принцип работы обманывает слух. Исследования доказали, что человек сможет воспринимать новые импульсы, если превысить порог слышимости. Когда звуки накладываются друг на друга, одни поглощают другие. Создатели MP3 неслышимое звучание убрали из общего фона. Сигнал полученный в результате, кодируют методом Хофмана.

Сжатия оригинальных импульсов не подвергались стандартизации. Программисты разрабатывают по-своему схемы для файлов. Стандарту подчинены декодерные устройства, отчего степень звучания не зависит от аппаратуры. Реализаторы кодера устанавливают сжатие по пристрастиям, с ними наиболее четко справляется размер для слушателей:

  • Симфоний.
  • Рока.
  • Репа или поп музыки.

Популярность технология получила благодаря:

  1. Малому объему.
  2. Терпимыми потерями.
  3. Повсеместной распространенностью.
  4. Поддержкой устройств.

Отрицательные моменты:

  • На частоте выше 18 кГц, даже при хороших наушниках слышимость ухудшается.
  • Звучание по качеству уступает новым разработкам.

MP3 принадлежит к первым аудиоформатам. Они в свое время заполнили рынок большим количеством композиций, которые перевели на данный уровень.

Вместо заключения:

Как мы видим, сейчас тенденция такова что aac стремится заменить mp3, и это хорошо видно из таблицы. А в OGG из крупных радиостанций вообще никто не вещает. Стоит ли ограничиться одним потоком – решать вам. Но я считаю, что своих слушателей нужно уважать, и тип подключения к интернету у человека может быть совсем разный (к тому же, у радиостанции может быть мобильное приложение, где важен низкоскоростной поток). По этому можно остановиться следующих вариантах:

aac+ 24 kb/s (10,5 Мб в час) – экстремально низкий поток для мобильных пользователей aac+ 96 kb/s (42,1 Мб в час) – качественный поток с довольно низким битрейтом mp3 192 kb/s (84,3 Мб в час) – для проигрывателей неподдерживающих aac, или устройств обладающими качественным процессором, но нужно высокая скорость интернет-соединения.

А для людей которых кодирование звука заинтересовала ещё более, то можно почитать пару статей о кодировании и дискретизации:Наиболее распространенные заблуждения на тему цифрового звукаПонятно о кодировании аудио

К этой статье, как всегда приветствуются комментарии о добавлении какой то ценной информации или слова благодарности 🙂

MP3: лавинообразные искажения

Начинаем с самого популярного формата. МР3 — чудовище из института Фраунгофера, которое захватило Землю. Из-за него сегодня никому не приходит в голову использовать чистый WAV для записи звуков. Даже если выдирают изуродованное аудио из YouTube, то все равно крошат его еще раз в МР3, да еще и с похабным битрейтом 128 кб/с. Мы так делать не будем, и для теста используем самую актуальную на сегодня версию кодера LAME 3.100 с пресетом insane и битрейтом 320 кб/с.

На самом первом рисунке было видно, что спектр в МР3 ожидаемо испытывает колебания в области ВЧ и окончательно отфильтровывается на границе 20 кГц. Разумеется, это предел синтетического теста, на реальном музыкальном сигнале она наверняка окажется еще ниже. Размеры динамического диапазона в МР3-файле не изменились по сравнению с оригиналом. Т.е. кодер LAME 3.100 на битрейте 320 кб/с не добавляет в запись никаких собственных шумов.

Искажения формы сигнала 1 кГц при кодировании в МР3 в сравнении с оригиналом WAV

Конвертация в МР3 одиночного сигнала 1 кГц показала появление множества мелких гармонических искажений. И хотя формально их доля невелика (0,0009%) — т.е. раза в полтора-два меньше, чем на выхлопе у хорошего ЦАПа, — в динамичном спектре реальной фонограммы их число будет расти в лавинообразном и непредсказуемом порядке. Также «утолщение» основания узкого в оригинале пика 1 кГц указывает на определенные проблемы, обрастание паразитными колебаниями. Эту особенность наглядно иллюстрирует «квадратная» 100 Гц волна после ее конвертации в МР3. Как видите, по горизонтальной оси ее контур теряет четкость. Все это в конечном итоге отрицательно сказывается на утомляемости слуха при прослушивании МР3, увы, даже самых максимальных битрейтов.

«Квадратная» волна 100 Гц после конвертации в МР3 (вверху) и AAC (внизу)

Расширения файлов

  • .m4a — незащищённый файл AAC
  • .m4b — файл AAC, поддерживающий закладки. Используется для аудиокниг и подкастов.
  • .m4p — защищённый файл AAC. Используется для защиты файла от копирования при легальной загрузке собственнической музыки в онлайн-магазинах, подобных iTunes Store
Аудиокодеки
ISO/IECMPEG
Другие
Стандарты и форматы сжатия медиаданных
Сжатие видео
ISO/IEC MJPEG • JPEG 2000 • MPEG-1 • MPEG-2 • MPEG-4 • MPEG-4 AVC
ITU-T H.120 • H.261 • H.262 • H.263 • H.264 • H.265
Другие AMV • AVS • Bink • Dirac • Indeo • Pixlet • RealVideo • RTVideo • SheerVideo • Smacker • Snow • Theora • VC-1 • VP6 • VP7 • VP8 • WMV

Сжатие звука

ISO/IEC
MP3 (MPEG-1 Layer III) • MPEG-1 Layer II • MPEG-1 Layer I • AAC • HE-AAC

ITU-T
G.711 • G.718 • G.719 • G.722 • G.722.1 • G.722.2 • G.723 • G.723.1 • G.726 • G.728 • G.729 • G.729.1 • G.729A

Другие
Dolby Digital (AC3) • AMR • Apple Lossless • ATRAC • DTS • FLAC • iLBC • MLP • Monkey’s Audio • μ-law • Musepack • Nellymoser • OptimFROG • RealAudio • RTAudio • SHN • Siren • Speex • Sub-band coding • Vorbis • WavPack • WMA • TAK • MT9 • TTA (True Audio>

Сжатие изображений

ISO/IEC/ITU-T
JPEG • JPEG 2000 • Lossless JPEG • JBIG • JBIG2 • PNG • WBMP

Другие
APNG • BMP • GIF • DjVu • ICER • ILBM • PCX • PGF • TGA • TIFF • JPEG XR / HD Photo • PSD

Медиа- контейнеры

Основные
3gp • ASF • AVI • Bink • DMF • DPX • EVO • FLV • Matroska (MKV) • MPEG-PS • MPEG-TS • MP4 • MXF • NUT • Ogg • Ogg Media • QuickTime • RealMedia • Smacker • RIFF • VOB

Только звук
AIFF • AU • WAV

См. также: Методы сжатия • Программы для сжатия данных

Wikimedia Foundation . 2010 .

Смотреть что такое «AAC» в других словарях:

Aac — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. <<>> Sigles d une seule lettre Sigles de deux lettres > Sigles de trois lettres … Wikipédia en Français

AAC — (MPEG 2 AAC), im Standard MPEG 2 (MPEG) enthaltenes Audioformat. Im Ggs. zu MPEG 2 Multichannel ist AAC nicht abwärts, d. h. zu MPEG 1 kompatibel und wird daher auch als MPEG 2 … Universal-Lexikon

AAC — may refer to:In aviation:* IATA airport code for El Arish International Airport, Egypt * Advanced Aircraft Corporation, an aircraft manufacturer based in Carlsbad, California * American Aviation Corporation, an aircraft manufacturer based in… … Wikipedia

AAC — se puede referir a: El formato de codificación de audio Advanced Audio Coding. La Associação Académica de Coimbra, Asociación académica de Coimbra. La Autor >Wikipedia Español

AAC+ — Vorlage:Infobox Dateiformat/Wartung/mime fehltVorlage:Infobox Dateiformat/Wartung/magic fehltVorlage:Infobox Dateiformat/Wartung/website fehlt High Efficiency Advanced Audio Coding Dateiendung .aac, .3gp, .mp4, .m4a, .m4p Entwickelt von MPEG … Deutsch Wikipedia

.aac — Advanced Audio Coding Pour les articles homonymes, voir AAC. Advanced Audio Coding (AAC) est un algorithme de compression audio avec perte de données ayant pour but d’offrir un meilleur rapport qualité/débit binaire que le format plus ancien MPEG … Wikipédia en Français

AAC+ — Advanced Audio Coding Pour les articles homonymes, voir AAC. Advanced Audio Coding (AAC) est un algorithme de compression audio avec perte de données ayant pour but d’offrir un meilleur rapport qualité/débit binaire que le format plus ancien MPEG … Wikipédia en Français

AAC-LD — The MPEG 4 Low Delay Audio Coder (aka AAC Low Delay, or AAC LD) is designed to combine the advantages of perceptual audio coding with the low delay necessary for two way communication. It is closely derived from the MPEG 2 Advanced Audio Coding… … Wikipedia

AAC — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Sigles d’une seule lettre Sigles de deux lettres > Sigles de trois lettres Sigles de quatre lettres … Wikipédia en Français

Promotion aspects

Commercial trademarks and labeling

AAC-HE is marketed under the trademark aacPlus by Coding Technologies and under the trademark Nero Digital by Nero AG. Sony Ericsson, Nokia and Samsung use AAC+ to label support for AAC-HE v1 and eAAC+ to label support for AAC-HE v2 on their phones. Motorola uses AAC+ to indicate AAC-HE v1 and «AAC+ Enhanced» to indicate AAC-HE v2.[citation needed]

Licensing and patents

Companies holding patents for AAC-HE have formed a patent pool administered by Via Licensing Corporation to provide a single point of license for product makers.

Patent licenses are required for end-product companies that make hardware or software products that include AAC-HE encoders and/or decoders. Unlike the MP3 format before April 23, 2017, content owners are not required to pay license fees to distribute content in AAC-HE.

AAC: поднять шум, но сохранить чистоту

Более аккуратным образом действует алгоритм ААС, которым активно оперирует Apple, да и не только он. С данным аудиокодеком работают цифровые ТВ-бродкастеры, а кроме того, ААС входит в пакет контейнера MPEG-4.

Квадратная волна после конвертации в ААС сохраняет свою форму, хотя искажения основания и гармоники вокруг пика 1 кГц тоже имели место, хотя и менее заметно, чем в МР3. При этом ААС демонстрирует больший на 1 дБ измеренный уровень шума. Что бы это значило — промежуточная запись на кассету, что ли? Нет, наверняка в алгоритме ААС используется что-то вроде нойзшейпинга — великое изобретение, позволяющее снижать ошибки квантования за счет подмешивания псевдослучайного шумового сигнала. Повторюсь, это не просто утопление искажений ниже шумового порога — здесь применяется более изощренная математика.

Для иллюстрации посмотрим артефакты вокруг так называемого джиттер-теста на частоте 11,025 кГц. Почему именно эта частота? Потому что кратная гармоника к этому пику приходится ровно на верхнюю границу спектра из цифрового потока с дискретизацией 44 кГц, а все остальные будут находиться за его пределами. Паразитные маленькие пики, особенно те, которые располагаются симметрично относительно основного тона (продукты модуляции, «боковые полосы») — вот это и есть зерна джиттера.

Устойчивость в джиттер-тесте ААС (вверху) и МР3 (внизу)

Как видим, дурак-МР3 сберег низкий уровень шума, но сгенерировал больше высокочастотного джиттера (наиболее заметного на слух), а AAC немного поднял шум, зато избежал паразитов на остальных участках спектра. Но еще большие фокусы с нойзшепингом вытворяет кодер WavPack.

Какой формат лучше

Перед решением любой задачи граждане определяются с поставленной целью.

Кодек тоже выбирают с определения важности по:

  • Совместимости.
  • Качеству.
  • Поддержке конкретного мобильного устройства.

Оценивают процесс из личной практики на основании обособленных потребностей. Если пользователь не соприкасался с цифровой музыкой, формат имеет существенное значение, ему предстоит ответить на вопросы:

  1. Насколько подходит для плеера.
  2. Как с устройства читается информация.
  3. Что предстоит делать с файлом.

По совместимости MP3 самый приемлемый вариант, его «понимает» любая техника, при условии, что владелец не прислушивается к уровню качества.

Для любителей чистоты и натуральности в звучании приёмника, можно остановиться на любом новом методе. Недостатка в разработках не ожидается, создатели выводят их на торговые площадки с постоянной периодичностью. Нужно своевременно оценивать и осваивать новинки, чтобы слушать не только музыкальное произведение, а вникать в слова, оформление.

1. Частотный диапазон AAC

AAC сжимает аудио с потерями: «лишние» частоты отсекаются, сигнал выравнивается (добавляются «перекрывающие» блоки информации), корректируются ошибки. Примерно по такому же принципу работают все lossy кодеки (кодеки для сжатия с потерями).

Потери в основном выражаются в урезанном частотном диапазоне: обычно верхняя граница ВЧ. Кроме того, из-за выравнивания сигнала могут добавляться (и чаще всего добавляются) искажения, которые могут быть в любой области диапазона.

Посмотрим, как работает AAC (источник – lossless аудио-файл) в сравнении с SBC на некоторых Android-смартфонах и iPhone:

Полный частотный диапазон с использованием AAC и SBC кодеков

Сразу видны серьёзные отличия в реализации AAC на разных смартфонах. Стоит учитывать несколько моментов:

  • человек теоретически может слышать звуки в районе 20 Гц – 20 кГц;
  • бОльшая часть «материала» в музыке находится ниже 16-18 кГц;
  • с возрастом мы хуже воспринимаем ВЧ (до 16-17 кГц в среднем после 30 лет)

Рассмотрим край ВЧ-диапазона покрупнее:

Как видно, AAC на Huawei P20 Pro «срезает» ВЧ очень рано: около 14 кГЦ. Эти частоты слышат даже совсем немолодые люди, если не было проблем со слухом. Samsung Galaxy Note 8 (через AAC) ограничивает верхний порог до 17 кГц. Но iPhone 7 справляется лучше: около 19 кГЦ.

Особенно интересен этот разброс результатов в сравнении с работой SBC-кодека на тех же Android-смартфонах. Верхние границы диапазона на всех «подопытных» выше, хоть и с бОльшими искажениями. Но главное, что они очень похожи: то есть кодек SBC работает более-мене одинаково на разных телефонах.

Форматы хранения данных без сжатия: FLAC, ALAC, WAV и другие

  • WAV и AIFF: Оба WAV и AIFF хранят звук без сжатия, что означает, что они являются точными копиями исходного аудио. Эти два формата по существу имеют одинаковое качество; Они просто хранят данные немного по-другому. AIFF сделан Apple, поэтому вы можете увидеть его чаще в продуктах Apple, а WAV в значительной степени универсален. Однако, поскольку они несжаты, они занимают много ненужного пространства. Если вы не редактируете аудио, вам не нужно хранить аудио в этих форматах.
  • FLAC: Free Lossless Audio Codec (FLAC) — самый популярный формат хранения звука без потерь, что делает его хорошим выбором. В отличие от WAV и AIFF, он немного сжимает данные, поэтому занимает меньше места. Тем не менее, он считается форматом, который хранит звук без потерь, качество музыки остается таким же, как и у оригинального источника, поэтому эффективнее использовать его, чем WAV и AIFF. Он бесплатный, с открытым исходным кодом.
  • Apple Lossless: Также известный как ALAC, Apple Lossless похож на FLAC. Это формат с лёгкой компрессией, тем не менее, музыка сохраниться без потерь качества. Его сжатие не так эффективно, как FLAC, поэтому ваши файлы могут быть немного больше, но они полностью поддерживаются iTunes и iOS (в то время как FLAC — нет). Таким образом, если вы используете iTunes и iOS в качестве основного программного обеспечения для прослушивания музыки, вам придется использовать именно этот формат.
  • APE: APE — имеет самый агрессивный алгоритм сжатия, для хранения музыки без потерь, то есть вы получите максимальную экономию места. Его качество звука такое же, как у FLAC, ALAC, однако часто возникают проблемы с совместимостью. Кроме того, проигрывание этого формата гораздо сильнее нагружает процессор для его декодирования, так как данные сильно сжаты. Вообще, я бы не рекомендовал использовать этот формат, если только вы не ограничены в свободной памяти и не имеете проблем совместимости с программным обеспечением.

Что общего между ними

Общий фактор между ACC и MP3 – это сжатие файлов для экономии производственных участков, отчего происходит ухудшение звуков.

Человек может слушать музыку с аналогово или цифрового носителя.

Если аналог характеризуется как продукт:

  1. Недолговечный.
  2. Неудобный.
  3. Ушедший в прошлое.

Для цифры характерна передача звукового сигнала в рамках:

  • Не использующих сжатие.
  • lossless – со сжатием файлов, сохраняющем качественный звук.
  • lossy – качество теряется из-за экономии места на сжатом файле.

Первый способ перспективен, чтобы хранить записи мастеров, создающих аудио контент для легкого восстановления. Для любительских фонотек такое хранение не имеет смысла.

Пользователи цифровых инструментов должны обратить внимание на параметры:

  1. Оцифровку аналоговых сигналов по частоте – дискретизацию.
  2. Амплитуду или точность разрядности на громкость.
  3. Битрейт – сколько данных содержит файл в расчете на время прослушивания.

Ученые, инженеры, создавая сжатый звук в психоакустических моделях, рассматривали восприятие его слуховыми органами человека. В уши поступают акустические волны, но дальше сигнал переходит на обработку мозга. К примеру, субъект слышит в диапазоне 18 кГц., а сразу слушать и сознавать, поступающую информацию он не может. Разработчики исследовали человеческие возможности и создают аппаратуру с максимальным удобством по всем показателям.

Сравнение звуковых форматов AAC и МР3

Aac или ac3 что лучше

Если не lossless, то кот? MP3, AAC — что еще? Ранее мы уже несколько раз изучали алгоритмы сжатия музыки, настало время сравнить самых достойных.

Your IP address will be recorded. Log in No account? Create an account. Remember me. Facebook Twitter Google.

Первые идеи об использовании психоакустической маскировки для компрессии аудиоданных относятся к году. Однако соответствующие аудиокодеры начали получать широкое распространение лишь с середины х годов, когда вычислительных мощностей персональных компьютеров стало хватать для воспроизведения сжатого аудио в реальном времени и появился стандарт MPEG-1 Audio Layer 3, более известный как МР3. С основными принципами формата МР3 можно познакомиться в статьях К. Основными отличиями от стандарта МР3 стали:. Благодаря этим особенностям, стандарт AAC способен достигать более гибкого и эффективного, а значит — и более качественного кодирования звука. Как и другие психоакустические аудиокодеры, AAC работает по следующей схеме. Входной сигнал пропускается через банк фильтров — преобразование, переводящее сигнал из временной области в частотно-временную область аналогично построению спектрограммы.

В этой таблице сравниваются основные технические данные различных цифровых аудиоформатов. Сравниваются как форматы файла без сжатия, так и с применением сжатия. Материал из Википедии — свободной энциклопедии.

Вместо тысячи слов:

Подготовил таблицу с форматами вещания популярных FM радиостанций

Обращаю внимание, в таблице приведены потоки, который можно включить только на официальном сайте. На деле – их может быть куда больше

Их можно просто послушать и сформировать своё мнение.

Станция Количество потоков Формат / Битрейт
Европа Плюс 1 HLS aac 96 kb/s
Авторадио 1 mp3 128 kbps
Дорожное радио 1 HLS aac 96 kb/s
Русское радио
Ретро FM 1 HLS aac 96 kb/s
Радио Дача 2 aac 24 / aac 56
Радио Шансон 3 mp3 64 / mp3 128 / mp3 256
Юмор FM 1 mp3 256 kbps
Вести FM 5 mp3 64 kbpsmp3 128 kbpsmp3 256 kbpsaac 32 kbpsaac 64 kbps
Радио России 1 mp3 192 kb/s
Радио Energy 1 aac 64
Маяк 1 aac 64
Love Radio 2 aac 24aac 56
Наше Радио 2 mp3 64mp3 128
DFM 1 aac 96
Хит FM 1 aac 96
Эхо Москвы 1 mp3 32
Серебряный Дождь 2 mp3 48mp3 128 Не видно на сайте: aac 64
Радио Рекорд 1 mp3 320

Все подробности

Интересно, что AAC-формат обладает частотой дискретизации в пределах 8-96 кГц, а также количеством каналов в отрезке 1-48. MP3 использует гибридный набор фильтров. В свою очередь AAC обращается к Модифицированному Дискретному Косинусному Преобразованию при увеличенном размере «окна», который достигает 2048 пунктов.

Таким образом, AAC намного более подходит для того, чтобы кодировать аудио, имеющее поток сложных импульсов, а также прямоугольных сигналов, по сравнению с MP3. Формат получил способность динамического переключения в длинах блоков MDCT в пределах 2048-256 пунктов. В случае если происходит кратковременная или единственная смена, применяется малое «окно» на 256 пунктов с целью достижения лучшего разрешения. При этом по умолчанию применяется 2048-пунктовое большое «окно», чтобы максимально улучшить эффективность кодирования. AAC имеет ряд преимуществ по сравнению с привычным MP3. Среди них следует отметить: реализацию большого числа звуковых каналов (до 48), значительную эффективность кодирования в условиях постоянного и переменного битрейта, а также частоты дискретизации в пределах от 8 Гц до 96 кГц (у MP3 этот показатель составляет от 8 Гц до 48 кГц) и более гибкий особый режим под названием Joint stereo. Что касается решения «ААС+» — это кодек, который ориентирован на работу с низким битрейтом. Является комбинацией SBR и AAC LC, благодаря чему достигается хорошее звучание уже в диапазоне 32-48 кбит/с.

Advanced Audio Codings
MIME-тип audio/aac , audio/aacp , audio/3gpp , audio/3gpp2 , audio/mp4 , audio/mp4a-latm , audio/mpeg4-generic , audio/x-aac , audio/x-m4a , audio/x-m4p , audio/x-m4b , audio/mp4a и audio/mpga
Разработчик Bell Labs , Институт интегральных схем общества Фраунгофера , Dolby Laboratories , Sony , Nokia , Coding Technologies и Общество Фраунгофера
Опубликован 1997 ( 1997 )
Тип формата Формат сжатия аудио, сжатие данных с потерями
Содержится в MPEG-4 Part 14, 3GP и 3G2, ISO base media file format и Audio Data Interchange Format (ADIF)
Стандарт(ы) ISO/IEC 13818-7,ISO/IEC 14496-3

Advanced Audio Coding (AAC) — проприетарный (патентованный) формат аудиофайла с потерями.

Также AAC — это многоканальный алгоритм кодирования аудио, поддерживающий потоковую передачу.

Не следует путать данный формат с аудиокодеком Apple Lossless (ALAC). Для обоих форматов используется одинаковый контейнер, но в случае Apple Lossless информация не теряется.

AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 году как новая, седьмая часть семейства MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

WavPack: сохранить частоту, поменять разрядность

Вообще, если уж сразу и совсем коротко, то математика кодера WavPack на сегодня относится к самым гибким и крутым протоколам для аудиоэнтузиастов, без шуток. В отличие от FLAС, он умеет поддерживать 32-битное исчисление (я его для создания lossless виниловых рипов). Более того, в WavPack даже можно запаковать DSD-файл, не обращая его в РСМ. При этом размер такого файла получится гораздо меньше, чем dsf-оригинал. Но об lossless WavPack мы поговорим как-нибудь в другой раз, а пока рассмотрим уникальный принцип действия lossy-кодека WavPack.

В одном из своих обзоров я показывал, что в ряде случаев при сжатии с потерями имеет смысл снижать не частоту дискретизации, а непосредственно битность сигнала (т.е. ниже 24 или 16 бит), аккуратно подмешивая дизер (т.е. специальный профиль шума для уменьшения ошибок квантования). WavPack пошел именно этим славным путем, не трогая дискретность и частотку вообще, зато изменяя глубину бит, которая теперь является динамической величиной, описывая уровень громкости сигнала. Чем-то напоминает DSD-принцип, не правда ли?

Примечательно, что при конвертации в такой lossy WavPack, можно дополнительно сохранить параллельный «корректирующий» файл, с помощью которого можно будет полностью, до последнего бита, восстановить оригинал. Правда, экономить место на диске в этом случае не получится, так как размер такой пары будет все равно соответствовать lossless-оригиналу. Но тем не менее функционал протокола все равно впечатляет.

Битрейт нашего тестового файла был выставлен на 320 кб/с, чтобы сопоставить его с максимумом наших МР3 и ААС, но теоретически в WavPack его можно ставить и выше. Особенно это пригодится для хайрезов, далее я покажу как — и никакой MQA больше не нужен!

Сравнение гармонических искажений оригинала (зеленым) и файла, закодированного в lossy WavPack (белым). Чуть подрос уровень шума и почти никаких искажений

На графиках lossy WavPack демонстрирует похвальное отсутствие частокола гармоник, которые набегали у двух предыдущих кодеров из-за агрессивной психоакустической модели. В WavPack подобные хитрые алгоритмы отсутствуют, фильтров АЧХ тоже нет — работает просто динамическое взвешивание уровня сигнала под заданный битрейт, и все. В итоге тестирование 1 кГц дает всего несколько гармоник нечетного порядка — 3-я, 7-я, 9-я и т. д. Частотный диапазон сохранен, квадратная волна тоже. На джиттер-тесте 11 кГц по остальному спектру кроме подросшего шума не замечено, никакой паразитной деятельности.

В джиттер-тесте тоном 11025 Гц у lossy WavPack все чисто

Для слухового опыта я отобрал пару достаточно звонких и неплохо прописанных фонограмм, которые вы также можете скачать и послушать в трех вариациях lossy-кодирования с битрейтом 320 кб/с: MP3, AAC и WavPack. Там же, в этих двух архивах, будут приложены оригиналы FLAC в стандартном CD-разрешении 16 бит / 44 кГц.

Композиция «White Wood» группы Lush поможет оценить деградацию ВЧ-диапазона. Кто-то на форуме шутил над моей верностью шугейзу, но именно такая, хрупкая, но спектрально насыщенная ткань оказывается весьма чувствительной к бульдозеру lossy-кодеков и поганой аппаратуры. Стоит чуть уступить, и все гитарные хорусы с медью тарелочек превратятся в жестяную помойку. Вторая фонограмма, «Deep Sleep» B-52’s, представляет собой пример адекватного мастеринга с сочным саундом, студийными эффектами и сохраненным при этом динамическим диапазоном.

Рейтинг автора
5
Материал подготовил
Максим Иванов
Наш эксперт
Написано статей
129
Ссылка на основную публикацию
Похожие публикации