→ Размер трехчасовой записи в качестве 192 kbps. Что такое битрейты? Как они влияют на качество музыки и видео? Оптимальный битрейт при разных условиях прослушивания

Размер трехчасовой записи в качестве 192 kbps. Что такое битрейты? Как они влияют на качество музыки и видео? Оптимальный битрейт при разных условиях прослушивания

Формат MP3-файлов представляется собой так называемый «открытый формат», поддерживаемый большинством производителей.

Формат MP3 один из самых распространённых форматов цифрового кодирования звука. Особенностью кодирования звука в формате MP3 является кодирование с потерями. Однако в основу кодирования положена специальная модель, учитывающая особенности слухового восприятия. Поэтому наличие потерь не ведёт к катастрофической деградации звука.

Файлы формата MP3 стали фактическим стандартом, их воспроизведение поддерживается большинством популярных операционных систем, многими CD-проигрывателями и DVD-плеерами и прочими устройствами.

Интересно, что стандарт описывает собственно формат хранения, а не способ кодирования звука. Благодаря этому существует огромное количество средств, служащих для воспроизведения звука в формате MP3.

Для кодирования звука в формате MP3 используются специальные кодеки.
Аудиокодек может принадлежать к одному из двух типов – аппаратный кодек и программный.

Аппаратное кодирование выполняется при помощи специальных микросхем.
Программное кодирование производится при помощи специальных компьютерных программ.

Качество звука в формате MP3 (при прочих равных условиях) зависит от степени сжатия (читай от количества потерь) и от кодирующей программы. Именно поэтому фирменные плееры, использующие кодеки и системы обработки звукового сигнала от известных брендов, существенно превосходят по качеству воспроизведения обычные устройства, собранные из типовых узлов.

Качество собственно воспроизведения зависит от величины потока данных с носителя. Иногда величину потока данных называют шириной потока. Существует специальный термин – bitrate. Скорость потока данных определяется в килобитах в секунду и обозначается kbs, kbps, kb/s. Запись может кодироваться несколькими способами – с постоянным битрейтом и с переменным битрейтом. Переменный битрейт помогает сохранить детали путём увеличения объёма данных.

Для качественного воспроизведения музыки подходят не все скорости потока данных см.Таблицу 1

Скорости потока данных в формате MP3 и области применения

Таблица 1

Данные, приведённые в Таблице 1, могут служить лишь ориентиром. Дело в том, что в момент появления формата MP3 качество аудио аппаратуры массового спроса было не очень высоким. Многие авторитетные издания всерьёз утверждали, что потока данных в 128 kb/s вполне достаточно для высококачественного воспроизведения звука.

В настоящее время качественным считается битрейт не менее 192 kb/s. Более того, широкое распространение Hi-Fi, Hi-End и систем домашнего кинотеатра привело к массовому переходу к высококачественному воспроизведению звука.

Поэтому огрехи звуковоспроизведения, незаметные на бюджетной аппаратуре прошлого, становятся заметны «неподготовленному слушателю», использующему современную качественную технику. Кстати и уровень этого самого «неподготовленного слушателя» существенно вырос.

Вообще идея сжатия (а особенно сжатия с потерями) постепенно изживает себя. Появившись в эпоху дорогих носителей информации и малой пропускной способности каналов передачи данных , идея сжатия данных прекрасно справилась со своей основной задачей. Однако постепенно любители звука переходят на более высокие битрейты (на сжатие с меньшими потерями), а то и вовсе на форматы сжатия «без потерь» или даже без сжатия.

Практичность сжатых форматов, и формата MP3 в частности, обусловило выпуск компактных MP3-плееров, устроенных на микросхемах памяти или на миниатюрных жёстких дисках.

При выборе той или иной модели подобного плеера возникает вопрос, связанный с объёмом его памяти. Естественно, что пользователь хочет заранее оценить количество музыкального материала, которое он сможет единовременно сохранить на своём MP3-плеере.

Ориентировочные данные по объёму файлов и продолжительности звучания собраны в Таблице 2. При использовании Таблицы 2 надо учитывать, что это примерные данные, позволяющие оценить требуемый объём памяти плееров или сменных носителей.

Продолжительность звучания MP3-файлов и степень сжатия

Таблица 2

Битрейт,
kb/s

1 минута записи,
KB

Стандартная
3-минутная композиция,
MB

Стандартная
4-минутная композиция,
MB

Стандартная
5-минутная композиция,
MB

Примечание к Таблице 2
Высокой степени компрессии соответствует значение 56 kb/s, низкая степень компрессии и высокое качество звука соответствует 320 kb/s

В Таблице 3 представлены ориентировочные данные об общей продолжительности музыкальных записей – времени звучания плеера с тем или иным объёмом памяти .

Общее время звучания MP3-плеера в зависимости от объёма памяти

Таблица 3

Продолжительность звучания

Объём памяти,
GB

Битрейт, kb/s

Минут
Часов

Минут
Часов

Минут
Часов

Минут
Часов

Минут
Часов

Минут
Часов

Насколько можно судить по Таблице 3, объёма 8 GB вполне достаточно, чтобы сохранять записи в MP3-формате наивысшего качества в количестве, пригодном для прослушивания по 8 часов каждый день в течение недели (7 дней). Без повторов! Едва ли у кого-то реально существует подобная потребность.

Даже если это так, то обновлять записи на плеере можно не чаще одного раза в неделю.

2013 сайт. All rights reserved.

До встречи в Сети!

Как включить Wi-Fi на ноутбуке Asus
Vista - как освободить место на диске
Подключение 3G модема МТС
Объём и качество MP3-файлов
Методика и практика выбора MP3-плеера ч.1
Методика и практика выбора MP3-плеера ч.2
Vista – как открыть командную строку в папке
Как распечатать имена файлов из папки
Как сохранить имена файлов в виде текста
Как скопировать имена файлов в MS Excel
Светодиодный USB фонарик
Устройство и конструкция наушников
Как подобрать наушники?
За счёт чего держатся вкладыши?
Питание гаджетов – аккумуляторы
Размеры SIM-карт
Питание гаджетов – вилки и розетки
Питание гаджетов – переходники

Битрейт принято использовать при измерении эффективной скорости передачи потока данных по каналу, то есть минимального размера канала, который сможет пропустить этот поток без задержек.

Битрейт выражается битами в секунду (бит/c, bps ), а также производными величинами с приставками кило- (кбит/с, kbps ), мега- (Мбит/с, Mbps ) и т. д.

Скорость передачи данных с использованием битов в секунду блока (символ: «бит/с»), часто применяется в сочетании с приставками из международной системы измерения единиц (СИ), такими как «кило» (1 кбит/с = 1024 бит/с), «мега» (1 Мбит/с = 1024 кбит/с), «гига» (1 Гбит/с = 1024 Мбит/с) или «тера» (1 Тбит/с = 1024 Гбит/с). Нестандартная аббревиатура «bps» часто используется для замены стандартного символа «бит/с», так что, например, «1 Мбит» используется для обозначения одного миллиона бит в секунду. Один байт в секунду (1 Б/с) соответствует 8 бит/с.

Энциклопедичный YouTube

  • 1 / 5

    В форматах потокового видео и аудио (например, MPEG и MP3), использующих сжатие c потерей качества , параметр «битрейт» выражает степень сжатия потока и, тем самым, определяет размер канала, для которого сжат поток данных. Чаще всего битрейт звука и видео измеряют в килобитах в секунду (англ. kilobit per second, kbps ), реже - в мегабитах в секунду (только для видео).

    Существует три режима сжатия потоковых данных:

    • CBR (англ. Constant bitrate ) - с постоянным битрейтом;
    • VBR (англ. Variable bitrate ) - с переменным битрейтом;
    • ABR (англ. Average bitrate ) - с усреднённым битрейтом.

    Скорость передачи информации

    Физический уровень чистого битрейта, скорость передачи информации, полезной битрейт, частота полезной нагрузки, чистая скорость передачи данных, скорость передачи кодированных передач, эффективная скорость передачи данных или скорость подачи проволоки (неофициальный язык) цифрового канала связи является способность без учёта накладного протокола физического уровня, для мультиплекса пример с временным разделением каналов (TDM) обрамляющих битов, резервируемых с прямым исправлением ошибок (FEC) кодов, эквалайзер обучающих символов и другого канального кодирования. Помехоустойчивые коды являются общими, особенно в системах беспроводной связи, стандартов широкополосного модема или современных высокоскоростных локальных сетей на основе меди. Физический уровень чистого битрейта является скорость передачи данных, измеренная в контрольной точке на границе раздела между канальным уровнем и физическим уровнем, и, следовательно, может включать в себя линию передачи данных, а также нагрузку уровня.

    В модемах и беспроводных системах, адаптации линии связи (автоматическая адаптация скорости передачи данных и модуляции и / или ошибок схемы кодирования, качество сигнала) часто применяется. В этом контексте термин пик битрейта означает чистый битрейт самой быстрой и наименее надёжным режимом передачи, используемый, например, [когда расстояние очень короткое замыкание] между отправителем и передатчиком. Некоторые операционные системы и сетевое оборудование может обнаружить «скорость соединения» (неофициальный язык) той или иной технологии доступа к сети или устройства связи, что предполагает текущую чистую скорость передачи данных. Следует отметить, что термин скорость линии в некоторых учебниках определяется как валовой скорости передачи в битах, а в других, как чистой скорости передачи данных.

    Взаимосвязь между совокупным битрейтом и чистой скорости передачи данных зависит от скорости ПИО кода в соответствии со следующим.

    Постоянный битрейт

    Постоянный битрейт - вариант кодирования потоковых данных, при котором пользователь изначально задаёт необходимый битрейт, который не меняется на протяжении всего файла.

    Его главное достоинство - возможность довольно точно предсказать размер конечного файла.

    Однако вариант с постоянным битрейтом не очень подходит для музыкальных произведений, звучание которых динамично изменяется во времени, так как не обеспечивает оптимального соотношения размер/качество.

    Переменный битрейт

    С переменным битрейтом кодек выбирает значение битрейта исходя из параметров (уровня желаемого качества), причём в течение кодируемого фрагмента битрейт может изменяться. При сжатии звука нужный битрейт определяется на основе психоакустической модели . Данный метод даёт наилучшее соотношение качество/размер выходного файла, однако точный его размер оказывается очень плохо предсказуем. В зависимости от характера звука (или изображения, в случае кодирования видео), размер полученного файла может отличаться в несколько раз.

    Усреднённый битрейт

    Усреднённый битрейт является гибридом постоянного и переменного битрейтов: значение в кбит/c задаётся пользователем, а программа варьирует его в некоторых пределах. Однако, в отличие от VBR, кодек с осторожностью использует максимально и минимально возможные значения, не рискуя выйти за заданную пользователем среднюю величину. Этот метод позволяет наиболее гибко задавать скорость обработки (для аудио это может быть любым числом между 8 и 320 кбит/с, против чисел, кратных 16 в методе CBR) и с гораздо большей (по сравнению с VBR) точностью предсказывать размер выходного файла.

    MP3

    Формат MP3 сжатия аудио с потерями данных. Качество звука улучшается с увеличением битрейта:

    • 32 кбит/с - как правило, приемлемо только для речи
    • 96 кбит/с - как правило, используется для передачи речи или потокового звука низкого качества
    • 128 или 160 кбит/с - начальный уровень кодирования музыки
    • 192 кбит/с - приемлемое качество кодирования музыки
    • 256 кбит/с - высокое качество кодирования музыки
    • 320 кбит/с - наивысшее качество кодирования, поддерживаемое стандартом MP3

    Битрейт указывается как одна из главных характеристик видео и аудиозаписей. Большинство пользователей привыкло думать, что он определяет качество загружаемого файла. Но что такое битрейты и как они на самом деле характеризуют музыкальные файлы и видеоролики? Рассмотрим это подробнее.

    Что такое битрейты?

    Битрейт - это величина, которая отображает количество единиц информации (мегабит или килобит), вмещенных в одну секунду воспроизведения файла. Соответственно, он измеряется в мегабитах в секунду (Mbps) или килобитах в секунду (Kbps). Иначе битрейт можно охарактеризовать как ширину пропускной полосы. Эта характеристика важна для тех, кто хочет конвертировать файлы, потому что при одной и той же продолжительности больший битрейт приведет к увеличению файла. Помимо размера, меняется и качество звука. Уменьшение размера при понижении битрейта называется сжатием.

    Распространенный музыкальный представляет собой аудиофайл, сжатый до такой степени, что на стандартный диск помещается до 12-ти часов музыки. При этом качество остается достаточно высоким благодаря психоакустическому сжатию: из всего диапазона убираются звуки с теми частотами и уровнями громкости, которые не улавливаются человеческим ухом. Отобранные звуки формируются в обособленные блоки, называемые фреймами. Фреймы имеют одинаковую продолжительность звучания и сжимаются по заданному алгоритму. Когда проигрывается музыка, сигнал воссоздается из декодированных блоков в определенной последовательности.

    Какое обычно используется сжатие?

    Битрейт аудио чаще всего составляет 256 Кбит/с. При таком значении аудиозапись сжимается в размере приблизительно в 6 раз, благодаря чему на один диск можно записать в 6 раз больше музыки, чем до сжатия. Если битрейт понизить до 128 Кбит/с, то на один диск поместится уже в 12 раз больше музыки, однако качество звучания будет заметно ниже. Музыка, записанная в качестве 128 Кбит/с, чаще всего предлагается для прослушивания в интернете, т. к. в погоне за повышением скорости загрузки страниц владельцы ресурсов идут на любые жертвы. Многие пользователи отмечают, что ее качество далеко от идеального.

    Теперь, когда стало ясно, что такое битрейты, самое время определить их оптимальный уровень. Как любители, так и профессионалы бесконечно спорят, как битрейт влияет на качество звука и влияет ли вообще. На музыкальных альбомах, как правило, указывается битрейт. Один и тот же диск, записанный в качестве 128 Кбит/с и 256 Кбит/с, будет различаться по цене в два раза.

    Оптимальный битрейт при разных условиях прослушивания

    Для многих людей двенадцатикратное сжатие не представляет какого-либо ущерба, в то время как другие утверждают, что не могут слушать музыку с битрейтом ниже, чем 320 Кбит/с. Парадоксально, но правы и те и другие. Дело в том, что в конечном счете качество воспроизведения зависит не от а от условий воспроизведения и даже от типа музыки.

    Например, песня проигрывается на магнитофоне, установленном в отечественном автомобиле. В таком случае качество на уровне 192 Кбит/с будет вполне достаточным. Более высокий битрейт улучшит качество звука, но разница не будет заметна из-за высокого уровня шума во время поездки. Если же музыка играет на домашнем компьютере или портативном плеере, то требуется не менее 256 Кбит/с. Если же сигнал не подвергается изменениям, передается на внешние устройства и выводится на дорогие импортные колонки, то следует по возможности прибегать к минимальному сжатию. Оно возможно при битрейте 320 Кбит/с.

    Оптимальный битрейт для различных музыкальных стилей

    Музыка с высоким битрейтом нужна не всегда. Популярная музыка, как правило, достаточно хорошо звучит при битрейте 192-256 Кбит/с. Более высокое качество установить можно, но смысла в этом нет: поп-композиции недолговечны, поэтому сохранение места на дисках должно быть приоритетным. Кроме того, качество исходных записей тоже посредственное, поэтому повышение битрейта может никак не повлиять на качество воспроизводимого файла. Для прослушивания в транспорте и на неофициальных вечеринках среднего качества вполне хватит.

    Если же речь идет о классической музыке, произведениях легендарных рок-групп или редких авторских песнях, то качество должно быть превыше всего. При приобретении такой музыки нужно посмотреть на битрейт, указанный на упаковке диска. Если песня загружается из Интернета, то такая информация должна присутствовать на странице скачивания. Кроме того, битрейт отображается в плеере во время проигрывания.

    Битрейты видеофайлов

    Выше говорилось о том, что такое битрейты аудиозаписей. Но что такое битрейт видео? Учитывая, что видео воспроизводится как последовательность звуков и изображений, то определение битрейта будет аналогичным. Наличие видеоряда утяжеляет файл, но в конечном счете изображения для процессора - это такие же нули и единицы, как и звуки. Принцип шифрования информации одинаков для всех типов файлов.

    Что является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов?

    Сохранить и прочитать потом -

    Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.

    Частота 192 кГц считается вредной

    Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.

    И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.

    График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.

    Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.

    Есть несколько способов избежать дополнительных искажений:

    1. Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.
    2. Усилители и преобразователи, спроектированные для воспроизведения более широкого спектра частот так, чтобы ультразвук не вызывал слышимых нелинейных искажений. Из-за дополнительных затрат и сложности исполнения, дополнительный частотный диапазон будет уменьшать качество воспроизведения в слышимой части спектра.
    3. Качественно спроектированные динамики и усилители, которые совсем не воспроизводят ультразвук.
    4. Для начала можно не кодировать такой широкий диапазон частот. Вы не можете (и не должны) слышать ультразвуковые нелинейные искажения в слышимой полосе частот, если в ней нет ультразвуковой составляющей.

    Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.

    Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.

    Тесты для измерения нелинейных искажений:

    • Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц)
    • Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц)
    • Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц)
    • Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) (оригинальная версия нарезки) (16 бит / 44.1 кГц WAV)

    Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц . При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.

    В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.

    Недопонимание процесса дискретизации

    Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.

    Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).

    Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.

    По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.

    Это только так выглядит. Эти убеждения неверны!

    Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell , поэтому можете не верить мне на слово.

    Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.

    С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.

    Избыточная дискретизация

    Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них .

    Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.

    На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).

    Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.

    Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.

    ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.

    16 бит против 24 бит

    Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?

    16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.

    Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.

    Примечания к Части 2

    6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.

    7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.

    8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.

    Эту статью прочитали 33 932 раза

    За последние несколько лет стал ужасно модным и популярным формат MP3. На любом лотке, торгующем компьютерными CD-дисками, вы легко найдете не один десяток дисков типа «Полная антология группы XXX», и внизу скромненькую такую надпись — MP3. Чаще всего для полной картины на обложках красуется модное словосочетание CD quality — то бишь качество, как у Audio-CD. Именно об этом и не только будет дальше наше повествование — о MP3, какие они бывают, о качестве звука в MP3.

    О формате MP3

    Для начала немного разберемся с предметной областью. Что вообще из себя такое представляет этот MP3?

    MP3, более правильное название MPEG-1 Layer 3 — стандарт на сжатие аудиоинформации с потерями. При этом основной целью при создании стандарта было обеспечение максимально «идентичного» исходному звука, а также сведение к минимуму объема хранимых данных. Для этого была создана оригинальная схема кодирования — на первом этапе оцифрованный звук разбивается на частотные составляющие, которые проходят через ряд фильтров.

    Основное отличие MP3 от прежде существовавших стандартов — именно в фильтрации. Разработчики стандарта создали так называемую психоакустическую модель — модель, которая учитывает некоторые особенности человеческого слуха, и на основании этой модели из аудиосигнала отфильтровываются те частоты, отсутствие которых слух почти не замечает. На втором этапе полученный поток кодируется по алгоритму Хаффмена со статической таблицей. Результат и будет являться потоком MP3.

    Кроме этого в файл MP3 могут быть добавлены также тэги ID3 (метки, содержащие название песни, исполнителя, другую информацию) и различная сервисная информация.

    Режимы сжатия и битрейты

    Ширина потока — битрейт определяет, сколько бит необходимо для кодирования 1 секунды музыки. Стандарт MP3 регламентирует потоки от 8kbit/s до 320kbit/s. Наиболее типичный битрейт — 128kbit/s.

    Исходя из потока, легко подсчитать, сколько будет занимать одна минута музыки — надо битрейт разделить на 8 (число бит в байте) и умножить на 60 (секунд в минуте) — получим число килобайт. Для уже упомянутого потока 128kbit/s это будет 128/8*60=960 килобайт или около мегабайта на каждую минуту записи.

    Вполне естественно, что чем больше битрейт, тем больше деталей звука удается сохранить, тем он звучит реалистичнее. В выборе битрейта при кодировании приходится чем-либо жертвовать — либо качеством в пользу малого размера, либо размером в пользу качества.

    Самый простой режим сжатия MP3 — это режим с постоянным битрейтом (CBR, Constant BitRate). Ранее на сборках MP3 почти на 100% использовался уже упомянутый выше битрейт 128kbit/s — и при этом на дисках присутствовала надпись CD quality. Откровенно говоря, это просто наглая ложь. На практике отличить звучание такой MP3 от звучания аудио компакт-диска нельзя разве только что на самой дешевой акустике.

    Уровень качества на битрейте 128kbit/s — это примерно уровень звучания среднего магнитофона на не самой свежей пленке, может чуть лучше. Еще можно добавить, что именно такой битрейт широко распространен в записях, доступных по Internet.

    Для упрощения разбора более высоких битрейтов напишу их сеточку: 128kbit/s, 160kbit/s, 192kbit/s, 224kbit/s, 256kbit/s, 320kbit/s. Итак, битрейты 160 и 192kbit/s уже заметно лучше по качеству, нежели 128kbit/s, но получаемые файлы все еще не так велики. «Артефакты» (огрехи) кодека уже почти незаметны (по крайней мере на моей системе).

    С битрейтом 224 мне в чистом виде ни разу встретиться не пришлось, поэтому про его качество ничего не могу сказать, но оно должно быть выше, чем на предыдущей ступеньке лесенки битрейтов. Кроме того, мне не встречались обзоры, охватывавшие и этот битрейт. Видимо это как-то связано с тем, что следующий за ним битрейт 256kbit/s является признанным в плане точности передачи звука, почти полным отсутствием искажений. В инструкции к кодеку Lame этот битрейт даже назван как Studio Quality. И самый потолок — 320kbit/s предназначен для тех, кому качество дороже всего, или для владельцев очень качественной Hi-Fi или даже Hi-End аппаратуры.

    Теперь перейдем к несколько более сложному вопросу — режиму переменного битрейта (VBR, Variable BitRate). Здесь понятие битрейта очень размыто, кодеки «для пользователя» вообще используют регулировку только по качеству (как например в Xing Audio Catalyst). Другие же (Lame) позволяют задавать дополнительные параметры — минимальный и максимальный битрейты, опять же качество.

    При кодировании VBR кодек сам выбирает нужный битрейт, исходя из заданных ему параметров, причем в течение кодируемого фрагмента битрейт может изменяться. Для оценки нужного битрейта используется уже упоминавшаяся психоакустическая модель. Однако модель (так как не является идеальной, ничто в нашем мире не идеально) иногда показывает неверные результаты. Это приводит к занижению оценки, и соответственно падению реально слышимого качества звука.

    Разработчики кодека Lame советуют в таком случае устанавливать порог минимального битрейта, чтобы избежать совсем плохих результатов. К разновидностям VBR относится и кодирование ABR (Average BitRate), усредненного битрейта. В последнее время в обзорах слышны только положительные отклики об этом режиме, особенно ABR на 256kbit/s. Работает этот режим почти также, как и VBR, с тем исключением, что кодек придерживается среднего заданного значения. В настоящий момент мне известен только один кодек, имеющий режим ABR — это Lame.

    Выбор кодека

    Буквально совсем недавно у пользователя, желавшего получить пристойное качество MP3, был не очень большой выбор — это какой-либо ISO-based кодек (основанный на коде образца кодека MP3, выпущенного International Standarts Organization), либо кодек от IIS Fraunhofer (институт — разработчик MP3). Плюс кодеки в продуктах от Xing.

    Почитав разных обзоров, и сделав небольшие собственные исследования, я пришел к выводу о ветке продуктов фирмы Xing — это… их лучше не использовать. Даже в относительно новых версиях все их продукты, умеющие создавать MP3 встроенными средствами, делают это максимально некачественно.

    Существует также масса «пионерских» поделок, слепленных на ворованном у Xing кодеке (почти все содержат в составе файл tompg.exe). Долгое время их основным преимуществом была скорость (в ущерб качеству), но сегодня кодек Lame показывает сравнимую скорость при более высоком качестве. Кроме того, продукция фирмы Xing вообще говоря стоит денег, тогда как Lame бесплатен по определению.

    Далее пройдусь по продукции IIS Fraunhofer. Все их программы для сжатия MP3, доступные бесплатно, являются сильно урезанными по возможностям версиями их же коммерческих продуктов. Затем, все их кодеки не развивались в течение долгого времени, и не содержат новых средств, поддержки VBR/ABR, кроме того не отличаясь особым быстродействием. Единственное их оправданное применение — сжатие на битрейтах ниже 128kbit/s — в них проведена специальная оптимизация под низкие битрейты (местами, правда, с нарушением стандарта).

    Различные кодеки на базе кода ISO страдают в принципе одним и тем же недостатком — низкокачественным сжатием на битрейтах ниже 192kbit/s. Кроме того, большинство из них (в т.ч. и BladeEnc) — изрядно медленные.

    На мой взгляд, самым оптимальным вариантом является кодек Lame. Начинавший как свободный кодек на базе ISO-кода, в процессе разработки он вырос и теперь все обзоры при сравнении MP3 с другими форматами используют именно его в качестве эталонного для MP3. Немногим более года назад проект Lame окончательно избавился от ISO-кода и теперь может считаться полностью независимым кодеком.

    Развитие кодека достаточно интенсивное, его постоянно обновляют, исправляют ошибки. Кроме того, возможно использовать Lame не только под Windows, но и под различные варианты Unix-систем, он также работает в чистом DOS. Опять же, полностью бесплатен, доступен исходный код (для любителей в оном покопаться), с нескольких сайтов доступны уже скомпилированные бинарные файлы (.exe и.dll), оптимизированные под разные процессоры.

    Существует также несколько урезанная версия Lame — энкодер GOGO-no-coda, который показывает по скорости фантастические результаты (в два раза быстрее, чем и так быстрый Lame).

    Так какой же битрейт и какой режим использовать?

    Учитывая все вышесказанное, я бы порекомендовал класть в архив MP3 либо с потоком 320Kbit/s, режим CBR, либо 256kbit/s, ABR. Первый на мой взгляд несколько предпочтительнее, т.к. вы получаете максимально доступное качество в рамках формата. Для записей на «пару раз послушать и стереть» разумно использовать ABR 192kbit/s.

    И еще одно — лучше не использовать для сколь-нибудь долгого хранения битрейты ниже 192kbit/s — если только запись, с которой была сделана MP3, у вас не постоянно под рукой (хотя помните, что аналоговая запись на магнитной ленте с течением времени ухудшается).

    Очень часто аргумент, который я слышу в пользу низких битрейтов и «кривого» сжатия — «у меня плохая акустика, и я все равно не слышу разницы». Все может измениться, или вам придется использовать свой архив на приличной аппаратуре, а до исходной записи будет добраться нельзя. Ответ абсолютно не надуман, я могу привести случай из собственной практики.

    В нашем городе Павлово был когда-то небольшой клуб, где музыку воспроизводили с компьютера (MP3 с битрейтом не выше 160kbit/s). Далее клуб благополучно скончался, а компьютер с архивами музыки переехал в другую фирму, занимавшуюся проведением массовых мероприятий. Представьте себе, что они взялись крутить эту музыку на дне города! Ужас, когда на более-менее приличной акустике было слышно все дефекты, привнесенные упаковкой на такой маленький битрейт. Звук был хуже, чем с их же видавшего виды кассетного магнитофона с полупережеванными кассетами. Было бы разумно избегать повтора чужих ошибок, верно?

    Тестовое оборудование и ПО

    Компьютер: Athlon TB 650MHz, M/B Acorp 7KTA 100MHz FSB, 128Mb RAM PC-133, HDD Quantum 40Gb 5400rpm, SoundBlaster 16 Vibra, AC97 codec.
    Аудиосистема: усилитель Radiotehnika У-7111, пара колонок Radiotehnika S-90B.
    ПО: ОС Windows98 SE, Winamp 2.75, Eac 0.9pb11, Lame 3.90a, GOGO-no-coda 3.07a

     

     

Это интересно: