Может ли архиватор определить автора музыки?

Может ли архиватор определить автора музыки?

Простой компьютерный Zip-архиватор распознаёт музыкальный стиль, не проиграв ни одной ноты из файла с малоизвестным опусом. А также окажет помощь исследователям-музыковедам выяснить автора неизвестного произведения, — радует New Scientist. Что, правда?

Сейчас «Новый учёный» в редких паузах между сводками с иракского и антипневмонийного фронтов балует нас несвойственными этому изданию в более спокойные периоды не через чур точными, мягко говоря, новостями.

Сперва попытаемся осознать, что же информирует авторитетный источник, а уже позже будем полемизировать и «раскрашивать» приглянувшуюся публикацию.

Итак, в печатном варианте издания от 15 декабря 2001 года содержится статья о том, что ходовая программа-архиватор WinZip весьма понадобится для определения языка, на котором написан непонятный фрагмент текста.

Техника распознавания достаточно несложна. Берём пара объёмных файлов с документами, составленными на известных языках. Последовательно сжимаем эти тексты, запоминая наряду с этим размер оказавшихся архивов.

После этого, берём отечественный текст таинственного происхождения и последовательно дописываем в финиш каждого из несжатых разноязыких файлов. Оказавшиеся «бутерброды» заново архивируем.

Язык документа, размер архива которого меньше всего увеличился при добавлении малоизвестного фрагмента, и будет, наверное, языком этого самого фрагмента. Всё.

С радостью допускаем, что так оно, теоретически, и должно быть. Дело в том, что данный опыт — не более чем ловкий трюк циркача на арене перед простодушными зрителями.

Как трудится метод сжатия, применяемый программой WinZip? Для начала приведём собственный пример.

Заберите несложный текстовый процессор типа «блокнот». Введите в него на 10 килобайт полезной информации. Сожмите WinZip?ом — получите архив «весом» порядка 3,5 Кб.

Запомнили?

Утверждается, что архиваторы способны бесстрастно определять музыкальное направление…

Сейчас снова открываем текстовый файл и копируем его содержимое в личный «хвост». Взяли файл ровно вдвое большего размера – 20 Кб. Попытайтесь сжать — будет что-то около 3,75 Кб вместо ожидаемых семи.

Цифры смогут пара различаться от приведённых, но тенденция предсказана верно.

Из-за чего так? WinZip в ходе сжатия, грубо говоря, образовывает полный «словарь» всего документа, а после этого заменяет в архиве сами слова ссылками на соответствующую словарную статью.

Исходя из этого оттого, что мы продублировали документ, состав словаря, именно и занимающего больше всего места, не изменился, а возросло только количество обращений к его статьям, незначительно повысив размер архива удвоенного исходного файла.

Более доходчивое и детальное описание работы архиватора возможно отыскать тут, но, сохраняем надежду, и без того ясно, из-за чего трудится схема из New Scientist.

Чем ближе язык непонятного текста к определённому словарю, тем выше возможность совпадений. Следовательно, тем меньше «разбухнет» архив.

А сейчас возвратимся к свежей, заинтриговавшей нас, истории с музыкальным архивированием.

Несколько учёных из Голландского национального исследовательского университета (Dutch National Research Institute) задумалась: запрещено ли приложить ту же методику к музыкальным фрагментам, дабы выяснить стиль выполнения.

Для изучения были забраны фрагменты произведений трёх жанров — классики, рока и джаза, всего по 12 единиц каждого. За эталоны чистоты выбрали Бетховена, Майлза Дэвиса и Джимми Хендрикса.

С взятыми треками проделали манипуляции подобные тем, что и с текстовыми файлами: «зазиповывали» и контролировали на предмет сходства с остальными. Результаты должны были распределяться по трём категориям, в каждой из которых размещались пьесы, относящиеся к одному и тому же направлению.

Результаты ошеломляющие: архиватор — кстати, это был не WinZip, а Bzip2, верно выяснил 10 джазовых, 9 роковых и «большая часть» хороших фрагментов. Другими словами, распределил их по соответствующим категориям.

Исследователи подозревают, что совершенно верно так же возможно определить имя композитора безымянной записи, в случае если известны какие-то другие произведения, без сомнений ему принадлежащие.

…в противном случае и отличить одного автора от другого.

И сохраняют надежду, что, вместо гармонии и анализа ритма, эти неприятности решаются несложным сжатием музыки.

А в качестве очевидного применения разработки, предлагают сетевым музыкальным магазинам применять её для классификации содержимого собственных глубоких хранилищ.

Методикой остался весьма доволен Джереми Саммерли (Jeremy Summerly) из английской Королевской академии музыки (Royal Academy of Music): «Я бы полюбил технику, талантливую вычислить автора несложной обработкой нот его произведения».

У Джереми накопилось большое количество музыкальных пьес XVI века, авторы которых малоизвестны, и он решительно не знает, что с ними делать.

Имеется и вторая мысль: многим ещё до сих пор не ясно, что во второй части «Реквиема» написал Моцарт, а что — Зюсмайр. Из-за чего бы компьютеру, наконец, не вернуть справедливость?

Начинаем полемизировать. Товарищи учёные, по всей видимости, шутят, а New Scientist — не смешно. Для начала: корреспондент издания, наверное, по большому счету не осознавал, о чём идёт обращение.

Вы не вспоминали, из-за чего ни при каких обстоятельствах не встречали «зазиповыванных» MP3 файлов? Возьмитепростой аудиодиск и перепишете один трек на винчестер, лишь не как «МР3», а как «wav» (к примеру, программой Cdex), а позже сожмите WinZip?ом.

В случае если весьма попытаетесь — выгадаете несколько процентов количества. Не сжимают так звуковые файлы (и картины), не выйдет. Для их сжатия необходимые другие программы, трудящиеся по иным законам.

А у WinZip-a либо Bzip2 не окажется никакого «словаря», исходя из этого все предстоящие аналогии с текстами начисто лишены смысла.

Похоже, голландцы подразумевали какой-то вид предварительной обработки звука, потому, что создатель серьёзно подмечает: «Учёные убрали все данные, не связанную с самой музыкой, включая ID-тэги, дабы создать последовательность данных, воображающую ритм и мелодию произведения».

Разрешите, какие конкретно ID-тэги, откуда, причём они тут, уж не имел ли создатель в виду звук, сдавленный до состояния МР3?

Нет, складывается чувство, что использоваласькакая-то упорядоченная совокупность музыкальной«каллиграфии» (в противном случае WinZip ни к чему), причём более изощрённая, чем привычная нотная грамота.

Так как ни для кого не секрет, что многие нюансы джазового выполнения не поддаются нотной записи, не смотря на то, что играются принципиальную роль при определении авторства.

Но, обо всех этих гипотетических совокупностях остаётся лишь догадываться. В любом случае, такая «очистка» музыки не есть простое арифметическое сжатие, и может оказаться выдачей желаемого за настоящее. Другими словами, нас как минимум ещё раз тонко надули.

Потом, нет никаких информации об успешных попытках определения, при помощи архивации намерено составленных «музыкальных полуфабрикатов», авторства мелодии. Вот и получается, что New Scientist, по собственному произволу, разжёг искру в пламя.

А что касается идентификации жанровой принадлежности, то её по одному лишь музыкальному размеру, без всякого сжатия, возможно вычислить в пять секунд и фактически точно (кроме случаи смешения стилей).

Музыка, само собой разумеется, строится по правильным законам, и контролировать алгеброй гармонию, быть может, в полной мере возможно, но не до такой же абсурдной степени.

И ещё, о текстах. В филологии разные способы компьютерного лингвистического анализа, куда более сложные и отработанные, чем WinZip и Bzip2, используются уже большое количество десятилетий. Но кроме того в данной области «особенное вывод» программы не более чем принимают к сведению.

Как проверить музыку на авторское право


Темы которые будут Вам интересны:

Читайте также: