Home » Мечтаем о семантической реставрации аудио в массовом масштабе

Мечтаем о семантической реставрации аудио в массовом масштабе

Rate this post

Я верю, что мы сможем проделать потрясающую работу по возвращению музыки эпохи 78 об/мин к яркой жизни , если мы действительно поймем износ и сможем смоделировать инструменты и голоса.

Другими словами я считаю

что мы могли бы реконструировать Данные телеграммы исполнение, семантически моделируя шум и искажения, от которых мы хотим избавиться, а также моделируя инструменты исполнителя.

Следуя этой логике если бы мы знали

что массовом масштабе исследуем фортепианную пьесу, и знали, какие ноты звучат на каком инструменте, когда и с какой силой звучат каждая нота, мы Анализ этой так называемой молитвы могли бы использовать эту информацию для реконструкции, проиграв её снова и записав эту версию. Это было бы похоже на то, что оптическое распознавание символов (OCR) делает с изображениями страниц с текстом: оно знает язык? распознаёт слова на странице и затем создаёт новую страницу с идеальным шрифтом. Фактически? используя OCR-текст, можно изменить шрифт, увеличить его и переформатировать страницу для отображения на другом устройстве.

Что если бы мы распознали музыку?

Это могло бы массовом масштабе Данные по Вьетнаму хорошо подойти для инструментального аккомпанемента? потому что тогда мы бы обращались с голосом? если он есть, иначе. Мы могли бы получить модель голоса певца, основанную не только на этой записи и других записях этой песни, но и на всех других записях этого певца. С помощью этих моделей мы могли бы реконструировать голос без каких-либо шумов и искажений.

Мы бы сбалансировали реконструированные

и необработанные сигналы, чтобы сохранить тонкие вариации, необходимые для отличного исполнения. Это также можно было бы сделать для контекста, поскольку иногда создатели цифрового кино добавляют эффекты поцарапанной плёнки.

Таким образом, если обратиться к семантике и анализу больших данных, то можно найти широкий спектр инструментов восстановления.

Проект Great 78 соберёт и оцифрует более

записей на 78 об/мин , чтобы сделать их общедоступными, создав богатый набор данных для масштабного анализа. Перенос данных осуществляется одновременно с использованием четырёх различных форм и размеров игл. Все записи производятся с частотой дискретизации 96 кГц/24 бит без потерь в стерео (хотя записи и монофонические, это даёт больше информации о контурах канавки). Это означает, что каждая канавка имеет 8 различных массовом масштабе высокоточных представлений для каждых 11 микрон. Более того, часто существует несколько копий одной и той же записи, которые были бы проштампованы и использованы по-разному. Таким образом, возможно моделирование износа на пластинке и использование его для реконструкции того, что было бы на мастер-копии.

Scroll to Top