Stable riffusion

Подписчиков: 1 Сообщений: 2 Рейтинг постов: 60.8

Stable Diffusion начала синтезировать музыку

В рамках проекта Riffusion разработчики развивают вариант системы машинного обучения Stable Diffusion для генерации музыки вместо изображений. Мелодии можно создавать как на основе предложенного шаблона, так и с помощью текстового описания на естественном языке.

наука,наука и техника,технологии,нейронные сети,Stable diffusion,Stable riffusion,StableRiffusion,Riffusion

Компоненты для синтеза музыки написали на языке Python с использованием фреймворка PyTorch. Связь с интерфейсом реализовали на языке TypeScript. Компоненты доступны под лицензией MIT.

Сама модель открыта под лицензией Creative ML OpenRAIL-M, допускающей использование в коммерческих целях.

Обновлённая модель использует для генерации музыки модели «из текста в изображение» и «из изображения в изображение», но в качестве изображений выступают спектрограммы. Они отражают изменение частоты и амплитуды звуковой волны во времени. Система на выходе формирует новую спектрограмму, которая затем преобразуется в звуковое представление.

Проект Riffusion также может использовать для изменения имеющихся композиций и синтеза музыки по образцу. Этот процесс работает по аналогии с модификацией изображений в Stable Diffusion. Так, при генерации могут задаваться образцы спектрограмм с эталонным стилем, комбинироваться разные стили, выполняться плавный переход от одного стиля к другому или вноситься изменения в существующий звук для увеличения громкости отдельных инструментов, изменение ритма и т.д.

Образцы можно использовать для генерации длительно играющих композиций, создаваемых из серии близких друг к другу отрывков, немного меняющихся во времени. Они объединяются в непрерывный поток при помощи интерполяции внутренних параметров модели.

Для создания спектрограммы используется оконное преобразование Фурье. Чтобы решить проблему с определением фазы, задействован алгоритм аппроксимации Гриффина-Лима.

В ноябре Stability AI сообщила о выпуске новой версии модели Stable Diffusion 2.0. В ней улучшили качество и повысили вариативность получаемых изображений.

Развернуть

Отличный комментарий!

Музыканты через 3, 2, 1...

Jake_the_crab17.12.202219:02ссылка

+45.8

Комментарии 14017.12.202219:01ссылка59.8

anon

Stable Diffusion начала синтезировать музыку

В рамках проекта Riffusion разработчики развивают
вариант системы машинного обучения Stable Diffusion для генерации
музыки вместо изображений. Мелодии можно создавать как на основе
предложенного шаблона, так и с помощью текстового описания на
естественном языке.

наука и техника,технологии,нейронные сети,Stable diffusion,Stable riffusion,StableRiffusion,Riffusion,удалённое

Сама модель открыта под лицензией Creative ML OpenRAIL-M, допускающей использование в коммерческих целях.

Развернуть

Комментарии 117.12.202218:56ссылка1.0

	Mandy Dee
	Makoto Nanaya
	J.Won Han
	Dizzy (Guilty Gear)
	AZhang

Stable riffusion

Stable Diffusion начала синтезировать музыку

Отличный комментарий!

Stable Diffusion начала синтезировать музыку

Подписчики

Статистика

Юмор

Основные разделы

Интересное

Топ пользователей

Сейчас на сайте

Stable riffusion

наука наука и техника технологии нейронные сети Stable diffusion Stable riffusion StableRiffusion Riffusion

Stable Diffusion начала синтезировать музыку

Отличный комментарий!

наука и техника технологии нейронные сети Stable diffusion Stable riffusion StableRiffusion Riffusion удалённое

Stable Diffusion начала синтезировать музыку

Подписчики

Статистика

Юмор

Основные разделы

Интересное

Топ пользователей

Сейчас на сайте