vSound вышел: музыка из одной фразы.

Сегодня мы представляем vSound — нашу первую генеративную модель музыки. Опишите настроение, жанр, аранжировку или напойте восемь тактов: vSound напишет цельный трек, который держится от первого хука до последнего такта. Доступно прямо сейчас в vMira и через API для студий.

vSound создавался вместе с продюсерами и музыкантами. Бриф был прямой: end-to-end модель музыки, которая уважает музыкальность — ритм, аранжировку, динамику — и поставляется с такой провенансом, на котором индустрии с устоявшимися правовыми правилами не страшно строить.

Модель пишет мелодию, бас, барабаны и текстуру вместе, а не сшивает заранее отрендеренные стемы. Результат — треки, которые дышат в одной тональности, и возможность перепрашивать отдельный такт, не перекатывая всю песню.

3 мин

Максимальная длина трека на старте

12+

Жанровых семейств в базовом наборе

100%

Рендеров с водяным знаком

Что умеет

Опишите настроение. Одна фраза — летний вечер в Сочи, оптимистично, но устало — даёт рабочее вступление за тридцать секунд. Зафиксируйте параметры. Можно задать тональность, темп, размер и набор инструментов; vSound соблюдает каждое ограничение. Условие на мелодию. Напойте или загрузите восемь тактов — модель аранжирует остальную песню вокруг вашего хука. Стемы по запросу. Барабаны, бас, гармония и лид экспортируются отдельно на этапе рендера, чтобы свести в привычном DAW. Понимает текст. Положите куплет на русском или английском — вокальная партия ляжет в строй и в размер. Перекатать такт. Выделите 17-й такт, попросите вариант — остальная песня остаётся на месте.

Девять демо-треков рендерятся в браузере вживую на vcorp.co/sound — по одному промпту на жанр, от кинематографического эмбиента до берлинского техно.

Создавали с музыкантами

vSound разрабатывался вместе с продюсерами и сессионными музыкантами, которые формировали корпус данных, критерии оценки и калибровку отказов. Русский фольклор, джаз, классика, хип-хоп, клуб и оркестровое кино вошли в обучение с равным весом — поэтому дефолты модели не сдвинуты в сторону одного рынка. Там, где важно согласие артиста — тембр голоса, стилистическая имитация — мы построили процесс согласия раньше, чем саму возможность.

“Модель музыки настолько хороша, насколько хороши отношения за ней. Мы не хотели систему, делающую копии. Мы хотели систему, под которой продюсеры готовы поставить своё имя.”
— Руководство VCorp

Провенанс и безопасность

Каждый трек, который генерирует vSound, имеет цифровой отпечаток — водяной знак класса SynthID, устойчивый к MP3-сжатию, time-stretch и захвату с динамика. Метаданные провенанса в формате C2PA остаются в файле — версия модели, метка времени рендера, хэш промпта. Вокал по тексту не имитирует голос реального артиста без его письменного согласия. Мы публикуем семьи датасетов, использованных в обучении, и лицензионные уровни каждого, а роялти выплачиваем через стандартные механизмы коллективного управления правами в каждом рынке, где работаем.

Доступно сегодня

vSound доступен всем внутри vMira на тарифах Plus, Pro и Teams. API открыт для верифицированных студий и лейблов через наш портал разработчиков — пишите на business@vcorp.co для пилота. Хостед-запросы по умолчанию обрабатываются внутри Российской Федерации; трансграничная обработка — по явному согласию и с документацией по 152-ФЗ. Цены на API-тариф и детали по on-premise сборке будут опубликованы отдельной заметкой в следующем месяце.

Что входит в стартовый тариф

Треки до трёх минут, двенадцать жанровых семейств, вокал на русском и английском, разделённые стемы по запросу, кондиционирование на изображение, экспорт в стандартные проектные форматы DAW. Длинноформатная композиция (полные аранжировки, многосекционные произведения сверх трёх минут) и дополнительные языки народов Федерации запланированы на следующий релиз.

Чего не делает

vSound — не инструмент в реальном времени и не замена живого исполнения. Не имитирует названных артистов. Не генерирует звук, близко повторяющий защищённую запись, поданную как условие — модель откажет и объяснит ограничение. Как и в других наших моделях, мы публикуем известные нам ограничения, чтобы заказчики могли планировать вокруг них.

vSound вышел: музыка из одной фразы.

Что умеет

Создавали с музыкантами

Провенанс и безопасность

Доступно сегодня

Что входит в стартовый тариф

Чего не делает

Читать дальше

vMira 5.2: сильнее на русском, острее на коде.

vMira 5.1: под капотом.

vMira Thinking приходит с 5.1.