Авторы нейросети Stable Diffusion объявили о выпуске Stable Video Diffusion. Это модель, которая генерирует видеоролики продолжительностью до четырех секунд по изображению или текстовому описанию.
У Stable Video Diffusion есть две версии:
▫️SVD генерирует ролики с частотой 14 кадров в секунду;
▫️SVD-XT использует ту же архитектуру, что и SVD, но увеличивает количество кадров в сгенерированных видеороликах до 24 в секунду.
Как утверждает Stability AI, модель Stable Video Diffusion по качеству генерации показывает себя лучше моделей Runway GEN-2 и Pika Labs.
Компания разместила исходный код и веса Stable Video Diffusion в открытом доступе. Найти их можно на GitHub и Hugging Face. В Stability AI подчеркнули, что пока их модель предназначена только для исследовательских целей.
Комментарии
Ответить