Новый генератор видео на основе LLM, способный создавать видео длиной в минуту.

 LOONG: A New Autoregressive LLM-based Video Generator That can Generate Minute-Long Videos


LOONG: Новый авторегрессионный генератор видео на основе LLM, способный создавать видео продолжительностью в минуту

Практические решения и ценность:

Генерация видео с помощью LLM – перспективное направление с обещающими перспективами роста. Модель Loong обучается на текстовых и видео токенах как на единой последовательности, что позволяет ей создавать видео продолжительностью в минуты. Применение прогрессивного подхода к обучению и перераспределение потерь позволяют Loong генерировать видео, основанные на текстовых подсказках.

Прогрессивное обучение от короткого к длинному:

Модель Loong проходит три этапа обучения, начиная с предварительного обучения на статических изображениях, затем обучения на коротких видеороликах для захвата краткосрочных зависимостей и завершения с обучением на увеличенном количестве видеокадров.

Преодоление вызовов длинного видео:

Для исправления проблемы дисбаланса сложности видео токенов предложены методы перекодирования видео токенов, стратегии сэмплирования, суперразрешения и улучшения. Модель Loong генерирует длинные видео с качественным внешним видом, большой динамикой движения и естественными переходами сцен.

Применение в различных отраслях:

Модель Loong может быть задействована для помощи визуальным художникам, кинопроизводителям и развлекательным целям, улучшая процесс создания контента. Важно помнить, что модель также может быть неправильно использована для создания фейкового контента и распространения ложной информации.


Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект