NVIDIA представила Video LDM — модель ШІ для створення відео за текстовими описами. Штучний інтелект Video LDM від NVIDIA дозволяє генерувати відео з коротких та простих текстових описів. Наразі користувачам доступне створення коротких роликів (4,7 с) у режимі до 2048х1280 з 24 FPS.
Механізм Latent Diffusion Models дозволяє створювати відео з тексту без використання потужного заліза. Для його роботи використовується рушій Stable Diffusion. Принцип LDM полягає у створенні відео з окремих зображень (і тренуванні ШІ на них): ролик насправді є послідовністю згенерованих картинок.
NVIDIA розмістила на своєму сайті приклади робіт Video LDM, включаючи експериментальні ролики збільшеної тривалості. Публічна версія нейромережі поки що недоступна, компанія не розкриває термінів релізу.