Phenaki – это модель искусственного интеллекта, позволяющая генерировать видео длиной в несколько минут прямо из текста. Также можно генерировать видео из неподвижного изображения и подсказки. Предложенный видеокодер-декодер превосходит все используемые в настоящее время в литературе покадровые базовые технологии по пространственно-временному качеству и количеству лексем на видео. Для генерации видео лексем из текста используется двунаправленное маскирующее преобразование, обусловленное предварительно вычисленными текстовыми лексемами. Сгенерированные видеотексты впоследствии де-токенизируются для создания реального видео.
0