Во время конференции для разработчиков I/O во вторник Google объявила, что ее последняя генеративная модель видео с искусственным интеллектом, Veo, способна создавать «высококачественные» видео с разрешением 1080p, продолжительностью более минуты и в различных визуальных и кинематографических стилях.
Что такое Veo?
Согласно пресс-релизу Google, Veo имеет «продвинутое понимание естественного языка», что позволяет модели понимать кинематографические термины, такие как «таймлапс» или «аэрофотосъемка ландшафта». Пользователи могут влиять на желаемый результат с помощью текстовых, графических или видеоподсказок, и Google утверждает, что полученные видео будут «более последовательными и согласованными», изображая более реалистичные движения людей, животных и объектов в кадре.
Генеральный директор Google DeepMind Демис Хассабис (Demis Hassabis) заявил на пресс-конференции в понедельник, что результаты видео можно улучшить с помощью дополнительных подсказок, и что Google изучает дополнительные функции, которые позволят Veo создавать раскадровки и более длинные сцены.
Как и в случае со многими подобными предыдущими версиями моделей искусственного интеллекта, большинству людей, которые надеются испытать Veo самостоятельно, скорее всего, придется подождать некоторое время. Google приглашает избранных режиссеров и создателей поэкспериментировать с моделью, чтобы определить, как она может лучше всего поддерживать творческих людей, и будет опираться на это сотрудничество, чтобы обеспечить «творцам право голоса» в разработке технологий искусственного интеллекта Google.
Функции Veo
Некоторые функции Veo также будут доступны для «избранных создателей в течение ближайших недель» в частном предварительном просмотре в VideoFX — вы можете записаться в список ожидания, чтобы получить шанс испытать их раньше. Кроме того, Google также планирует добавить некоторые из своих возможностей к YouTube Shorts «в будущем».
Это одна из нескольких моделей генерации видео, которые Google создал за последние несколько лет: от Phenaki и Imagen Video, которые создавали грубые, часто искаженные видеоклипы, до модели Lumiere, которую он продемонстрировал в январе этого года. Последняя была одной из самых впечатляющих моделей, которые мы видели до анонса Sora в феврале, а Google заявила, что Veo еще более способна понимать, что происходит в видео, имитировать реальную физику, рендерить исходные данные в высокой четкости и тому подобное.
Между тем OpenAI уже презентует Sora в Голливуде и планирует выпустить его для широкой публики позже в этом году, предварительно дразнясь в марте, что он может быть готов через «несколько месяцев». Компания также планирует включить аудио в Sora и может сделать модель доступной непосредственно в приложениях для редактирования видео, таких как Adobe Premiere Pro. Учитывая, что Veo также позиционируется как инструмент для кинематографистов, преимущество OpenAI может усложнить конкуренцию с проектом Google.
Читати також: Як обрати студію веб дизайну?