Загрузка...

AI-модель Veo 3 от Google способна создавать видео со звуком

280Опубликовано 20.05.2025 в 22:15Категория: ИИИсточник

В рамках анонсов на конференции разработчиков I/O в этом году, Google представила свои новейшие модели генерации медиа. Наиболее заметной, пожалуй, является Veo 3 – первая итерация модели, способная генерировать видео со звуком. Например, она может создать видео с птицами и звуками их пения, или городскую улицу с шумом транспорта на заднем плане. Google утверждает, что Veo 3 также превосходно справляется с реалистичной физикой и синхронизацией губ.

В настоящее время модель доступна подписчикам Gemini Ultra в США в приложении Gemini и корпоративным пользователям на платформе Vertex AI. Она также доступна в Flow, новом инструменте Google для создания фильмов с использованием ИИ. Flow объединяет Veo, Imagen и Gemini для создания кинематографичных клипов и сцен. Пользователи могут описывать желаемый результат на естественном языке, и Flow приступит к его созданию. Новый инструмент пока доступен только подписчикам Google AI Pro и Ultra в США, но Google планирует расширить его доступность на другие страны в ближайшем будущем.

Несмотря на выпуск совершенно новой модели для генерации видео, Google не отказывается от Veo 2. Пользователи смогут предоставлять Veo 2 изображения людей, сцен, стилей и объектов в качестве справочных материалов для желаемого результата в Flow. Также им будут доступны элементы управления камерой, позволяющие вращать сцены и увеличивать отдельные объекты для Flow. Кроме того, они смогут изменять соотношение сторон кадра с портретного на альбомное и добавлять или удалять объекты из своих видео.

Google также представила свою новейшую модель генерации изображений Imagen 4 на мероприятии. Компания заявила, что Imagen 4 создает детализированные изображения, такие как сложные ткани и мех животных, с «замечательной четкостью» и превосходно генерирует как фотореалистичные, так и абстрактные изображения. Она также значительно лучше, чем ее предшественники, справляется с рендерингом типографики и может создавать изображения с различным соотношением сторон и разрешением до 2K. Imagen 4 уже доступна через приложение Gemini, Vertex AI и в приложениях Workspace, включая Docs и Slides. Google также заявила, что в ближайшее время выпустит версию Imagen 4, которая в 10 раз быстрее, чем Imagen 3.

Наконец, чтобы помочь людям идентифицировать контент, сгенерированный ИИ, который становится все труднее отличить от реального, Google запустила SynthID Detector. Это портал, где пользователи могут загружать медиафайл, который, по их мнению, может быть сгенерирован ИИ, и Google определит, содержит ли он SynthID – свой инструмент водяных знаков и идентификации для ИИ-арт. Google предоставила свой инструмент водяных знаков с открытым исходным кодом, но не все генераторы изображений используют его, поэтому портал все равно не сможет идентифицировать все изображения, сгенерированные ИИ.

Интересные статьи

Что у тебя на столе, Доминик Престон?

Как смотреть презентацию Google Pixel 10

Ежегодный технический отчет Rust: надежная публикация пакетов и страте...

Тренинги по фишингу оказались бесполезными, выяснили исследователи.

Предыдущая статья

Загрузка предыдущей публикации...

Следующая статья

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...