Google DeepMind представляет новую видеомодель, чтобы конкурировать с Sora

17.12.24

0

2 574

0

Google DeepMind, флагманская исследовательская лаборатория Google по искусственному интеллекту, хочет победить OpenAI в ИИ для генерации видео.

В понедельник DeepMind анонсировала Veo 2, искусственный интеллект для создания видео следующего поколения и преемника Veo. Veo 2 может создавать клипы продолжительностью более двух минут с разрешением до 4k (4096 x 2160 пикселей).

В экспериментальном инструменте Google для создания видео VideoFX, где Veo 2 теперь эксклюзивно доступен, видео имеют максимальное разрешение 720p и продолжительность восемь секунд. (Sora может создавать до 1080p клипы продолжительностью 20 секунд).

Эли Коллинз, вице-президент по продуктам в DeepMind, также сообщил, что Google сделает Veo 2 доступным через свою платформу разработчика Vertex AI, "если модель будет готова к использованию в масштабе".

Google DeepMind
Google DeepMind

«В течение следующих месяцев мы будем продолжать итерацию на основе отзывов пользователей, – сказал Коллинз, – и попытаемся интегрировать обновленные возможности Veo 2 в убедительные варианты использования в экосистеме Google. Мы ожидаем, чтобы поделиться новостями в следующем году».

Как и Veo, Veo 2 может генерировать видео с помощью текстовой подсказки, например, «Автомобиль мчится по автостраде» или текста и контрольного изображения.

DeepMind говорит, что модель, которая может создавать клипы в разных стилях, имеет улучшенное понимание физики и элементов управления камерой, а также создает более четкие кадры. Текстуры и изображения в клипах более четкие, особенно в сценах с большим количеством движений. Что касается усовершенствованных элементов управления камерой, они позволяют Veo 2 точнее размещать виртуальную «камеру» в видео, которые она создает, и перемещать эту камеру, чтобы снимать объекты и людей под разными углами.

DeepMind также утверждает, что Veo 2 может более реалистично моделировать движение, динамику жидкости (например, когда кофе наливают в кружку) и свойства света (такие как тени и отражения). Это включает различные линзы и кинематографические эффекты, говорит DeepMind, а также «нюансы» человеческого выражения.

Коллинз признал, что есть над чем работать.

«Согласованность и последовательность – это сферы для роста», – сказал он. «Veo может постоянно следовать подсказкам в течение нескольких минут, но [он не может] придерживаться сложных подсказок в течение долгих горизонтов. Так же постоянство характера может являться проблемой. Также есть куда усовершенствоваться в создании сложных деталей, быстрых и сложных движений и продолжать расширять пределы реализма».

DeepMind продолжает работать с художниками и продюсерами, чтобы усовершенствовать свои модели и инструменты создания видео, добавил Коллинз.

Источник: TechCrunch

Оставить комментарий

Актуальное

Искусственный интеллект достигает идеальной части S-образной кривой

Инновации

Искусственный интеллект достигает идеальной части S-образной кривой

Инновации

Одна из самых убедительных теорий о будущем искусственного интеллекта, как ни странно, взята из статьи о угольной промышленности, написанной 161 год н...

25.03.26

623

0
Самая важная настройка Google, которую вы не используете

Бизнес

Самая важная настройка Google, которую вы не используете

Бизнес

Существует бесплатный автоматизированный инструмент, который удаляет информацию о вас из результатов поиска Google. По какой-то причине большинство лю...

20.03.26

855

0
Новый отчет показывает, что приложения на базе искусственного интеллекта испытывают проблемы с долгосрочным удержанием подписчиков

Аналитика

Новый отчет показывает, что приложения на базе искусственного интеллекта испытывают проблемы с долгосрочным удержанием подписчиков

Аналитика

Учитывая, что ведущие магазины приложений переполнены приложениями с искусственным интеллектом, разработчики могут полагать, что лучший способ получен...

19.03.26

762

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

9 747

1
Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интел...

26.05.25

6 322

0
Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «дум...

24.02.25

5 598

0
Обзор передовых моделей AI: какие модели изменят мир и как их использовать

Обзор

Обзор передовых моделей AI: какие модели изменят мир и как их использовать

Инновации

Модели ИИ разрабатываются с головокружительной скоростью всеми, от крупных технологических компаний вроде Google до стартапов вроде OpenAI и Anthropic...

18.02.25

5 404

0
Что известно о стартапе DeepSeek, который потряс мир технологий?

Инновации

Что известно о стартапе DeepSeek, который потряс мир технологий?

Стартапы

Удивительно эффективная и мощная китайская модель ИИ захватила технологическую отрасль штурмом. Он называется DeepSeek R1 и раздражает нервы на Уолл-с...

28.01.25

4 872

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (34)
Telegram
21% (89)
Youtube
36% (150)
Twitter
1% (5)
А что это?
16% (65)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».