Google DeepMind представляє нову відеомодель, щоб конкурувати з Sora

17.12.24

0

1 786

0

Google DeepMind, флагманська дослідницька лабораторія Google зі штучного інтелекту, хоче перемогти OpenAI у ШІ для генерації відео.

У понеділок DeepMind анонсувала Veo 2, штучний інтелект для створення відео наступного покоління та наступника Veo. Veo 2 може створювати кліпи тривалістю понад дві хвилини з роздільністю до 4k (4096 x 2160 пікселів).

В експериментальному інструменті Google для створення відео VideoFX, де Veo 2 тепер ексклюзивно доступний, відео мають максимальну роздільну здатність 720p і тривалість вісім секунд. (Sora може створювати до 1080p кліпи тривалістю 20 секунд).

Елі Коллінз, віце-президент із продуктів у DeepMind, також повідомив, що Google зробить Veo 2 доступним через свою платформу розробника Vertex AI, «якщо модель буде готова до використання в масштабі».

Google DeepMind
Google DeepMind

«Протягом наступних місяців ми продовжуватимемо ітерацію на основі відгуків користувачів, — сказав Коллінз, — і спробуємо інтегрувати оновлені можливості Veo 2 у переконливі варіанти використання в екосистемі Google. Ми очікуємо щоб поділитися новинами наступного року».

Як і Veo, Veo 2 може генерувати відео за допомогою текстової підказки наприклад, «Автомобіль мчить автострадою» або тексту та контрольного зображення.

DeepMind каже, що модель, яка може створювати кліпи в різних стилях, має покращене «розуміння» фізики та елементів керування камерою, а також створює «чіткіші» кадри. Текстури та зображення в кліпах є чіткішими, особливо в сценах із великою кількістю рухів. Що стосується вдосконалених елементів керування камерою, вони дають змогу Veo 2 точніше розташовувати віртуальну «камеру» у відео, які вона створює, і переміщувати цю камеру, щоб знімати об’єкти та людей під різними кутами.

DeepMind також стверджує, що Veo 2 може більш реалістично моделювати рух, динаміку рідини (наприклад, коли каву наливають у кухоль) і властивості світла (такі як тіні та відображення). Це включає в себе різні лінзи та кінематографічні ефекти, каже DeepMind, а також «нюанси» людського виразу.

Коллінз визнав, що є над чим працювати.

«Узгодженість і послідовність — це сфери для зростання», — сказав він. «Veo може постійно дотримуватися підказки протягом кількох хвилин, але [він не може] дотримуватися складних підказок протягом довгих горизонтів. Так само постійність характеру може бути проблемою. Також є куди вдосконалюватись у створенні складних деталей, швидких і складних рухів і продовжувати розширювати межі реалізму».

DeepMind продовжує працювати з художниками та продюсерами, щоб удосконалити свої моделі та інструменти створення відео, додав Коллінз.

Джерело: TechCrunch

Залишити коментар

Актуальне

Франція хоче розгорнути армію роботів до 2040 року

Аналітика

Франція хоче розгорнути армію роботів до 2040 року

Аналітика

Хоча збройні конфлікти стають дедалі рідшими з плином десятиліть, світові військові витрати різко зростають з кожним роком, досягаючи безпрецедентних...

03.06.25

509

0
SEO просування в епоху ШІ: як бізнесу адаптуватися до нової реальності

Інновації

SEO просування в епоху ШІ: як бізнесу адаптуватися до нової реальності

Інновації

Світ цифрового маркетингу стрімко змінюється під впливом штучного інтелекту. Пошукові системи змінюються: тепер до них інтегруються мовні моделі, які...

02.06.25

571

0
Чому штучний інтелект такий дорогий

Інновації

Чому штучний інтелект такий дорогий

Інновації

Минуло трохи більше півтора року з того часу, як весь світ накрила хвиля ейфорії від генеративного штучного інтелекту. За цей час великі технокорпорац...

02.06.25

679

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

44 844

0
Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

8 269

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

6 487

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

6 069

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

6 052

1

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (43)
Instagram
6% (21)
TikTok
9% (32)
Telegram
23% (82)
Youtube
33% (116)
Twitter
1% (5)
А що це?
15% (51)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».