Що таке «світові моделі» ШІ та чому вони важливі?

16.12.24

0

593

0

Моделі світу, також відомі як симулятори світу, деякі рекламують як наступну велику річ у ШІ.

Світові лабораторії Фей-Фея Лі, піонера штучного інтелекту, зібрали 230 мільйонів доларів для створення «великих моделей світу», а DeepMind найняв одного з творців відеогенератора OpenAI, Sora, для роботи над «симуляторами світу».

Що таке «світові моделі» ШІ та чому вони важливі?
Image Credits: Pixabay

Але що це за речі ?

Моделі світу черпають натхнення з ментальних моделей світу, створених людьми природним шляхом. Наш мозок бере абстрактні уявлення з наших органів чуття та формує їх у більш конкретне розуміння навколишнього світу, виробляючи те, що ми називали «моделями» задовго до того, як ШІ прийняв цю фразу. Прогнози, які наш мозок робить на основі цих моделей, впливають на те, як ми сприймаємо світ.

Моделювання світу

Хоча ця концепція існує десятиліттями, світові моделі нещодавно набули популярності частково завдяки їх багатообіцяючим застосуванням у сфері генеративного відео.

Хоча генеративна модель, навчена роками відео, може точно передбачити, що баскетбольний м’яч відскакує, вона насправді не має жодного уявлення, чому — так само, як мовні моделі насправді не розуміють понять, що стоять за словами та фразами. Але світова модель, яка навіть базово розуміє, чому баскетбольний м’яч так підстрибує, краще покаже, як він це робить.

Щоб увімкнути таке розуміння, моделі світу навчаються на низці даних, включаючи фотографії, аудіо, відео та текст, з метою створення внутрішніх уявлень про те, як улаштований світ, і здатності міркувати про наслідки дій.

«Глядач очікує, що світ, який він спостерігає, поводиться так само, як його реальність», — сказав Алекс Машрабов, колишній керівник відділу штучного інтелекту Snap і генеральний директор компанії Higgsfield.

Але краща генерація відео – лише верхівка айсберга для світових моделей. Дослідники, в тому числі головний науковець зі штучного інтелекту Meta Янн ЛеКун, кажуть, що колись ці моделі можна буде використовувати для складного прогнозування та планування як у цифровій, так і у фізичній сферах.

У своєму виступі на початку цього року Лекун описав, як модель світу може допомогти досягти бажаної мети за допомогою аргументації. Модель з базовим представленням «світу» (наприклад, відео брудної кімнати) з метою (чиста кімната) може запропонувати послідовність дій для досягнення цієї мети (застосувати пилосос, щоб підмітати, прибирати). посуд, випорожнюйте сміття) не тому, що це закономірність, яку він спостерігав, а тому, що він знає на більш глибокому рівні, як перейти від брудного до чистого.

«Нам потрібні машини, які розуміють світ; [машини], які можуть запам’ятовувати речі, які мають інтуїцію, мають здоровий глузд — речі, які можуть міркувати та планувати на тому ж рівні, що й люди», — сказав Лекун. «Незважаючи на те, що ви, можливо, чули від деяких із найбільш захоплених людей, поточні системи штучного інтелекту не здатні ні на що з цього».

Хоча Лекун вважає, що до моделей світу, які він собі уявляє, залишилося щонайменше десять років, сучасні моделі світу є багатообіцяючими як симулятори елементарної фізики.

OpenAI зазначає в блозі, що Sora, яку вона вважає світовою моделлю, може імітувати дії, подібні до того, як художник залишає мазки пензлем на полотні. Такі моделі , як Sora — і сама Sora — також можуть ефективно імітувати відеоігри . Наприклад, Sora може відтворити UI та ігровий світ, схожий на Minecraft.

«Майбутні моделі світу можуть створювати 3D-світи на вимогу для ігор, віртуальної фотографії тощо», — сказав співзасновник World Labs Джастін Джонсон в епізоді подкасту a16z.

«Ми вже маємо можливість створювати віртуальні інтерактивні світи, але це коштує сотень і сотень мільйонів доларів і купу часу на розробку», — сказав Джонсон. «Моделі світу дозволять вам отримати не просто зображення чи кліп, а повністю змодельований, яскравий та інтерактивний 3D-світ».

Високі бар'єри

Хоча концепція приваблива, багато технічних проблем стоять на шляху.

Навчання та запуск моделей світу вимагає величезної обчислювальної потужності навіть порівняно з об’ємом, який зараз використовують генеративні моделі. У той час як деякі з найновіших мовних моделей можуть працювати на сучасному смартфоні, Sora (імовірно, рання світова модель) потребуватиме тисяч графічних процесорів для навчання та роботи, особливо якщо їх використання стане звичним явищем.

Світові моделі, як і всі моделі штучного інтелекту, також галюцинують — і інтерналізують упередження у своїх навчальних даних. Світова модель, навчена здебільшого на відео сонячної погоди в європейських містах, може важко зрозуміти або зобразити корейські міста в снігових умовах, наприклад, або просто зробити це неправильно.

Загальний брак даних про навчання загрожує загострити ці проблеми, каже Машрабов.

«Ми бачили, що моделі справді обмежені поколіннями людей певного типу чи раси», — сказав він. Навчальні дані для моделі світу мають бути достатньо широкими, щоб охоплювати різноманітний набір сценаріїв, але також дуже специфічними для того, щоб штучний інтелект міг глибоко зрозуміти нюанси цих сценаріїв.

У нещодавній публікації генеральний директор стартапу зі штучним інтелектом Runway Крістобаль Валенсуела каже, що проблеми з даними та технікою заважають сучасним моделям точно відобразити поведінку мешканців світу (наприклад, людей і тварин). «Моделі потребуватимуть створення узгоджених карт навколишнього середовища, — сказав він, — а також здатності орієнтуватися та взаємодіяти в цьому середовищі».

Сучасні роботи обмежені в тому, що вони можуть робити, тому що вони не усвідомлюють навколишній світ (або власне тіло). Світові моделі могли б дати їм це усвідомлення, сказав Машрабов — принаймні до певної міри.

«Завдяки вдосконаленій моделі світу штучний інтелект міг би розвинути особисте розуміння будь-якого сценарію, у який він потрапив, — сказав він, — і почати обдумувати можливі рішення».
#ai
Залишити коментар

Актуальне

Що таке «світові моделі» ШІ та чому вони важливі?

Інновації

Що таке «світові моделі» ШІ та чому вони важливі?

Інновації

Моделі світу, також відомі як симулятори світу, деякі рекламують як наступну велику річ у ШІ. Світові лабораторії Фей-Фея Лі, піонера штучного інтелек...

16.12.24

593

0
Автосервіс, який наймає ветеранів, виробник меду з Луганщини та застосунок для онкопацієнтів: малі бізнеси отримали 3 750 000 гривень на розвиток своєї справи

Бізнес

Автосервіс, який наймає ветеранів, виробник меду з Луганщини та застосунок для онкопацієнтів: малі бізнеси отримали 3 750 000 гривень на розвиток своєї справи

Бізнес

Серед десятьох фіналістів проєкту «Бізнес-трамплін 2.0» від ROZETKA та Visa професійне журі обрало сімох переможців: п’ять малих та два ветеранські бі...

12.12.24

1 136

0
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

1 982

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

5 794

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

4 268

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

4 017

1
Головні біотехнологічні інновації 2023 року

Головні біотехнологічні інновації 2023 року

BioTech

У світі біотехнології кожен рік приносить приголомшливі інновації та переломні моменти, що сприяють розв'язанню складних проблем і поліпшенню якості ж...

06.10.23

3 639

0
Останні новини: 1 проста ідея пасивного доходу, яка допоможе вам розбагатіти в 2024 році

Огляд

Останні новини: 1 проста ідея пасивного доходу, яка допоможе вам розбагатіти в 2024 році

Традиційний майнінг криптовалют вимагає потужної обчислювальної потужності та спеціалізованого апаратного забезпечення, і перші майнери зіткнулися з в...

07.11.24

3 398

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (35)
Instagram
6% (17)
TikTok
9% (25)
Telegram
25% (71)
Youtube
30% (85)
Twitter
2% (5)
А що це?
15% (43)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».