Що таке «світові моделі» ШІ та чому вони важливі?

16.12.24

0

829

0

Моделі світу, також відомі як симулятори світу, деякі рекламують як наступну велику річ у ШІ.

Світові лабораторії Фей-Фея Лі, піонера штучного інтелекту, зібрали 230 мільйонів доларів для створення «великих моделей світу», а DeepMind найняв одного з творців відеогенератора OpenAI, Sora, для роботи над «симуляторами світу».

Що таке «світові моделі» ШІ та чому вони важливі?
Image Credits: Pixabay

Але що це за речі ?

Моделі світу черпають натхнення з ментальних моделей світу, створених людьми природним шляхом. Наш мозок бере абстрактні уявлення з наших органів чуття та формує їх у більш конкретне розуміння навколишнього світу, виробляючи те, що ми називали «моделями» задовго до того, як ШІ прийняв цю фразу. Прогнози, які наш мозок робить на основі цих моделей, впливають на те, як ми сприймаємо світ.

Моделювання світу

Хоча ця концепція існує десятиліттями, світові моделі нещодавно набули популярності частково завдяки їх багатообіцяючим застосуванням у сфері генеративного відео.

Хоча генеративна модель, навчена роками відео, може точно передбачити, що баскетбольний м’яч відскакує, вона насправді не має жодного уявлення, чому — так само, як мовні моделі насправді не розуміють понять, що стоять за словами та фразами. Але світова модель, яка навіть базово розуміє, чому баскетбольний м’яч так підстрибує, краще покаже, як він це робить.

Щоб увімкнути таке розуміння, моделі світу навчаються на низці даних, включаючи фотографії, аудіо, відео та текст, з метою створення внутрішніх уявлень про те, як улаштований світ, і здатності міркувати про наслідки дій.

«Глядач очікує, що світ, який він спостерігає, поводиться так само, як його реальність», — сказав Алекс Машрабов, колишній керівник відділу штучного інтелекту Snap і генеральний директор компанії Higgsfield.

Але краща генерація відео – лише верхівка айсберга для світових моделей. Дослідники, в тому числі головний науковець зі штучного інтелекту Meta Янн ЛеКун, кажуть, що колись ці моделі можна буде використовувати для складного прогнозування та планування як у цифровій, так і у фізичній сферах.

У своєму виступі на початку цього року Лекун описав, як модель світу може допомогти досягти бажаної мети за допомогою аргументації. Модель з базовим представленням «світу» (наприклад, відео брудної кімнати) з метою (чиста кімната) може запропонувати послідовність дій для досягнення цієї мети (застосувати пилосос, щоб підмітати, прибирати). посуд, випорожнюйте сміття) не тому, що це закономірність, яку він спостерігав, а тому, що він знає на більш глибокому рівні, як перейти від брудного до чистого.

«Нам потрібні машини, які розуміють світ; [машини], які можуть запам’ятовувати речі, які мають інтуїцію, мають здоровий глузд — речі, які можуть міркувати та планувати на тому ж рівні, що й люди», — сказав Лекун. «Незважаючи на те, що ви, можливо, чули від деяких із найбільш захоплених людей, поточні системи штучного інтелекту не здатні ні на що з цього».

Хоча Лекун вважає, що до моделей світу, які він собі уявляє, залишилося щонайменше десять років, сучасні моделі світу є багатообіцяючими як симулятори елементарної фізики.

OpenAI зазначає в блозі, що Sora, яку вона вважає світовою моделлю, може імітувати дії, подібні до того, як художник залишає мазки пензлем на полотні. Такі моделі , як Sora — і сама Sora — також можуть ефективно імітувати відеоігри . Наприклад, Sora може відтворити UI та ігровий світ, схожий на Minecraft.

«Майбутні моделі світу можуть створювати 3D-світи на вимогу для ігор, віртуальної фотографії тощо», — сказав співзасновник World Labs Джастін Джонсон в епізоді подкасту a16z.

«Ми вже маємо можливість створювати віртуальні інтерактивні світи, але це коштує сотень і сотень мільйонів доларів і купу часу на розробку», — сказав Джонсон. «Моделі світу дозволять вам отримати не просто зображення чи кліп, а повністю змодельований, яскравий та інтерактивний 3D-світ».

Високі бар'єри

Хоча концепція приваблива, багато технічних проблем стоять на шляху.

Навчання та запуск моделей світу вимагає величезної обчислювальної потужності навіть порівняно з об’ємом, який зараз використовують генеративні моделі. У той час як деякі з найновіших мовних моделей можуть працювати на сучасному смартфоні, Sora (імовірно, рання світова модель) потребуватиме тисяч графічних процесорів для навчання та роботи, особливо якщо їх використання стане звичним явищем.

Світові моделі, як і всі моделі штучного інтелекту, також галюцинують — і інтерналізують упередження у своїх навчальних даних. Світова модель, навчена здебільшого на відео сонячної погоди в європейських містах, може важко зрозуміти або зобразити корейські міста в снігових умовах, наприклад, або просто зробити це неправильно.

Загальний брак даних про навчання загрожує загострити ці проблеми, каже Машрабов.

«Ми бачили, що моделі справді обмежені поколіннями людей певного типу чи раси», — сказав він. Навчальні дані для моделі світу мають бути достатньо широкими, щоб охоплювати різноманітний набір сценаріїв, але також дуже специфічними для того, щоб штучний інтелект міг глибоко зрозуміти нюанси цих сценаріїв.

У нещодавній публікації генеральний директор стартапу зі штучним інтелектом Runway Крістобаль Валенсуела каже, що проблеми з даними та технікою заважають сучасним моделям точно відобразити поведінку мешканців світу (наприклад, людей і тварин). «Моделі потребуватимуть створення узгоджених карт навколишнього середовища, — сказав він, — а також здатності орієнтуватися та взаємодіяти в цьому середовищі».

Сучасні роботи обмежені в тому, що вони можуть робити, тому що вони не усвідомлюють навколишній світ (або власне тіло). Світові моделі могли б дати їм це усвідомлення, сказав Машрабов — принаймні до певної міри.

«Завдяки вдосконаленій моделі світу штучний інтелект міг би розвинути особисте розуміння будь-якого сценарію, у який він потрапив, — сказав він, — і почати обдумувати можливі рішення».
#ai
Залишити коментар

Актуальне

10 потужних стратегій для залучення можливостей зворотних посилань

Бізнес

10 потужних стратегій для залучення можливостей зворотних посилань

Ecommerce

Знаходження правильних можливостей для вставки посилань має важливе значення для підвищення ефективності SEO вашого веб-сайту та підвищення його видим...

19.12.24

563

0
GET Business Festival об’єднав український бізнес заради розвитку під час війни

Бізнес

GET Business Festival об’єднав український бізнес заради розвитку під час війни

Бізнес

12 грудня GET Business Festival об’єднав досвід понад 100 бізнес-лідерів, які на трьох сценах обговорювали стратегії розвитку, інновації та партнерсь...

18.12.24

553

0
Що таке «світові моделі» ШІ та чому вони важливі?

Інновації

Що таке «світові моделі» ШІ та чому вони важливі?

Інновації

Моделі світу, також відомі як симулятори світу, деякі рекламують як наступну велику річ у ШІ. Світові лабораторії Фей-Фея Лі, піонера штучного інтелек...

16.12.24

829

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Що таке «світові моделі» ШІ та чому вони важливі?

Інновації

Що таке «світові моделі» ШІ та чому вони важливі?

Інновації

Моделі світу, також відомі як симулятори світу, деякі рекламують як наступну велику річ у ШІ. Світові лабораторії Фей-Фея Лі, піонера штучного інтелек...

16.12.24

829

0
10 потужних стратегій для залучення можливостей зворотних посилань

Бізнес

10 потужних стратегій для залучення можливостей зворотних посилань

Ecommerce

Знаходження правильних можливостей для вставки посилань має важливе значення для підвищення ефективності SEO вашого веб-сайту та підвищення його видим...

19.12.24

563

0
GET Business Festival об’єднав український бізнес заради розвитку під час війни

Бізнес

GET Business Festival об’єднав український бізнес заради розвитку під час війни

Бізнес

12 грудня GET Business Festival об’єднав досвід понад 100 бізнес-лідерів, які на трьох сценах обговорювали стратегії розвитку, інновації та партнерсь...

18.12.24

553

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (35)
Instagram
6% (17)
TikTok
9% (25)
Telegram
25% (71)
Youtube
30% (86)
Twitter
2% (5)
А що це?
15% (43)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».