Курс валют: $ 41,34 € 45,85

Курс Біткоїн: 84 396 USD

Пт, 4 квітня 2025, 9:59

Що таке «світові моделі» ШІ та чому вони важливі?

16.12.24

0

1 693

0

Моделі світу, також відомі як симулятори світу, деякі рекламують як наступну велику річ у ШІ.

Світові лабораторії Фей-Фея Лі, піонера штучного інтелекту, зібрали 230 мільйонів доларів для створення «великих моделей світу», а DeepMind найняв одного з творців відеогенератора OpenAI, Sora, для роботи над «симуляторами світу».

Що таке «світові моделі» ШІ та чому вони важливі?
Image Credits: Pixabay

Але що це за речі ?

Моделі світу черпають натхнення з ментальних моделей світу, створених людьми природним шляхом. Наш мозок бере абстрактні уявлення з наших органів чуття та формує їх у більш конкретне розуміння навколишнього світу, виробляючи те, що ми називали «моделями» задовго до того, як ШІ прийняв цю фразу. Прогнози, які наш мозок робить на основі цих моделей, впливають на те, як ми сприймаємо світ.

Моделювання світу

Хоча ця концепція існує десятиліттями, світові моделі нещодавно набули популярності частково завдяки їх багатообіцяючим застосуванням у сфері генеративного відео.

Хоча генеративна модель, навчена роками відео, може точно передбачити, що баскетбольний м’яч відскакує, вона насправді не має жодного уявлення, чому — так само, як мовні моделі насправді не розуміють понять, що стоять за словами та фразами. Але світова модель, яка навіть базово розуміє, чому баскетбольний м’яч так підстрибує, краще покаже, як він це робить.

Щоб увімкнути таке розуміння, моделі світу навчаються на низці даних, включаючи фотографії, аудіо, відео та текст, з метою створення внутрішніх уявлень про те, як улаштований світ, і здатності міркувати про наслідки дій.

«Глядач очікує, що світ, який він спостерігає, поводиться так само, як його реальність», — сказав Алекс Машрабов, колишній керівник відділу штучного інтелекту Snap і генеральний директор компанії Higgsfield.

Але краща генерація відео – лише верхівка айсберга для світових моделей. Дослідники, в тому числі головний науковець зі штучного інтелекту Meta Янн ЛеКун, кажуть, що колись ці моделі можна буде використовувати для складного прогнозування та планування як у цифровій, так і у фізичній сферах.

У своєму виступі на початку цього року Лекун описав, як модель світу може допомогти досягти бажаної мети за допомогою аргументації. Модель з базовим представленням «світу» (наприклад, відео брудної кімнати) з метою (чиста кімната) може запропонувати послідовність дій для досягнення цієї мети (застосувати пилосос, щоб підмітати, прибирати). посуд, випорожнюйте сміття) не тому, що це закономірність, яку він спостерігав, а тому, що він знає на більш глибокому рівні, як перейти від брудного до чистого.

«Нам потрібні машини, які розуміють світ; [машини], які можуть запам’ятовувати речі, які мають інтуїцію, мають здоровий глузд — речі, які можуть міркувати та планувати на тому ж рівні, що й люди», — сказав Лекун. «Незважаючи на те, що ви, можливо, чули від деяких із найбільш захоплених людей, поточні системи штучного інтелекту не здатні ні на що з цього».

Хоча Лекун вважає, що до моделей світу, які він собі уявляє, залишилося щонайменше десять років, сучасні моделі світу є багатообіцяючими як симулятори елементарної фізики.

OpenAI зазначає в блозі, що Sora, яку вона вважає світовою моделлю, може імітувати дії, подібні до того, як художник залишає мазки пензлем на полотні. Такі моделі , як Sora — і сама Sora — також можуть ефективно імітувати відеоігри . Наприклад, Sora може відтворити UI та ігровий світ, схожий на Minecraft.

«Майбутні моделі світу можуть створювати 3D-світи на вимогу для ігор, віртуальної фотографії тощо», — сказав співзасновник World Labs Джастін Джонсон в епізоді подкасту a16z.

«Ми вже маємо можливість створювати віртуальні інтерактивні світи, але це коштує сотень і сотень мільйонів доларів і купу часу на розробку», — сказав Джонсон. «Моделі світу дозволять вам отримати не просто зображення чи кліп, а повністю змодельований, яскравий та інтерактивний 3D-світ».

Високі бар'єри

Хоча концепція приваблива, багато технічних проблем стоять на шляху.

Навчання та запуск моделей світу вимагає величезної обчислювальної потужності навіть порівняно з об’ємом, який зараз використовують генеративні моделі. У той час як деякі з найновіших мовних моделей можуть працювати на сучасному смартфоні, Sora (імовірно, рання світова модель) потребуватиме тисяч графічних процесорів для навчання та роботи, особливо якщо їх використання стане звичним явищем.

Світові моделі, як і всі моделі штучного інтелекту, також галюцинують — і інтерналізують упередження у своїх навчальних даних. Світова модель, навчена здебільшого на відео сонячної погоди в європейських містах, може важко зрозуміти або зобразити корейські міста в снігових умовах, наприклад, або просто зробити це неправильно.

Загальний брак даних про навчання загрожує загострити ці проблеми, каже Машрабов.

«Ми бачили, що моделі справді обмежені поколіннями людей певного типу чи раси», — сказав він. Навчальні дані для моделі світу мають бути достатньо широкими, щоб охоплювати різноманітний набір сценаріїв, але також дуже специфічними для того, щоб штучний інтелект міг глибоко зрозуміти нюанси цих сценаріїв.

У нещодавній публікації генеральний директор стартапу зі штучним інтелектом Runway Крістобаль Валенсуела каже, що проблеми з даними та технікою заважають сучасним моделям точно відобразити поведінку мешканців світу (наприклад, людей і тварин). «Моделі потребуватимуть створення узгоджених карт навколишнього середовища, — сказав він, — а також здатності орієнтуватися та взаємодіяти в цьому середовищі».

Сучасні роботи обмежені в тому, що вони можуть робити, тому що вони не усвідомлюють навколишній світ (або власне тіло). Світові моделі могли б дати їм це усвідомлення, сказав Машрабов — принаймні до певної міри.

«Завдяки вдосконаленій моделі світу штучний інтелект міг би розвинути особисте розуміння будь-якого сценарію, у який він потрапив, — сказав він, — і почати обдумувати можливі рішення».
#ai
Залишити коментар

Актуальне

Інтерв’ю з Денисом Горбуновим: Експерт у електронній комерції та автор методології BRAND-UP

Бізнес

Інтерв’ю з Денисом Горбуновим: Експерт у електронній комерції та автор методології BRAND-UP

Інтерв'ю

Денис Горбунов — успішний підприємець та експерт у галузі електронної комерції з понад десятирічним досвідом. Почавши кар'єру в Україні, він пройшов ш...

03.04.25

278

0
Трамп починає світову торгівельну війну: наслідки для світової економіки від мит президента

Аналітика

Трамп починає світову торгівельну війну: наслідки для світової економіки від мит президента

Аналітика

Президент Дональд Трамп має намір оголосити про наймасштабніші торговельні обмеження США за останнє століття, що одним махом переверне повоєнну світов...

03.04.25

656

0
Ілон Маск очолив список найбагатших людей світу за версією Forbes. Хто у першій пʼятірці

Аналітика

Ілон Маск очолив список найбагатших людей світу за версією Forbes. Хто у першій пʼятірці

Аналітика

Засновник і гендиректор американських Tesla та SpaceX Ілон Маск став найбагатшою людиною у світі за версією Forbes, випередивши власника LVMH Бернара...

02.04.25

1 009

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Останні новини: 1 проста ідея пасивного доходу, яка допоможе вам розбагатіти в 2024 році

Огляд

Останні новини: 1 проста ідея пасивного доходу, яка допоможе вам розбагатіти в 2024 році

Традиційний майнінг криптовалют вимагає потужної обчислювальної потужності та спеціалізованого апаратного забезпечення, і перші майнери зіткнулися з в...

07.11.24

3 997

0
Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

3 883

0
Топ бізнес-ідей для підприємців-початківців

Бізнес

Топ бізнес-ідей для підприємців-початківців

Якщо ви подумуєте про початок бізнесу, вам слід подумати, чи відповідає ваша ідея тому, як люди живуть і підходять до своєї роботи. Якщо ви зможете ви...

28.09.23

3 566

1
Які будинки в передмісті Києва готові купувати у 2025 році? Дослідження очікувань покупців

Огляд

Які будинки в передмісті Києва готові купувати у 2025 році? Дослідження очікувань покупців

Нерухомість

Мрія про заміське життя стає реальністю для багатьох українців. Проте що саме шукають потенційні покупці у котеджному містечку? Ми провели дослідження...

14.02.25

3 527

0
Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Інновації

Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Стартапи

Напрочуд ефективна та потужна китайська модель ШІ захопила технологічну галузь штурмом. Він називається DeepSeek R1 і дратує нерви на Волл-стріт. Нов...

28.01.25

3 447

0
Які ІТ-компанії заробляють найбільше? ТОП-15

Аналітика

Які ІТ-компанії заробляють найбільше? ТОП-15

Аналітика

Виїзд ІТ-фахівців за кордон, мобілізаційні процеси, падіння попиту на ІТ-послуги та політично напружена ситуація в країні — основні причини зменшення...

23.12.24

3 431

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
13% (41)
Instagram
6% (20)
TikTok
9% (30)
Telegram
24% (76)
Youtube
32% (102)
Twitter
2% (5)
А що це?
15% (49)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».