Что такое «мировые модели» ИИ и почему они важны?

16.12.24

0

622

0

Модели мира, также известные как симуляторы мира, некоторые рекламируют как следующую великую вещь в ИИ.

Мировые лаборатории Фей-Фея Ли, пионера искусственного интеллекта, собрали 230 миллионов долларов для создания «больших моделей мира», а DeepMind нанял одного из создателей видеогенератора OpenAI, Sora, для работы над «симуляторами мира».

Что такое «мировые модели» ИИ и почему они важны?
Image Credits: Pixabay

Но что это за вещи?

Модели мира черпают вдохновение из ментальных моделей мира, созданных людьми естественным путем. Наш мозг берет абстрактные представления из наших органов чувств и формирует их в более конкретное понимание окружающего мира, производя то, что мы называли «моделями» задолго до того, как ИИ принял эту фразу. Прогнозы, которые наш мозг делает на основе этих моделей, влияют на то, как мы воспринимаем мир.

Моделирование мира

Хотя эта концепция существует десятилетиями, модели мира недавно приобрели популярность частично благодаря их многообещающим применениям в области генеративного видео.

Хотя генеративная модель, обученная годами видео, может точно предсказать, что баскетбольный мяч отскочит, она на самом деле не имеет никакого представления, почему — так же, как языковые модели на самом деле не понимают понятий, стоящих за словами и фразами. Но мировая модель, которая даже базово понимает, почему баскетбольный мяч так подпрыгивает, лучше покажет, как он это делает.

Чтобы включить такое понимание, модели мира обучаются на ряде данных, включая фотографии, аудио, видео и текст, с целью создания внутренних представлений о том, как устроен мир, и способности рассуждать о последствиях действий.

«Зритель ожидает, что мир, который он наблюдает, ведет себя так же, как его реальность», — сказал Алекс Машрабов, бывший руководитель отдела искусственного интеллекта Snap и генеральный директор компании Higgsfield.

Но лучшая генерация видео — лишь верхушка айсберга для мировых моделей. Исследователи, в том числе главный ученый по искусственному интеллекту Meta Янн ЛеКун, говорят, что когда-то эти модели можно будет использовать для сложного прогнозирования и планирования как в цифровой, так и в физической сферах.

В своем выступлении в начале этого года Лекун описал, как модель мира может помочь достичь желаемой цели с помощью аргументации. Модель с базовым представлением «мира» (например, видео грязной комнаты) с целью (чистая комната) может предложить последовательность действий для достижения этой цели (использовать пылесос, чтобы подметать, убирать). посуду, опорожняйте мусор) не потому, что это закономерность, которую он наблюдал, а потому, что он знает на более глубоком уровне, как перейти от грязного к чистому.

«Нам нужны машины, которые понимают мир, которые могут запоминать вещи, которые имеют интуицию, имеют здравый смысл — вещи, которые могут рассуждать и планировать на том же уровне, что и люди», — сказал Лекун. «Несмотря на то, что вы, возможно, слышали от некоторых из самых увлеченных людей, текущие системы искусственного интеллекта не способны ни на что из этого».

Хотя Лекун считает, что до моделей мира, которые он себе представляет, осталось по меньшей мере десять лет, современные модели мира являются многообещающими как симуляторы элементарной физики.

OpenAI отмечает в блоге, что Sora, которую она считает мировой моделью, может имитировать действия, подобные тому, как художник оставляет мазки кистью на холсте. Такие модели, как Sora — и сама Sora — также могут эффективно имитировать видеоигры. Например, Sora может воссоздать UI и игровой мир, похожий на Minecraft.

«Будущие модели мира могут создавать 3D-миры по требованию для игр, виртуальной фотографии и т.д.», — сказал соучредитель World Labs Джастин Джонсон в эпизоде подкаста a16z.
«Мы уже имеем возможность создавать виртуальные интерактивные миры, но это стоит сотен и сотен миллионов долларов и кучу времени на разработку», — сказал Джонсон. «Модели мира позволят вам получить не просто изображение или клип, а полностью смоделированный, яркий и интерактивный 3D-мир».

Высокие барьеры

Хотя концепция привлекательна, на пути стоят многие технические проблемы.

Обучение и запуск моделей мира требует огромной вычислительной мощности даже по сравнению с объемом, который в настоящее время используют генеративные модели. В то время как некоторые из новейших языковых моделей могут работать на современном смартфоне, Sora (вероятно, ранняя модель мира) потребует тысяч графических процессоров для обучения и работы, особенно если их использование станет обычным делом.

Мировые модели, как и все модели искусственного интеллекта, также галлюцинируют — и интернализируют предубеждения в своих обучающих данных. Мировая модель, обученная в основном на видео солнечной погоды в европейских городах, может с трудом понять или изобразить корейские города в снежных условиях, например, или просто сделать это неправильно.

Общая нехватка данных об обучении грозит обострить эти проблемы, говорит Машрабов.

«Мы видели, что модели действительно ограничены поколениями людей определенного типа или расы», — сказал он. Учебные данные для модели мира должны быть достаточно широкими, чтобы охватывать разнообразный набор сценариев, но также очень специфическими для того, чтобы искусственный интеллект мог глубоко понять нюансы этих сценариев.

В недавней публикации генеральный директор стартапа с искусственным интеллектом Runway Кристобаль Валенсуэла говорит, что проблемы с данными и техникой мешают современным моделям точно отразить поведение обитателей мира (например, людей и животных). «Модели потребуют создания согласованных карт окружающей среды, — сказал он, — а также способности ориентироваться и взаимодействовать в этой среде».

Современные роботы ограничены в том, что они могут делать, потому что они не осознают окружающий мир (или собственное тело). Мировые модели могли бы дать им это осознание, сказал Машрабов — по крайней мере до некоторой степени.

«Благодаря усовершенствованной модели мира искусственный интеллект мог бы развить личное понимание любого сценария, в который он попал, — сказал он, — и начать обдумывать возможные решения».
#ai
Оставить комментарий

Актуальное

Что такое «мировые модели» ИИ и почему они важны?

Инновации

Что такое «мировые модели» ИИ и почему они важны?

Инновации

Модели мира, также известные как симуляторы мира, некоторые рекламируют как следующую великую вещь в ИИ. Мировые лаборатории Фей-Фея Ли, пионера искус...

16.12.24

622

0
Автосервис, нанимающий ветеранов, производитель меда из Луганщины и приложение для онкопациентов: малые бизнесы получили 3 750 000 гривен на развитие своего дела

Бизнес

Автосервис, нанимающий ветеранов, производитель меда из Луганщины и приложение для онкопациентов: малые бизнесы получили 3 750 000 гривен на развитие своего дела

Бизнес

Среди десяти финалистов проекта «Бизнес-трамплин 2.0» от ROZETKA и Visa профессиональное жюри выбрало семерых победителей: пять малых и два ветерански...

12.12.24

1 159

0
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

2 102

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Рассматриваем стратегию компании Inditex бренда Zara в сфере торговой недвижимости

Рассматриваем стратегию компании Inditex бренда Zara в сфере торговой недвижимости

Каждый успешный розничный продавец имеет свои секреты успеха, и Zara, одна из жемчужин Inditex Group, не исключение. Сегодня мы рассматриваем стратеги...

08.11.23

2 006

0
5 причин, по которым вашему бизнесу нужны игры на сплочение коллектива

Бизнес

5 причин, по которым вашему бизнесу нужны игры на сплочение коллектива

Бизнес

Хотите создать команду-победителя в своем бизнесе? Одним из преимуществ добавления игр на сплочение коллектива к социальным мероприятиям для сотрудник...

12.11.24

1 977

0
Раскрытие бизнес-потенциала: учение «Матрицы»

Раскрытие бизнес-потенциала: учение «Матрицы»

«Матрица» — это научно-фантастический фильм, который может предложить увлекательные уроки для бизнеса, особенно в области инноваций, стратегии и лидер...

22.01.24

1 964

0
Криптомир в цифрах: Обзор и прогнозы на 2024 год

Аналитика

Криптомир в цифрах: Обзор и прогнозы на 2024 год

27 декабря Bitcoin (BTC) удивил криптоинвесторов тем, что превысил отметку в 43 000$ за монету. В ноябре другие криптовалюты последовали его примеру и...

28.12.23

1 924

0
Украинский IT-стартап запустил сбор на Kickstarter

Украинский IT-стартап запустил сбор на Kickstarter

Украинский IT-стартап запустил сбор на Kickstarter. Цель - минимум $7000, главная цель - $100 000 15 ноября украинский IT-стартап Nanit Robot запустил...

17.11.23

1 919

1
Чем вызван отток клиентов с украинского рынка IT в 2023 и как этому помочь

Чем вызван отток клиентов с украинского рынка IT в 2023 и как этому помочь

Последние несколько лет были чрезвычайно тяжелыми для IT-сектора Украины. Начиная с коронавируса и продолжая полномасштабным вторжением, страна не мог...

23.01.24

1 913

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (35)
Instagram
6% (17)
TikTok
9% (25)
Telegram
25% (71)
Youtube
30% (85)
Twitter
2% (5)
А что это?
15% (43)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».