Что такое «мировые модели» ИИ и почему они важны?

16.12.24

0

1 601

0

Модели мира, также известные как симуляторы мира, некоторые рекламируют как следующую великую вещь в ИИ.

Мировые лаборатории Фей-Фея Ли, пионера искусственного интеллекта, собрали 230 миллионов долларов для создания «больших моделей мира», а DeepMind нанял одного из создателей видеогенератора OpenAI, Sora, для работы над «симуляторами мира».

Что такое «мировые модели» ИИ и почему они важны?
Image Credits: Pixabay

Но что это за вещи?

Модели мира черпают вдохновение из ментальных моделей мира, созданных людьми естественным путем. Наш мозг берет абстрактные представления из наших органов чувств и формирует их в более конкретное понимание окружающего мира, производя то, что мы называли «моделями» задолго до того, как ИИ принял эту фразу. Прогнозы, которые наш мозг делает на основе этих моделей, влияют на то, как мы воспринимаем мир.

Моделирование мира

Хотя эта концепция существует десятилетиями, модели мира недавно приобрели популярность частично благодаря их многообещающим применениям в области генеративного видео.

Хотя генеративная модель, обученная годами видео, может точно предсказать, что баскетбольный мяч отскочит, она на самом деле не имеет никакого представления, почему — так же, как языковые модели на самом деле не понимают понятий, стоящих за словами и фразами. Но мировая модель, которая даже базово понимает, почему баскетбольный мяч так подпрыгивает, лучше покажет, как он это делает.

Чтобы включить такое понимание, модели мира обучаются на ряде данных, включая фотографии, аудио, видео и текст, с целью создания внутренних представлений о том, как устроен мир, и способности рассуждать о последствиях действий.

«Зритель ожидает, что мир, который он наблюдает, ведет себя так же, как его реальность», — сказал Алекс Машрабов, бывший руководитель отдела искусственного интеллекта Snap и генеральный директор компании Higgsfield.

Но лучшая генерация видео — лишь верхушка айсберга для мировых моделей. Исследователи, в том числе главный ученый по искусственному интеллекту Meta Янн ЛеКун, говорят, что когда-то эти модели можно будет использовать для сложного прогнозирования и планирования как в цифровой, так и в физической сферах.

В своем выступлении в начале этого года Лекун описал, как модель мира может помочь достичь желаемой цели с помощью аргументации. Модель с базовым представлением «мира» (например, видео грязной комнаты) с целью (чистая комната) может предложить последовательность действий для достижения этой цели (использовать пылесос, чтобы подметать, убирать). посуду, опорожняйте мусор) не потому, что это закономерность, которую он наблюдал, а потому, что он знает на более глубоком уровне, как перейти от грязного к чистому.

«Нам нужны машины, которые понимают мир, которые могут запоминать вещи, которые имеют интуицию, имеют здравый смысл — вещи, которые могут рассуждать и планировать на том же уровне, что и люди», — сказал Лекун. «Несмотря на то, что вы, возможно, слышали от некоторых из самых увлеченных людей, текущие системы искусственного интеллекта не способны ни на что из этого».

Хотя Лекун считает, что до моделей мира, которые он себе представляет, осталось по меньшей мере десять лет, современные модели мира являются многообещающими как симуляторы элементарной физики.

OpenAI отмечает в блоге, что Sora, которую она считает мировой моделью, может имитировать действия, подобные тому, как художник оставляет мазки кистью на холсте. Такие модели, как Sora — и сама Sora — также могут эффективно имитировать видеоигры. Например, Sora может воссоздать UI и игровой мир, похожий на Minecraft.

«Будущие модели мира могут создавать 3D-миры по требованию для игр, виртуальной фотографии и т.д.», — сказал соучредитель World Labs Джастин Джонсон в эпизоде подкаста a16z.
«Мы уже имеем возможность создавать виртуальные интерактивные миры, но это стоит сотен и сотен миллионов долларов и кучу времени на разработку», — сказал Джонсон. «Модели мира позволят вам получить не просто изображение или клип, а полностью смоделированный, яркий и интерактивный 3D-мир».

Высокие барьеры

Хотя концепция привлекательна, на пути стоят многие технические проблемы.

Обучение и запуск моделей мира требует огромной вычислительной мощности даже по сравнению с объемом, который в настоящее время используют генеративные модели. В то время как некоторые из новейших языковых моделей могут работать на современном смартфоне, Sora (вероятно, ранняя модель мира) потребует тысяч графических процессоров для обучения и работы, особенно если их использование станет обычным делом.

Мировые модели, как и все модели искусственного интеллекта, также галлюцинируют — и интернализируют предубеждения в своих обучающих данных. Мировая модель, обученная в основном на видео солнечной погоды в европейских городах, может с трудом понять или изобразить корейские города в снежных условиях, например, или просто сделать это неправильно.

Общая нехватка данных об обучении грозит обострить эти проблемы, говорит Машрабов.

«Мы видели, что модели действительно ограничены поколениями людей определенного типа или расы», — сказал он. Учебные данные для модели мира должны быть достаточно широкими, чтобы охватывать разнообразный набор сценариев, но также очень специфическими для того, чтобы искусственный интеллект мог глубоко понять нюансы этих сценариев.

В недавней публикации генеральный директор стартапа с искусственным интеллектом Runway Кристобаль Валенсуэла говорит, что проблемы с данными и техникой мешают современным моделям точно отразить поведение обитателей мира (например, людей и животных). «Модели потребуют создания согласованных карт окружающей среды, — сказал он, — а также способности ориентироваться и взаимодействовать в этой среде».

Современные роботы ограничены в том, что они могут делать, потому что они не осознают окружающий мир (или собственное тело). Мировые модели могли бы дать им это осознание, сказал Машрабов — по крайней мере до некоторой степени.

«Благодаря усовершенствованной модели мира искусственный интеллект мог бы развить личное понимание любого сценария, в который он попал, — сказал он, — и начать обдумывать возможные решения».
#ai
Оставить комментарий

Актуальное

Компания Oura сделала кольца для отслеживания состояния здоровья

Инновации

Компания Oura сделала кольца для отслеживания состояния здоровья

Инновации

Теперь, оцениваемая в 5,2 млрд долларов, Oura лидирует в конкурентной области, в которую также вовлечены такие тяжеловесы отрасли, как Samsung Electro...

01.03.25

1 126

0
В стремлении возродить мамонта компания Colossal Biosciences создала шерстистую мышь

Инновации

В стремлении возродить мамонта компания Colossal Biosciences создала шерстистую мышь

BioTech

Colossal Biosciences, известная своей целью возродить шерстистого мамонта к 2028 году, заявляет о стабильном прогрессе. Чтобы создать шерстистую мышь,...

02.03.25

2 179

0
ТОП-100 и Delo.ua отметили лидеров финансового сектора Украины: награждены лучшие банки, страховые и финансовые компании

Бизнес

ТОП-100 и Delo.ua отметили лидеров финансового сектора Украины: награждены лучшие банки, страховые и финансовые компании

Бизнес

Украинский рейтинговый журнал «ТОП-100. Рейтинги крупнейших» и деловой портал Delo.ua отметили лидеров среди банков, страховых компаний, МФО, платежны...

04.03.25

1 000

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Будущее финансов: криптоплатежи и их преимущества в современном мире

Инвестиции

Будущее финансов: криптоплатежи и их преимущества в современном мире

Криптовалюты уже стали неотъемлемой частью нашей жизни. Еще не так давно многие считали их не более чем «монетами в интернете», но сегодня это способ...

01.05.24

1 844

0
Что стоит знать о Dencun — важном обновлении сети Ethereum

Инвестиции

Что стоит знать о Dencun — важном обновлении сети Ethereum

Будучи самым ожидаемым хардфорком со времён Великого слияния, Dencun — важное обновление сети Ethereum — функционирует уже неделю. Что изменил апгрейд...

28.03.24

1 837

0
Лучшие программы Apple Watch для повышения вашей производительности

Обзор

Лучшие программы Apple Watch для повышения вашей производительности

Диджитал

Todoist Todoist – прекрасное приложение для управления задачами на Apple Watch, когда вы не хотите доставать iPhone. Программа позволяет создавать зад...

02.12.24

1 827

0
Появление Capcut от ByteDance угрожает Adobe и Canva

Бизнес

Появление Capcut от ByteDance угрожает Adobe и Canva

Диджитал

Приложение является оптимизированным инструментом для создания видео, особенно с эффектами, популярными на TikTok, социальной платформе, также принадл...

30.07.24

1 814

0
Украинский Headway во второй раз попал в список 150 самых влиятельных компаний мира по цифровому обучению 2024

Бизнес

Украинский Headway во второй раз попал в список 150 самых влиятельных компаний мира по цифровому обучению 2024

EdTech компания Headway второй год подряд попадает в список лучших компаний мира, трансформирующих цифровое обучение, GSV 150. Headway стал единственн...

26.02.24

1 806

0
Более 4 лет развития, глобальная экспансия и AI технологии: украинский Getpin привлек $400,000 от Presto Ventures

Более 4 лет развития, глобальная экспансия и AI технологии: украинский Getpin привлек $400,000 от Presto Ventures

Инвестиции

Getpin - это украинский стартап, SaaS-инструмент онлайн-маркетинга, который помогает бизнесу с физическими точками продаж привлекать клиентов, которые...

27.11.23

1 796

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
13% (41)
Instagram
6% (19)
TikTok
9% (28)
Telegram
24% (74)
Youtube
31% (97)
Twitter
2% (5)
А что это?
15% (47)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».