Уилл Смит ест спагетти и другие странные тесты искусственного интеллекта, которые получили популярность в 2024 году

02.01.25

0

1 871

0

Когда компания выпускает новый видеогенератор искусственного интеллекта, вскоре кто-то использует его, чтобы снять видео актера Уилла Смита, который ест спагетти.

Это стало чем-то вроде мема, а также эталонным показателем: проверить, может ли новый видеогенератор реалистично отобразить Смита, который хлебает миску лапши. Сам Смит спародировал эту тенденцию в публикации в Instagram. 

тесты искусственного интеллекта, которые получили популярность в 2024 году
ИИ год назад и сейчас

Уилл Смит и макароны  лишь один из нескольких странных «неофициальных» тестов, которые захватили ИИ-сообщество штурмом в 2024 году. 16-летний разработчик создал приложение, которое дает ИИ контроль над Minecraft и проверяет его способность проектировать структуры. В другом месте британский программист создал платформу, где искусственный интеллект играет друг против друга в такие игры, как Pictionary и Connect 4.

Minecraft
Image Credits: ADONIS SINGH

Это не то, что больше нет академических тестов производительности ИИ. Так почему же более странные взорвались?

Во-первых, многие отраслевые стандарты ИИ мало что говорят обычному человеку. Компании часто ссылаются на способность своего искусственного интеллекта отвечать на вопросы на экзаменах по математической олимпиаде или находить вероятные решения для проблем уровня доктора философии. Однако большинство людей  в том числе и ваш  используют чат-ботов для таких вещей, как ответы на электронные письма и фундаментальные исследования.

Краудсорсинговые показатели отрасли не обязательно лучше или информативнее.

Возьмем, например, Chatbot Arena, общедоступный эталонный тест, за которым многие энтузиасты и разработчики искусственного интеллекта навязчиво следят. Chatbot Arena позволяет любому в Интернете оценивать, насколько хорошо искусственный интеллект выполняет определенные задачи, такие как создание веб-программы или генерирование изображения. Но оценщики, как правило, не являются репрезентативными — большинство из них происходят из кругов искусственного интеллекта и индустрии технологий — и отдают свои голоса на основе личных предпочтений, которые трудно определить.

Итан Моллик, профессор менеджмента Wharton, недавно указал в заметке на X еще одну проблему со многими индустриальными тестами ИИ: они не сравнивают производительность системы с производительностью среднего человека.

«Тот факт, что нет 30 различных эталонных показателей от различных организаций в медицине, законодательстве, качестве консультаций и т.д., является настоящим позором, поскольку люди используют системы для этих вещей, несмотря на это», — написал Моллик.
Источник: TechCrunch
Оставить комментарий

Актуальное

Бум искусственного интеллекта, как ожидается, будет движущей силой прибыльности развивающихся рынков в течение следующего десятилетия

Инвестиции

Бум искусственного интеллекта, как ожидается, будет движущей силой прибыльности развивающихся рынков в течение следующего десятилетия

Инвестиции

Фонды развивающихся рынков ориентируются на то, чтобы захватить бум искусственного интеллекта, и некоторые инвесторы прогнозируют, что стремительный р...

18.08.25

685

0
Как найти правильное карьерное призвание и уменьшить стресс

Бизнес

Как найти правильное карьерное призвание и уменьшить стресс

Бизнес

Как описано в книге «Лидерство без стресса», когда вы избавляетесь от стресса, вы задействуете свой пятый палец — духовный палец. Как лидер вы, вероят...

14.08.25

676

0
Квантовые вычисления могут стать следующим большим попутным ветром для коммерческой недвижимости

Аналитика

Квантовые вычисления могут стать следующим большим попутным ветром для коммерческой недвижимости

Аналитика

Так же, как искусственный интеллект превратил сектор центров обработки данных в золотую жилу, квантовые вычисления уже разворачивают собственную револ...

13.08.25

613

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

45 293

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

8 712

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

6 929

1
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

6 468

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

6 414

1

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (45)
Instagram
6% (22)
TikTok
9% (33)
Telegram
22% (85)
Youtube
35% (132)
Twitter
1% (5)
А что это?
15% (57)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».