Уилл Смит ест спагетти и другие странные тесты искусственного интеллекта, которые получили популярность в 2024 году

02.01.25

0

2 071

0

Когда компания выпускает новый видеогенератор искусственного интеллекта, вскоре кто-то использует его, чтобы снять видео актера Уилла Смита, который ест спагетти.

Это стало чем-то вроде мема, а также эталонным показателем: проверить, может ли новый видеогенератор реалистично отобразить Смита, который хлебает миску лапши. Сам Смит спародировал эту тенденцию в публикации в Instagram. 

тесты искусственного интеллекта, которые получили популярность в 2024 году
ИИ год назад и сейчас

Уилл Смит и макароны  лишь один из нескольких странных «неофициальных» тестов, которые захватили ИИ-сообщество штурмом в 2024 году. 16-летний разработчик создал приложение, которое дает ИИ контроль над Minecraft и проверяет его способность проектировать структуры. В другом месте британский программист создал платформу, где искусственный интеллект играет друг против друга в такие игры, как Pictionary и Connect 4.

Minecraft
Image Credits: ADONIS SINGH

Это не то, что больше нет академических тестов производительности ИИ. Так почему же более странные взорвались?

Во-первых, многие отраслевые стандарты ИИ мало что говорят обычному человеку. Компании часто ссылаются на способность своего искусственного интеллекта отвечать на вопросы на экзаменах по математической олимпиаде или находить вероятные решения для проблем уровня доктора философии. Однако большинство людей  в том числе и ваш  используют чат-ботов для таких вещей, как ответы на электронные письма и фундаментальные исследования.

Краудсорсинговые показатели отрасли не обязательно лучше или информативнее.

Возьмем, например, Chatbot Arena, общедоступный эталонный тест, за которым многие энтузиасты и разработчики искусственного интеллекта навязчиво следят. Chatbot Arena позволяет любому в Интернете оценивать, насколько хорошо искусственный интеллект выполняет определенные задачи, такие как создание веб-программы или генерирование изображения. Но оценщики, как правило, не являются репрезентативными — большинство из них происходят из кругов искусственного интеллекта и индустрии технологий — и отдают свои голоса на основе личных предпочтений, которые трудно определить.

Итан Моллик, профессор менеджмента Wharton, недавно указал в заметке на X еще одну проблему со многими индустриальными тестами ИИ: они не сравнивают производительность системы с производительностью среднего человека.

«Тот факт, что нет 30 различных эталонных показателей от различных организаций в медицине, законодательстве, качестве консультаций и т.д., является настоящим позором, поскольку люди используют системы для этих вещей, несмотря на это», — написал Моллик.
Источник: TechCrunch
Оставить комментарий

Актуальное

Как использовать новые интеграции приложений ChatGPT

Бизнес

Как использовать новые интеграции приложений ChatGPT

Диджитал

OpenAI недавно запустил новые интеграции приложений в ChatGPT, что позволяет вам напрямую подключать свои учетные записи к ChatGPT и просить помощника...

29.10.25

922

0
Дети передают свое критическое мышление чат-ботам с искусственным интеллектом – вот как их защитить, говорят эксперты

Аналитика

Дети передают свое критическое мышление чат-ботам с искусственным интеллектом – вот как их защитить, говорят эксперты

Аналитика

Искусственный интеллект меняет рабочие места — и все чаще попадает в руки многих подростков и детей. От помощи с домашними заданиями до общения с «дру...

28.10.25

895

0
История успеха: 9 лет от домашней кухни до сделки с PepsiCo за $2 млрд.

Бизнес

История успеха: 9 лет от домашней кухни до сделки с PepsiCo за $2 млрд.

Бренды

В 2015 году Эллисон Эллсворт экспериментировала на кухне с различными рецептами напитков для полезного для кишечника, пытаясь сделать яблочный уксус в...

26.10.25

1 125

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

45 981

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

9 310

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

7 583

1
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

7 061

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

6 982

1

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (47)
Instagram
6% (22)
TikTok
8% (33)
Telegram
22% (87)
Youtube
35% (140)
Twitter
1% (5)
А что это?
16% (63)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».