Уилл Смит ест спагетти и другие странные тесты искусственного интеллекта, которые получили популярность в 2024 году

02.01.25

0

2 597

0

Когда компания выпускает новый видеогенератор искусственного интеллекта, вскоре кто-то использует его, чтобы снять видео актера Уилла Смита, который ест спагетти.

Это стало чем-то вроде мема, а также эталонным показателем: проверить, может ли новый видеогенератор реалистично отобразить Смита, который хлебает миску лапши. Сам Смит спародировал эту тенденцию в публикации в Instagram. 

тесты искусственного интеллекта, которые получили популярность в 2024 году
ИИ год назад и сейчас

Уилл Смит и макароны  лишь один из нескольких странных «неофициальных» тестов, которые захватили ИИ-сообщество штурмом в 2024 году. 16-летний разработчик создал приложение, которое дает ИИ контроль над Minecraft и проверяет его способность проектировать структуры. В другом месте британский программист создал платформу, где искусственный интеллект играет друг против друга в такие игры, как Pictionary и Connect 4.

Minecraft
Image Credits: ADONIS SINGH

Это не то, что больше нет академических тестов производительности ИИ. Так почему же более странные взорвались?

Во-первых, многие отраслевые стандарты ИИ мало что говорят обычному человеку. Компании часто ссылаются на способность своего искусственного интеллекта отвечать на вопросы на экзаменах по математической олимпиаде или находить вероятные решения для проблем уровня доктора философии. Однако большинство людей  в том числе и ваш  используют чат-ботов для таких вещей, как ответы на электронные письма и фундаментальные исследования.

Краудсорсинговые показатели отрасли не обязательно лучше или информативнее.

Возьмем, например, Chatbot Arena, общедоступный эталонный тест, за которым многие энтузиасты и разработчики искусственного интеллекта навязчиво следят. Chatbot Arena позволяет любому в Интернете оценивать, насколько хорошо искусственный интеллект выполняет определенные задачи, такие как создание веб-программы или генерирование изображения. Но оценщики, как правило, не являются репрезентативными — большинство из них происходят из кругов искусственного интеллекта и индустрии технологий — и отдают свои голоса на основе личных предпочтений, которые трудно определить.

Итан Моллик, профессор менеджмента Wharton, недавно указал в заметке на X еще одну проблему со многими индустриальными тестами ИИ: они не сравнивают производительность системы с производительностью среднего человека.

«Тот факт, что нет 30 различных эталонных показателей от различных организаций в медицине, законодательстве, качестве консультаций и т.д., является настоящим позором, поскольку люди используют системы для этих вещей, несмотря на это», — написал Моллик.
Источник: TechCrunch
Оставить комментарий

Актуальное

Роскошь больше не в моде? Почему акции LVMH начали год хуже всего в истории

Аналитика

Роскошь больше не в моде? Почему акции LVMH начали год хуже всего в истории

Аналитика

Акции LVMH начали год хуже всего за всю историю наблюдений, поскольку влияние войны на Ближнем Востоке омрачает мировые экономические перспективы и сн...

01.04.26

454

0
Не дайте им сказать «прощай»: как спасти отношения с клиентом в последний момент

Бизнес

Не дайте им сказать «прощай»: как спасти отношения с клиентом в последний момент

Бизнес

Ежедневно клиенты решают покидать компании, которые могут даже не осознавать, что они недовольны. Обычно они не отправляют гневные электронные письма,...

30.03.26

772

0
AI First Media: новая модель медиа в эпоху искусственного интеллекта

Инновации

AI First Media: новая модель медиа в эпоху искусственного интеллекта

Инновации

В этой статье я формулирую авторскую концепцию AI First Media — новой модели медиа в эпоху искусственного интеллекта. За последние 30 лет медиа пережи...

29.03.26

881

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

9 946

1
Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интел...

26.05.25

6 551

0
Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «дум...

24.02.25

5 838

0
Обзор передовых моделей AI: какие модели изменят мир и как их использовать

Обзор

Обзор передовых моделей AI: какие модели изменят мир и как их использовать

Инновации

Модели ИИ разрабатываются с головокружительной скоростью всеми, от крупных технологических компаний вроде Google до стартапов вроде OpenAI и Anthropic...

18.02.25

5 715

0
Что известно о стартапе DeepSeek, который потряс мир технологий?

Инновации

Что известно о стартапе DeepSeek, который потряс мир технологий?

Стартапы

Удивительно эффективная и мощная китайская модель ИИ захватила технологическую отрасль штурмом. Он называется DeepSeek R1 и раздражает нервы на Уолл-с...

28.01.25

4 966

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (34)
Telegram
22% (90)
Youtube
36% (150)
Twitter
1% (5)
А что это?
16% (65)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».