Уилл Смит ест спагетти и другие странные тесты искусственного интеллекта, которые получили популярность в 2024 году

02.01.25

0

1 176

0

Когда компания выпускает новый видеогенератор искусственного интеллекта, вскоре кто-то использует его, чтобы снять видео актера Уилла Смита, который ест спагетти.

Это стало чем-то вроде мема, а также эталонным показателем: проверить, может ли новый видеогенератор реалистично отобразить Смита, который хлебает миску лапши. Сам Смит спародировал эту тенденцию в публикации в Instagram. 

тесты искусственного интеллекта, которые получили популярность в 2024 году
ИИ год назад и сейчас

Уилл Смит и макароны  лишь один из нескольких странных «неофициальных» тестов, которые захватили ИИ-сообщество штурмом в 2024 году. 16-летний разработчик создал приложение, которое дает ИИ контроль над Minecraft и проверяет его способность проектировать структуры. В другом месте британский программист создал платформу, где искусственный интеллект играет друг против друга в такие игры, как Pictionary и Connect 4.

Minecraft
Image Credits: ADONIS SINGH

Это не то, что больше нет академических тестов производительности ИИ. Так почему же более странные взорвались?

Во-первых, многие отраслевые стандарты ИИ мало что говорят обычному человеку. Компании часто ссылаются на способность своего искусственного интеллекта отвечать на вопросы на экзаменах по математической олимпиаде или находить вероятные решения для проблем уровня доктора философии. Однако большинство людей  в том числе и ваш  используют чат-ботов для таких вещей, как ответы на электронные письма и фундаментальные исследования.

Краудсорсинговые показатели отрасли не обязательно лучше или информативнее.

Возьмем, например, Chatbot Arena, общедоступный эталонный тест, за которым многие энтузиасты и разработчики искусственного интеллекта навязчиво следят. Chatbot Arena позволяет любому в Интернете оценивать, насколько хорошо искусственный интеллект выполняет определенные задачи, такие как создание веб-программы или генерирование изображения. Но оценщики, как правило, не являются репрезентативными — большинство из них происходят из кругов искусственного интеллекта и индустрии технологий — и отдают свои голоса на основе личных предпочтений, которые трудно определить.

Итан Моллик, профессор менеджмента Wharton, недавно указал в заметке на X еще одну проблему со многими индустриальными тестами ИИ: они не сравнивают производительность системы с производительностью среднего человека.

«Тот факт, что нет 30 различных эталонных показателей от различных организаций в медицине, законодательстве, качестве консультаций и т.д., является настоящим позором, поскольку люди используют системы для этих вещей, несмотря на это», — написал Моллик.
Источник: TechCrunch
Оставить комментарий

Актуальное

Porsche страдает от неудачной ставки на электрические спортивные автомобили

Бизнес

Porsche страдает от неудачной ставки на электрические спортивные автомобили

Бизнес

Porsche AG все больше отстает от высоких целей, поставленных во время ее бурного листинга акций два года назад, с ростом расходов из-за того, что руко...

06.02.25

831

0
Rply — новый помощник искусственного интеллекта, который отвечает на пропущенные сообщения

Инновации

Rply — новый помощник искусственного интеллекта, который отвечает на пропущенные сообщения

Инновации

Сегодня выходит новое приложение для Mac под названием RPLY, призванное помочь пользователям текстовых сообщений избавиться от ненужных сообщений в iM...

07.02.25

606

0
Эфир, мемекойны падают, поскольку трейдеры снижают риски после пошлин Трампа

Инвестиции

Эфир, мемекойны падают, поскольку трейдеры снижают риски после пошлин Трампа

Инвестиции

Меры Дональда Трампа по введению пошлин в отношении основных торговых партнеров США спровоцировали распродажу криптовалют, причем индекс меньших токен...

02.02.25

888

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

42 594

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

6 701

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

5 081

1
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

4 765

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

4 560

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
13% (38)
Instagram
6% (17)
TikTok
9% (27)
Telegram
24% (73)
Youtube
32% (96)
Twitter
2% (5)
А что это?
15% (44)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».