Вілл Сміт їсть спагетті та інші дивні тести штучного інтелекту, які отримали популярність у 2024 році

02.01.25

0

2 417

0

Коли компанія випускає новий відеогенератор штучного інтелекту, невдовзі хтось використовує його, щоб зняти відео актора Вілла Сміта, який їсть спагетті.

Це стало чимось на кшталт мему, а також еталонним показником: перевірити, чи може новий відеогенератор реалістично відобразити Сміта, який сьорбає миску локшини. Сам Сміт спародіював цю тенденцію в публікації в Instagram.

тесты искусственного интеллекта, которые получили популярность в 2024 году
ШІ рік назад та зараз 

Уілл Сміт і макарони — лише один із кількох дивних «неофіційних» тестів, які захопили ШІ-спільноту штурмом у 2024 році. 16-річний розробник створив додаток, який дає ШІ контроль над Minecraft і перевіряє його здатність проектувати структури. В іншому місці британський програміст створив платформу, де штучний інтелект грає одна проти одної в такі ігри, як Pictionary і Connect 4.

Minecraft
Image Credits: ADONIS SINGH

Це не те, що більше немає академічних тестів продуктивності ШІ. Так чому ж дивніші вибухнули?

По-перше, багато галузевих стандартів ШІ мало що говорять пересічній людині. Компанії часто посилаються на здатність свого штучного інтелекту відповідати на запитання на іспитах з математичної олімпіади або знаходити вірогідні рішення для проблем рівня доктора філософії. Проте більшість людей — зокрема й ваш — використовують чат-ботів для таких речей, як  відповіді на електронні листи та фундаментальні дослідження.

Краудсорсингові показники галузі не обов’язково є кращими чи інформативнішими.

Візьмемо, наприклад, Chatbot Arena, загальнодоступний еталонний тест, за яким багато ентузіастів і розробників штучного інтелекту нав’язливо слідкують. Chatbot Arena дозволяє будь-кому в Інтернеті оцінювати, наскільки добре штучний інтелект виконує певні завдання, як-от створення веб-програми чи генерування зображення. Але оцінювачі, як правило, не є репрезентативними — більшість із них походять із кіл штучного інтелекту та індустрії технологій — і віддають свої голоси на основі особистих уподобань, які важко визначити.

Ітан Моллік, професор менеджменту Wharton, нещодавно вказав у дописі на X ще одну проблему з багатьма індустріальними тестами ШІ: вони не порівнюють продуктивність системи з продуктивністю середньої людини.

«Той факт, що немає 30 різних еталонних показників від різних організацій у медицині, законодавстві, якості консультацій тощо, є справжньою ганьбою, оскільки люди використовують системи для цих речей, незважаючи на це», — написав Моллік.

Джерело: TechCrunch

Залишити коментар

Актуальне

Як засновнику контролювати бізнес у реальному часі: ERP для проєктної компанії як інструмент управління, а не бухгалтерії

Бізнес

Як засновнику контролювати бізнес у реальному часі: ERP для проєктної компанії як інструмент управління, а не бухгалтерії

Бізнес

Кожен власник проєктного бізнесу — чи то в IT, архітектурі, маркетингу чи консалтингу — рано чи пізно опиняється в «точці засліплення». Це момент, кол...

24.02.26

307

0
Звільнення без виправдань. Як перевести прощання зі співробітником із площини емоцій у цифри

Бізнес

Звільнення без виправдань. Як перевести прощання зі співробітником із площини емоцій у цифри

Бізнес

В управлінській практиці часто трапляється сценарій, коли звільнення співробітника відбувається за формулою «ми більше не зацікавлені у ваших послугах...

23.02.26

551

0
Вчора ви пили з ними пиво, а сьогодні ви їхній начальник. 7 кроків, щоб не стати посміховиськом на новій посаді

Бізнес

Вчора ви пили з ними пиво, а сьогодні ви їхній начальник. 7 кроків, щоб не стати посміховиськом на новій посаді

Бізнес

Перехід зі статусу фахівця у статус керівника — це не просто зміна таблички на дверях, а фундаментальна зміна ролі, яка вимагає дій. Вчора ви могли об...

19.02.26

757

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

47 144

0
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

8 917

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

8 006

1
Головні біотехнологічні інновації 2023 року

Головні біотехнологічні інновації 2023 року

BioTech

У світі біотехнології кожен рік приносить приголомшливі інновації та переломні моменти, що сприяють розв'язанню складних проблем і поліпшенню якості ж...

06.10.23

5 520

0
Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Під час тестування своєї останньої моделі штучного інтелекту дослідники з Anthropic виявили щось дуже дивне: штучний інтелект був готовий і бажав вдав...

26.05.25

5 356

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (33)
Telegram
21% (88)
Youtube
36% (148)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».