Вілл Сміт їсть спагетті та інші дивні тести штучного інтелекту, які отримали популярність у 2024 році

02.01.25

0

914

0

Коли компанія випускає новий відеогенератор штучного інтелекту, невдовзі хтось використовує його, щоб зняти відео актора Вілла Сміта, який їсть спагетті.

Це стало чимось на кшталт мему, а також еталонним показником: перевірити, чи може новий відеогенератор реалістично відобразити Сміта, який сьорбає миску локшини. Сам Сміт спародіював цю тенденцію в публікації в Instagram.

тесты искусственного интеллекта, которые получили популярность в 2024 году
ШІ рік назад та зараз 

Уілл Сміт і макарони — лише один із кількох дивних «неофіційних» тестів, які захопили ШІ-спільноту штурмом у 2024 році. 16-річний розробник створив додаток, який дає ШІ контроль над Minecraft і перевіряє його здатність проектувати структури. В іншому місці британський програміст створив платформу, де штучний інтелект грає одна проти одної в такі ігри, як Pictionary і Connect 4.

Minecraft
Image Credits: ADONIS SINGH

Це не те, що більше немає академічних тестів продуктивності ШІ. Так чому ж дивніші вибухнули?

По-перше, багато галузевих стандартів ШІ мало що говорять пересічній людині. Компанії часто посилаються на здатність свого штучного інтелекту відповідати на запитання на іспитах з математичної олімпіади або знаходити вірогідні рішення для проблем рівня доктора філософії. Проте більшість людей — зокрема й ваш — використовують чат-ботів для таких речей, як  відповіді на електронні листи та фундаментальні дослідження.

Краудсорсингові показники галузі не обов’язково є кращими чи інформативнішими.

Візьмемо, наприклад, Chatbot Arena, загальнодоступний еталонний тест, за яким багато ентузіастів і розробників штучного інтелекту нав’язливо слідкують. Chatbot Arena дозволяє будь-кому в Інтернеті оцінювати, наскільки добре штучний інтелект виконує певні завдання, як-от створення веб-програми чи генерування зображення. Але оцінювачі, як правило, не є репрезентативними — більшість із них походять із кіл штучного інтелекту та індустрії технологій — і віддають свої голоси на основі особистих уподобань, які важко визначити.

Ітан Моллік, професор менеджменту Wharton, нещодавно вказав у дописі на X ще одну проблему з багатьма індустріальними тестами ШІ: вони не порівнюють продуктивність системи з продуктивністю середньої людини.

«Той факт, що немає 30 різних еталонних показників від різних організацій у медицині, законодавстві, якості консультацій тощо, є справжньою ганьбою, оскільки люди використовують системи для цих речей, незважаючи на це», — написав Моллік.

Джерело: TechCrunch

Залишити коментар

Актуальне

Teal Health збирає 10 мільйонів доларів для організації скринінгу раку шийки матки в домашніх умовах

Інновації

Teal Health збирає 10 мільйонів доларів для організації скринінгу раку шийки матки в домашніх умовах

Інновації

Процес проходження скринінгу на рак шийки матки досить страшний. Це терапія, яка проводиться раз на рік і іноді кардинально змінює життя, включає яскр...

16.01.25

495

0
Тепер ChatGPT дозволяє планувати нагадування та повторювані завдання

Інновації

Тепер ChatGPT дозволяє планувати нагадування та повторювані завдання

Інновації

Нова бета-функція під назвою «завдання» цього тижня почне розгортатися для користувачів ChatGPT Plus, Team і Pro по всьому світу. За допомогою завдань...

15.01.25

456

0
Колишній гендиректор Google запустив ШІ-платформу для генерації відео. Що про неї відомо?

Бізнес

Колишній гендиректор Google запустив ШІ-платформу для генерації відео. Що про неї відомо?

Стартапи

Ерік Шмідт критикує ШІ за діпфейки, але вступив у конкуренцію із Sora за генерацію тексту у відео у своєму проєкті Hooglee. Ймовірно, це буде соцмереж...

12.01.25

462

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

6 302

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

4 733

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

4 448

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

4 131

0
Головні біотехнологічні інновації 2023 року

Головні біотехнологічні інновації 2023 року

BioTech

У світі біотехнології кожен рік приносить приголомшливі інновації та переломні моменти, що сприяють розв'язанню складних проблем і поліпшенню якості ж...

06.10.23

4 053

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
13% (37)
Instagram
6% (17)
TikTok
9% (27)
Telegram
24% (71)
Youtube
31% (91)
Twitter
2% (5)
А що це?
15% (43)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».