Вілл Сміт їсть спагетті та інші дивні тести штучного інтелекту, які отримали популярність у 2024 році

02.01.25

0

1 162

0

Коли компанія випускає новий відеогенератор штучного інтелекту, невдовзі хтось використовує його, щоб зняти відео актора Вілла Сміта, який їсть спагетті.

Це стало чимось на кшталт мему, а також еталонним показником: перевірити, чи може новий відеогенератор реалістично відобразити Сміта, який сьорбає миску локшини. Сам Сміт спародіював цю тенденцію в публікації в Instagram.

тесты искусственного интеллекта, которые получили популярность в 2024 году
ШІ рік назад та зараз 

Уілл Сміт і макарони — лише один із кількох дивних «неофіційних» тестів, які захопили ШІ-спільноту штурмом у 2024 році. 16-річний розробник створив додаток, який дає ШІ контроль над Minecraft і перевіряє його здатність проектувати структури. В іншому місці британський програміст створив платформу, де штучний інтелект грає одна проти одної в такі ігри, як Pictionary і Connect 4.

Minecraft
Image Credits: ADONIS SINGH

Це не те, що більше немає академічних тестів продуктивності ШІ. Так чому ж дивніші вибухнули?

По-перше, багато галузевих стандартів ШІ мало що говорять пересічній людині. Компанії часто посилаються на здатність свого штучного інтелекту відповідати на запитання на іспитах з математичної олімпіади або знаходити вірогідні рішення для проблем рівня доктора філософії. Проте більшість людей — зокрема й ваш — використовують чат-ботів для таких речей, як  відповіді на електронні листи та фундаментальні дослідження.

Краудсорсингові показники галузі не обов’язково є кращими чи інформативнішими.

Візьмемо, наприклад, Chatbot Arena, загальнодоступний еталонний тест, за яким багато ентузіастів і розробників штучного інтелекту нав’язливо слідкують. Chatbot Arena дозволяє будь-кому в Інтернеті оцінювати, наскільки добре штучний інтелект виконує певні завдання, як-от створення веб-програми чи генерування зображення. Але оцінювачі, як правило, не є репрезентативними — більшість із них походять із кіл штучного інтелекту та індустрії технологій — і віддають свої голоси на основі особистих уподобань, які важко визначити.

Ітан Моллік, професор менеджменту Wharton, нещодавно вказав у дописі на X ще одну проблему з багатьма індустріальними тестами ШІ: вони не порівнюють продуктивність системи з продуктивністю середньої людини.

«Той факт, що немає 30 різних еталонних показників від різних організацій у медицині, законодавстві, якості консультацій тощо, є справжньою ганьбою, оскільки люди використовують системи для цих речей, незважаючи на це», — написав Моллік.

Джерело: TechCrunch

Залишити коментар

Актуальне

Ефір, мемекойни падають, оскільки трейдери знижують ризики після мит Трампа

Інвестиції

Ефір, мемекойни падають, оскільки трейдери знижують ризики після мит Трампа

Інвестиції

Заходи Дональда Трампа щодо введення мит щодо основних торговельних партнерів США спровокували розпродаж криптовалют, причому індекс менших токенів ма...

02.02.25

499

0
ТопФінанс-2025: найкращі фінансові установи України

Бізнес

ТопФінанс-2025: найкращі фінансові установи України

Бізнес

Журнал "Топ-100. Рейтинги найбільших" та провідний діловий портал Delo.ua визначають лідерів фінансових ринків України. Голосування за найкращі банки,...

03.02.25

585

0
Марк Цукерберг натякає на повернення оригінальної версії Facebook у 2025 році

Аналітика

Марк Цукерберг натякає на повернення оригінальної версії Facebook у 2025 році

Новини компаній

Генеральний директор Meta Марк Цукерберг натякнув на «повернення до оригінальної версії Facebook» як на частину своїх ключових цілей на 2025 рік під ч...

29.01.25

940

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Останні новини: 1 проста ідея пасивного доходу, яка допоможе вам розбагатіти в 2024 році

Огляд

Останні новини: 1 проста ідея пасивного доходу, яка допоможе вам розбагатіти в 2024 році

Традиційний майнінг криптовалют вимагає потужної обчислювальної потужності та спеціалізованого апаратного забезпечення, і перші майнери зіткнулися з в...

07.11.24

3 798

0
Топ бізнес-ідей для підприємців-початківців

Бізнес

Топ бізнес-ідей для підприємців-початківців

Якщо ви подумуєте про початок бізнесу, вам слід подумати, чи відповідає ваша ідея тому, як люди живуть і підходять до своєї роботи. Якщо ви зможете ви...

28.09.23

3 380

1
Які ІТ-компанії заробляють найбільше? ТОП-15

Аналітика

Які ІТ-компанії заробляють найбільше? ТОП-15

Аналітика

Виїзд ІТ-фахівців за кордон, мобілізаційні процеси, падіння попиту на ІТ-послуги та політично напружена ситуація в країні — основні причини зменшення...

23.12.24

2 968

0
Продажі автомобілів у Європі стагнують, оскільки споживачі уникають електромобілів

Бізнес

Продажі автомобілів у Європі стагнують, оскільки споживачі уникають електромобілів

Дослідження

Продажі автомобілів у Європі минулого року майже не зросли, оскільки постійна інфляція, вищі витрати на позики та апатія до електричних моделей змусил...

19.01.25

2 785

0
Ключові переваги гібридної та віддаленої роботи

Аналітика

Ключові переваги гібридної та віддаленої роботи

Аналітика

Чи відчуває бізнес все ще загрозу через дистанційну роботу? Можливо. Легко зрозуміти, чому так багато власників бізнесу виступають проти віддаленої ро...

04.10.24

2 710

0
10 ефективних методів вимірювання щастя співробітників

Бізнес

10 ефективних методів вимірювання щастя співробітників

Бізнес

Керівникам малого бізнесу важливо визначити, наскільки щасливі та задоволені працівники своєю роботою, щоб визначити здоров’я та силу свого бізнесу. Ч...

21.10.24

2 687

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
13% (38)
Instagram
6% (17)
TikTok
9% (27)
Telegram
24% (73)
Youtube
32% (95)
Twitter
2% (5)
А що це?
15% (44)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».