ШІ юристи різко прогресують: новий тест показав 30% проти колишніх 18%

08.02.26

0

530

0

Минулого місяця бенчмарк Mercor вимірював можливості агентів зі штучним інтелектом у професійних завданнях, таких як право та корпоративний аналіз. На той час результати були досить низькими, кожна велика лабораторія набрала менше 25%, тому дійшли висновку, що юристи застраховані від витіснення ШІ, принаймні наразі.

Але цього тижня випуск Opus 4.6 від Anthropic сколихнув таблиці лідерів: нова модель Anthropic набрала трохи менше 30% в одноразових випробуваннях і в середньому 45% після кількох додаткових спроб вирішення проблеми. Примітно, що реліз включав низку нових агентних функцій, включаючи «рої агентів», які, можливо, допомогли з таким багатоетапним вирішенням проблем.

Mercor
Mercor

Незважаючи на це, цей показник є величезним стрибком у порівнянні з попереднім сучасним рівнем, і свідчить про те, що прогрес у розробці моделей фундаменту не сповільнюється. Генеральний директор Mercor Брендан Фуді, який був особливо вражений, сказав, що стрибок з 18,4% до 29,8% за кілька місяців – це божевілля.

Тридцять відсотків – це ще далеко до 100%, тому юристам не варто хвилюватися, що наступного тижня їх замінять машини. Але вони мають бути набагато менш впевненими, ніж минулого місяця.

Залишити коментар

Актуальне

Чому продуктивність — це не про талант

Аналітика

Чому продуктивність — це не про талант

Аналітика

Роками нам казали, що висока продуктивність призначена для «обдарованих від природи»: вундеркіндів, природжених лідерів, людей, які просто її мають. П...

04.02.26

529

0
Як масштабувати бізнес за допомогою Ripple Intelligence

Бізнес

Як масштабувати бізнес за допомогою Ripple Intelligence

Бізнес

Масштабування бізнесу часто описують як зростання, більше клієнтів, більше персоналу, більше доходів, більша видимість. Але зростання без інтелекту ст...

02.02.26

840

0
Які європейські компанії стали єдинорогами в 2026 році

Інвестиції

Які європейські компанії стали єдинорогами в 2026 році

Стартапи

Січень був таким довгим місяцем, що він вже подарував нам п'ять нових європейських єдинорогів: кілька технологічних стартапів залучили фінансування з...

03.02.26

973

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

46 734

0
Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

10 121

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

8 469

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

7 867

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

7 642

1

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (33)
Telegram
21% (88)
Youtube
36% (147)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».