ИИ юристы резко прогрессируют: новый тест показал 30% против прежних 18%

08.02.26

0

917

0

В прошлом месяце бенчмарк Mercor измерял возможности агентов с искусственным интеллектом в профессиональных задачах, таких как право и корпоративный анализ. В то время результаты были довольно низкими, каждая большая лаборатория набрала менее 25%, поэтому пришли к выводу, что юристы застрахованы от вытеснения ИИ, по крайней мере.

Но на этой неделе выпуск Opus 4.6 от Anthropic всколыхнул таблицы лидеров: новая модель Anthropic набрала чуть менее 30% в одноразовых испытаниях и в среднем 45% после нескольких дополнительных попыток решения проблемы. Примечательно, что релиз включал в себя ряд новых агентных функций, включая «рои агентов», которые, возможно, помогли с таким многоэтапным решением проблем.

Mercor
Mercor

Несмотря на это этот показатель является огромным скачком по сравнению с предыдущим современным уровнем, и свидетельствует о том, что прогресс в разработке моделей фундамента не замедляется. Особенно впечатленный генеральный директор Mercor Брендан Фуди сказал, что скачок с 18,4% до 29,8% за несколько месяцев – это безумие.

Тридцать процентов – это еще далеко до 100%, поэтому юристам не стоит беспокоиться, что на следующей неделе их заменят машины. Но они должны быть гораздо менее уверены, чем в прошлом месяце.

Оставить комментарий

Актуальное

«Я отказываю 250 стартапам из 251». Откровение венчурного капиталиста о том, как получить инвестиции

«Я отказываю 250 стартапам из 251». Откровение венчурного капиталиста о том, как получить инвестиции

Путь в венчурные инвестиции и предпринимательство – это всегда трансформация. Для меня лично он начался совершенно с другой отрасли, не имеющей прямог...

05.03.26

558

0
Соглашения на миллиард долларов по инфраструктуре, способствующие буму искусственного интеллекта

Инвестиции

Соглашения на миллиард долларов по инфраструктуре, способствующие буму искусственного интеллекта

Инвестиции

Для работы продукта с искусственным интеллектом требуется большая вычислительная мощность, и поскольку технологическая индустрия стремится использоват...

04.03.26

739

0
Культура копирования: как подделки стали символом новой экономики

Бизнес

Культура копирования: как подделки стали символом новой экономики

Бренды

Самый простой способ создать великолепное произведение искусства – это скопировать его. Копии, подделки, дубликаты, реплики, бутлеги, пастиши, подделк...

26.02.26

928

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

47 433

0
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

9 201

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

8 258

1
Главные биотехнологические инновации 2023 года

Главные биотехнологические инновации 2023 года

BioTech

В мире биотехнологии каждый год приносит потрясающие инновации и переломные моменты, способствующие решению сложных проблем и улучшению качества жизни...

06.10.23

5 837

0
Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интел...

26.05.25

5 652

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (33)
Telegram
21% (88)
Youtube
36% (148)
Twitter
1% (5)
А что это?
16% (65)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».