ИИ юристы резко прогрессируют: новый тест показал 30% против прежних 18%

08.02.26

1 691

В прошлом месяце бенчмарк Mercor измерял возможности агентов с искусственным интеллектом в профессиональных задачах, таких как право и корпоративный анализ. В то время результаты были довольно низкими, каждая большая лаборатория набрала менее 25%, поэтому пришли к выводу, что юристы застрахованы от вытеснения ИИ, по крайней мере.

Но на этой неделе выпуск Opus 4.6 от Anthropic всколыхнул таблицы лидеров: новая модель Anthropic набрала чуть менее 30% в одноразовых испытаниях и в среднем 45% после нескольких дополнительных попыток решения проблемы. Примечательно, что релиз включал в себя ряд новых агентных функций, включая «рои агентов», которые, возможно, помогли с таким многоэтапным решением проблем.

Несмотря на это этот показатель является огромным скачком по сравнению с предыдущим современным уровнем, и свидетельствует о том, что прогресс в разработке моделей фундамента не замедляется. Особенно впечатленный генеральный директор Mercor Брендан Фуди сказал, что скачок с 18,4% до 29,8% за несколько месяцев – это безумие.

Тридцать процентов – это еще далеко до 100%, поэтому юристам не стоит беспокоиться, что на следующей неделе их заменят машины. Но они должны быть гораздо менее уверены, чем в прошлом месяце.

0 Комментариев

Оставить свой комментарий

Оставить комментарий

Актуальное

Бизнес

Шаги для управления своим мышлением для достижения успеха

Бизнес

Развитие позитивного мышления требует времени и усилий, но существует множество стратегий, которые вы можете использовать для формирования более позит...

28.06.26

591

Инвестиции

8 способов, как инвесторы могут проверить подлинность золота

Инвестиции

Золото по-прежнему остается популярным активом среди инвесторов, ценится за способность защищать от инфляции и экономической нестабильности, обеспечив...

24.06.26

720

Бизнес

6 важных шагов маркетинга и брендинга для развития вашего бизнеса в течение первых 18 месяцев

Бизнес

Вы сделали рывок и начали свой бизнес — что дальше? В первые 18 месяцев рост заключается не только в прибыли, но и в укреплении доверия к бренду, четк...

23.06.26

887

Все публикации

Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована