Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

24.02.25

0

783

0

Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «думала» над вопросами столько времени, сколько нужно пользователям.

Anthropic называет Claude 3.7 Sonnet первой в отрасли «гибридной моделью рассуждений ИИ», потому что это единая модель, которая может давать как ответы в реальном времени, так и более взвешенные, «продуманные» ответы на вопросы. Пользователи могут выбирать, активировать ли «рассудочные» способности модели ИИ, которые побуждают Claude 3.7 Sonnet «думать» в течение короткого или длительного периода времени.

Claude 3.7 Sonnet
Anthropic

Модель представляет собой более широкие усилия Anthropic по упрощению пользовательского опыта вокруг своих продуктов ИИ. Большинство чат-ботов ИИ сегодня имеют пугающий выбор модели, который заставляет пользователей выбирать из нескольких различных вариантов, которые различаются по стоимости и возможностям. Такие лаборатории, как Anthropic, предпочли бы, чтобы вы не думали об этом — в идеале одна модель делает всю работу.

Claude 3.7 Sonnet будет доступен всем пользователям и разработчикам в понедельник, сообщила Anthropic, но только те, кто заплатит за премиум-планы чат-бота Claude от Anthropic, получат доступ к функциям рассуждения модели. Бесплатные пользователи Claude получат стандартную версию Claude 3.7 Sonnet без рассуждений, которая, по утверждению Anthropic, превосходит ее предыдущую передовую модель ИИ Claude 3.5 Sonnet.

Claude 3.7 Sonnet стоит $3 за миллион входных токенов (то есть вы можете ввести примерно 750 000 слов, больше слов, чем вся серия «Властелин колец», в Claude за $3) и $15 за миллион выходных токенов. Это делает его дороже, чем o3-mini от OpenAI ($1,10 за 1 миллион входных токенов/$4,40 за 1 миллион выходных токенов) и R1 от DeepSeek (55 центов за 1 миллион входных токенов/$2,19 за 1 миллион выходных токенов), но имейте в виду, что o3-mini и R1 — это строго рассуждающие модели, а не гибриды, как Claude 3.7 Sonnet.

Claude 3.7 Sonnet — первая модель искусственного интеллекта от Anthropic, способная «рассуждать» — метод, к которому обратились многие лаборатории искусственного интеллекта, поскольку традиционные методы повышения производительности искусственного интеллекта теряют свою актуальность.

Модели рассуждений, такие как o3-mini, R1, Gemini 2.0 Flash Thinking от Google и Grok 3 (Think) от xAI, используют больше времени и вычислительной мощности перед ответом на вопросы. Модели разбивают проблемы на более мелкие шаги, что повышает точность окончательного ответа. Модели рассуждений не обязательно думают или рассуждают так, как это делает человек, но их процесс моделируется после дедукции.

В конечном итоге Anthropic хотела бы, чтобы Claude самостоятельно определял, как долго ему следует «думать» над вопросами, не требуя от пользователей предварительного выбора элементов управления, рассказала в интервью руководитель отдела исследований и разработки продуктов Anthropic Дайанна Пенн.

«Подобно тому, как у людей нет двух отдельных мозгов для вопросов, на которые можно ответить немедленно, и для тех, которые требуют размышлений», — написал Антропик в сообщении в блоге, опубликованном TechCrunch, — «мы рассматриваем рассуждение просто как одну из возможностей, которой должна обладать пограничная модель, которую необходимо плавно интегрировать с другими возможностями, а не как что-то, что должно быть представлено в отдельной модели».

Anthropic сообщает, что позволяет Claude 3.7 Sonnet демонстрировать свою внутреннюю фазу планирования с помощью «видимого блокнота». Пенн сообщил TechCrunch, что пользователи увидят полный ход мыслей Клода для большинства подсказок, но некоторые части могут быть отредактированы в целях обеспечения доверия и безопасности.

Anthropic утверждает, что оптимизировала режимы мышления Клода для задач реального мира, таких как сложные проблемы кодирования или агентские задачи. Разработчики, использующие API Anthropic, могут контролировать «бюджет» для мышления, скорость торговли и стоимость качества ответа.

В одном тесте для измерения задач кодирования реального текста, SWE-Bench, точность Claude 3.7 Sonnet составила 62,3%, по сравнению с моделью OpenAI o3-mini, которая набрала 49,3%. В другом тесте для измерения способности модели ИИ взаимодействовать с моделируемыми пользователями и внешними API в розничной торговле, TAU-Bench, точность Claude 3.7 Sonnet составила 81,2%, по сравнению с моделью OpenAI o1, которая набрала 73,5%.

Anthropic также заявляет, что Claude 3.7 Sonnet будет реже отказываться отвечать на вопросы, чем предыдущие модели, утверждая, что модель способна проводить более тонкие различия между вредными и безвредными подсказками. Anthropic заявляет, что она сократила ненужные отказы на 45% по сравнению с Claude 3.5 Sonnet. Это происходит в то время, когда некоторые другие лаборатории ИИ пересматривают свой подход к ограничению ответов своего чат-бота ИИ .

В дополнение к Claude 3.7 Sonnet, Anthropic также выпускает агентный инструмент кодирования под названием Claude Code. Запущенный в качестве исследовательского предварительного просмотра, инструмент позволяет разработчикам запускать определенные задачи через Claude прямо со своего терминала.

В демонстрации сотрудники Anthropic показали, как Claude Code может анализировать проект кодирования с помощью простой команды, например, « Объясните структуру этого проекта». Используя простой английский в командной строке, разработчик может изменять кодовую базу. Claude Code будет описывать свои правки по мере внесения изменений и даже тестировать проект на наличие ошибок или отправлять его в репозиторий GitHub.

Представитель Anthropic сообщил, что изначально Claude Code будет доступен ограниченному числу пользователей по принципу «первым пришел, первым обслужен».

Anthropic выпускает Claude 3.7 Sonnet в то время, когда лаборатории ИИ поставляют новые модели ИИ с головокружительной скоростью. Anthropic исторически придерживалась более методичного, ориентированного на безопасность подхода. Но на этот раз компания стремится возглавить группу.

Но как долго это продлится — вопрос. OpenAI может быть близка к выпуску собственной гибридной модели ИИ ; генеральный директор компании Сэм Альтман заявил, что она появится через «месяцы».

Оставить комментарий

Актуальное

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «дум...

24.02.25

783

0
Чип Majorana 1 от Microsoft открывает новый путь для квантовых вычислений

Инновации

Чип Majorana 1 от Microsoft открывает новый путь для квантовых вычислений

Инновации

Microsoft представила Majorana 1, первый в мире квантовый чип на основе новой архитектуры Topological Core, который, как ожидается, реализует квантовы...

22.02.25

672

0
В Киеве состоялся Mind Export Summit 2025 – два дня о выходе бизнеса за границу

Пресс-релиз

В Киеве состоялся Mind Export Summit 2025 – два дня о выходе бизнеса за границу

13 февраля в столичном КВЦ «Парковый» при поддержке Ощадбанка состоялся Mind Export Summit 2025 – мероприятие для тех, кто желает масштабировать свой...

21.02.25

604

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

5 причин, по которым вашему бизнесу нужны игры на сплочение коллектива

Бизнес

5 причин, по которым вашему бизнесу нужны игры на сплочение коллектива

Бизнес

Хотите создать команду-победителя в своем бизнесе? Одним из преимуществ добавления игр на сплочение коллектива к социальным мероприятиям для сотрудник...

12.11.24

2 366

0
Есть ли у вас менталитет бедности

Бизнес

Есть ли у вас менталитет бедности

Вы страдаете от менталитета бедности? Если да, то это мешает вам жить полноценной и счастливой жизнью. Такое мышление не позволит вам полностью раскры...

31.01.24

2 357

0
Инвестиции в Украине в 2024 году: 3 надежных способа сохранить и приумножить свои средства

Инвестиции

Инвестиции в Украине в 2024 году: 3 надежных способа сохранить и приумножить свои средства

Инвестиции

У вас есть определенная сумма – и вы хотите сохранить свои деньги? А может, ваша цель – заставить их «работать»? Мы узнали у экспертов, какие инвестиц...

06.02.24

2 352

0
5 способов сохранить ваш бизнес организованным и на ходу

Бизнес

5 способов сохранить ваш бизнес организованным и на ходу

Аналитика

Эффективные процессы и четкие каналы связи имеют решающее значение для хорошо организованного бизнеса. Они позволяют компании оперативно реагировать н...

28.11.23

2 303

0
Рассматриваем стратегию компании Inditex бренда Zara в сфере торговой недвижимости

Рассматриваем стратегию компании Inditex бренда Zara в сфере торговой недвижимости

Каждый успешный розничный продавец имеет свои секреты успеха, и Zara, одна из жемчужин Inditex Group, не исключение. Сегодня мы рассматриваем стратеги...

08.11.23

2 279

0
Звезды стартапов, которые потерпели впечатляющий провал

Бизнес

Звезды стартапов, которые потерпели впечатляющий провал

В мире стартапов успех никогда не гарантирован. К сожалению, некоторые перспективные компании потерпели крах из-за незаконных действий их владельцев....

08.12.23

2 230

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
13% (40)
Instagram
6% (19)
TikTok
9% (27)
Telegram
24% (74)
Youtube
31% (96)
Twitter
2% (5)
А что это?
14% (44)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».