Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

24.02.25

0

752

0

Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «думала» над вопросами столько времени, сколько нужно пользователям.

Anthropic называет Claude 3.7 Sonnet первой в отрасли «гибридной моделью рассуждений ИИ», потому что это единая модель, которая может давать как ответы в реальном времени, так и более взвешенные, «продуманные» ответы на вопросы. Пользователи могут выбирать, активировать ли «рассудочные» способности модели ИИ, которые побуждают Claude 3.7 Sonnet «думать» в течение короткого или длительного периода времени.

Claude 3.7 Sonnet
Anthropic

Модель представляет собой более широкие усилия Anthropic по упрощению пользовательского опыта вокруг своих продуктов ИИ. Большинство чат-ботов ИИ сегодня имеют пугающий выбор модели, который заставляет пользователей выбирать из нескольких различных вариантов, которые различаются по стоимости и возможностям. Такие лаборатории, как Anthropic, предпочли бы, чтобы вы не думали об этом — в идеале одна модель делает всю работу.

Claude 3.7 Sonnet будет доступен всем пользователям и разработчикам в понедельник, сообщила Anthropic, но только те, кто заплатит за премиум-планы чат-бота Claude от Anthropic, получат доступ к функциям рассуждения модели. Бесплатные пользователи Claude получат стандартную версию Claude 3.7 Sonnet без рассуждений, которая, по утверждению Anthropic, превосходит ее предыдущую передовую модель ИИ Claude 3.5 Sonnet.

Claude 3.7 Sonnet стоит $3 за миллион входных токенов (то есть вы можете ввести примерно 750 000 слов, больше слов, чем вся серия «Властелин колец», в Claude за $3) и $15 за миллион выходных токенов. Это делает его дороже, чем o3-mini от OpenAI ($1,10 за 1 миллион входных токенов/$4,40 за 1 миллион выходных токенов) и R1 от DeepSeek (55 центов за 1 миллион входных токенов/$2,19 за 1 миллион выходных токенов), но имейте в виду, что o3-mini и R1 — это строго рассуждающие модели, а не гибриды, как Claude 3.7 Sonnet.

Claude 3.7 Sonnet — первая модель искусственного интеллекта от Anthropic, способная «рассуждать» — метод, к которому обратились многие лаборатории искусственного интеллекта, поскольку традиционные методы повышения производительности искусственного интеллекта теряют свою актуальность.

Модели рассуждений, такие как o3-mini, R1, Gemini 2.0 Flash Thinking от Google и Grok 3 (Think) от xAI, используют больше времени и вычислительной мощности перед ответом на вопросы. Модели разбивают проблемы на более мелкие шаги, что повышает точность окончательного ответа. Модели рассуждений не обязательно думают или рассуждают так, как это делает человек, но их процесс моделируется после дедукции.

В конечном итоге Anthropic хотела бы, чтобы Claude самостоятельно определял, как долго ему следует «думать» над вопросами, не требуя от пользователей предварительного выбора элементов управления, рассказала в интервью руководитель отдела исследований и разработки продуктов Anthropic Дайанна Пенн.

«Подобно тому, как у людей нет двух отдельных мозгов для вопросов, на которые можно ответить немедленно, и для тех, которые требуют размышлений», — написал Антропик в сообщении в блоге, опубликованном TechCrunch, — «мы рассматриваем рассуждение просто как одну из возможностей, которой должна обладать пограничная модель, которую необходимо плавно интегрировать с другими возможностями, а не как что-то, что должно быть представлено в отдельной модели».

Anthropic сообщает, что позволяет Claude 3.7 Sonnet демонстрировать свою внутреннюю фазу планирования с помощью «видимого блокнота». Пенн сообщил TechCrunch, что пользователи увидят полный ход мыслей Клода для большинства подсказок, но некоторые части могут быть отредактированы в целях обеспечения доверия и безопасности.

Anthropic утверждает, что оптимизировала режимы мышления Клода для задач реального мира, таких как сложные проблемы кодирования или агентские задачи. Разработчики, использующие API Anthropic, могут контролировать «бюджет» для мышления, скорость торговли и стоимость качества ответа.

В одном тесте для измерения задач кодирования реального текста, SWE-Bench, точность Claude 3.7 Sonnet составила 62,3%, по сравнению с моделью OpenAI o3-mini, которая набрала 49,3%. В другом тесте для измерения способности модели ИИ взаимодействовать с моделируемыми пользователями и внешними API в розничной торговле, TAU-Bench, точность Claude 3.7 Sonnet составила 81,2%, по сравнению с моделью OpenAI o1, которая набрала 73,5%.

Anthropic также заявляет, что Claude 3.7 Sonnet будет реже отказываться отвечать на вопросы, чем предыдущие модели, утверждая, что модель способна проводить более тонкие различия между вредными и безвредными подсказками. Anthropic заявляет, что она сократила ненужные отказы на 45% по сравнению с Claude 3.5 Sonnet. Это происходит в то время, когда некоторые другие лаборатории ИИ пересматривают свой подход к ограничению ответов своего чат-бота ИИ .

В дополнение к Claude 3.7 Sonnet, Anthropic также выпускает агентный инструмент кодирования под названием Claude Code. Запущенный в качестве исследовательского предварительного просмотра, инструмент позволяет разработчикам запускать определенные задачи через Claude прямо со своего терминала.

В демонстрации сотрудники Anthropic показали, как Claude Code может анализировать проект кодирования с помощью простой команды, например, « Объясните структуру этого проекта». Используя простой английский в командной строке, разработчик может изменять кодовую базу. Claude Code будет описывать свои правки по мере внесения изменений и даже тестировать проект на наличие ошибок или отправлять его в репозиторий GitHub.

Представитель Anthropic сообщил, что изначально Claude Code будет доступен ограниченному числу пользователей по принципу «первым пришел, первым обслужен».

Anthropic выпускает Claude 3.7 Sonnet в то время, когда лаборатории ИИ поставляют новые модели ИИ с головокружительной скоростью. Anthropic исторически придерживалась более методичного, ориентированного на безопасность подхода. Но на этот раз компания стремится возглавить группу.

Но как долго это продлится — вопрос. OpenAI может быть близка к выпуску собственной гибридной модели ИИ ; генеральный директор компании Сэм Альтман заявил, что она появится через «месяцы».

Оставить комментарий

Актуальное

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «дум...

24.02.25

752

0
Чип Majorana 1 от Microsoft открывает новый путь для квантовых вычислений

Инновации

Чип Majorana 1 от Microsoft открывает новый путь для квантовых вычислений

Инновации

Microsoft представила Majorana 1, первый в мире квантовый чип на основе новой архитектуры Topological Core, который, как ожидается, реализует квантовы...

22.02.25

639

0
В Киеве состоялся Mind Export Summit 2025 – два дня о выходе бизнеса за границу

Пресс-релиз

В Киеве состоялся Mind Export Summit 2025 – два дня о выходе бизнеса за границу

13 февраля в столичном КВЦ «Парковый» при поддержке Ощадбанка состоялся Mind Export Summit 2025 – мероприятие для тех, кто желает масштабировать свой...

21.02.25

599

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Последние новости: 1 простая идея пассивного дохода, которая поможет вам разбогатеть в 2024 году

Обзор

Последние новости: 1 простая идея пассивного дохода, которая поможет вам разбогатеть в 2024 году

Традиционный майнинг криптовалют требует мощной вычислительной мощности и специализированного аппаратного обеспечения и первые майнеры столкнулись с о...

07.11.24

3 886

0
Топ бизнес-идей для начинающих предпринимателей

Бизнес

Топ бизнес-идей для начинающих предпринимателей

Если вы подумываете о начале бизнеса , вам следует подумать, соответствует ли ваша идея тому, как люди живут и подходят к своей работе. Если вы сможет...

28.09.23

3 457

1
Какие ИТ-компании зарабатывают больше всего? ТОП-15

Аналитика

Какие ИТ-компании зарабатывают больше всего? ТОП-15

Аналитика

Выезд ІТ-специалистов за границу, мобилизационные процессы, падение спроса на ІТ-услуги и политически напряженная ситуация в стране — основные причины...

23.12.24

3 174

0
Что известно о стартапе DeepSeek, который потряс мир технологий?

Инновации

Что известно о стартапе DeepSeek, который потряс мир технологий?

Стартапы

Удивительно эффективная и мощная китайская модель ИИ захватила технологическую отрасль штурмом. Он называется DeepSeek R1 и раздражает нервы на Уолл-с...

28.01.25

3 143

0
Продажи автомобилей в Европе стагнируют, поскольку потребители избегают электромобилей

Бизнес

Продажи автомобилей в Европе стагнируют, поскольку потребители избегают электромобилей

Исследования

Продажи автомобилей в Европе в прошлом году почти не выросли, поскольку постоянная инфляция, более высокие затраты на ссуды и апатия к электрическим м...

19.01.25

3 086

0
Мемкоины семьи Трамп за считанные часы собрали миллиардную капитализацию и взорвали рынок криптовалют

Инвестиции

Мемкоины семьи Трамп за считанные часы собрали миллиардную капитализацию и взорвали рынок криптовалют

Инвестиции

Криптосообщество сделало богатого бизнесмена и президента США Дональда Трампа еще богаче. Накануне инаугурации он объявил о запуске собственной крипто...

20.01.25

2 847

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
13% (40)
Instagram
6% (19)
TikTok
9% (27)
Telegram
24% (74)
Youtube
31% (96)
Twitter
2% (5)
А что это?
14% (44)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».