Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

24.02.25

0

1 010

0

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями стільки часу, скільки потрібно користувачам.

Anthropic називає Claude 3.7 Sonnet першою в галузі «гібридною моделлю міркувань ШІ», тому що це єдина модель, яка може давати як відповіді в реальному часі, так і більш виважені, «продумані» відповіді на запитання. Користувачі можуть вибирати, чи активувати «розумові» здібності моделі ШІ, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду часу.

Claude 3.7 Sonnet
Anthropic

Модель являє собою ширші зусилля Anthropic зі спрощення користувацького досвіду навколо своїх продуктів ШІ. Більшість чат-ботів ШІ сьогодні мають лякаючий вибір моделі, який змушує користувачів обирати з кількох різних варіантів, що різняться за вартістю та можливостями. Такі лабораторії, як Anthropic, воліли б, щоб ви не думали про це  в ідеалі одна модель робить усю роботу.

Claude 3.7 Sonnet буде доступний усім користувачам і розробникам у понеділок, повідомила Anthropic, але тільки ті, хто заплатить за преміум-плани чат-бота Claude від Anthropic, отримають доступ до функцій міркування моделі. Безкоштовні користувачі Claude отримають стандартну версію Claude 3.7 Sonnet без міркувань, яка, за твердженням Anthropic, перевершує її попередню передову модель ШІ Claude 3.5 Sonnet. 

Claude 3.7 Sonnet коштує $3 за мільйон вхідних токенів (тобто ви можете ввести приблизно 750 000 слів, більше слів, ніж уся серія «Володар кілець», у Claude за $3) і $15 за мільйон вихідних токенів. Це робить його дорожчим, ніж o3-mini від OpenAI ($1,10 за 1 мільйон вхідних токенів/$4,40 за 1 мільйон вихідних токенів) і R1 від DeepSeek (55 центів за 1 мільйон вхідних токенів/$2,19 за 1 мільйон вихідних токенів), але майте на увазі, що o3-mini та R1  це суворо міркуючі моделі, а не гібриди, як Claude 3.7 Sonnet.

Claude 3.7 Sonnet  перша модель штучного інтелекту від Anthropic, здатна «міркувати»  метод, до якого звернулися багато лабораторій штучного інтелекту, оскільки традиційні методи підвищення продуктивності штучного інтелекту втрачають свою актуальність.

Моделі міркувань, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google і Grok 3 (Think) від xAI, використовують більше часу й обчислювальної потужності перед відповіддю на запитання. Моделі розбивають проблеми на більш дрібні кроки, що підвищує точність остаточної відповіді. Моделі міркувань не обов'язково думають або міркують так, як це робить людина, але їхній процес моделюється після дедукції.

Зрештою Anthropic хотіла б, щоб Claude самостійно визначав, як довго йому слід «думати» над питаннями, не вимагаючи від користувачів попереднього вибору елементів управління, розповіла в інтерв'ю керівниця відділу досліджень і розробки продуктів Anthropic Дайанна Пенн.

«Подібно до того, як у людей немає двох окремих мізків для запитань, на які можна відповісти негайно, і для тих, що потребують роздумів», — написав Антропік у повідомленні в блозі, опублікованому TechCrunch, — “ми розглядаємо міркування просто як одну з можливостей, якою має володіти прикордонна модель, яку необхідно плавно інтегрувати з іншими можливостями, а не як щось, що повинно бути представлено в окремій моделі”.
Anthropic повідомляє, що дозволяє Claude 3.7 Sonnet демонструвати свою внутрішню фазу планування за допомогою «видимого блокнота». Пенн повідомив TechCrunch, що користувачі побачать повний хід думок Клода для більшості підказок, але деякі частини можуть бути відредаговані з метою забезпечення довіри і безпеки.

Anthropic стверджує, що оптимізувала режими мислення Клода для завдань реального світу, як-от складні проблеми кодування або агентські завдання. Розробники, які використовують API Anthropic, можуть контролювати «бюджет» для мислення, швидкість торгівлі та вартість якості відповіді.

В одному тесті для вимірювання завдань кодування реального тексту, SWE-Bench, точність Claude 3.7 Sonnet склала 62,3%, порівняно з моделлю OpenAI o3-mini, яка набрала 49,3%. В іншому тесті для вимірювання здатності моделі ШІ взаємодіяти з модельованими користувачами та зовнішніми API в роздрібній торгівлі, TAU-Bench, точність Claude 3.7 Sonnet склала 81,2%, порівняно з моделлю OpenAI o1, яка набрала 73,5%.

Anthropic також заявляє, що Claude 3.7 Sonnet рідше відмовлятиметься відповідати на запитання, ніж попередні моделі, стверджуючи, що модель здатна проводити більш тонкі відмінності між шкідливими і нешкідливими підказками. Anthropic заявляє, що вона скоротила непотрібні відмови на 45% порівняно з Claude 3.5 Sonnet. Це відбувається в той час, коли деякі інші лабораторії ШІ переглядають свій підхід до обмеження відповідей свого чат-бота ШІ.

На додаток до Claude 3.7 Sonnet, Anthropic також випускає агентний інструмент кодування під назвою Claude Code. Запущений як дослідницький попередній перегляд, інструмент дає змогу розробникам запускати певні завдання через Claude прямо зі свого терміналу.

У демонстрації співробітники Anthropic показали, як Claude Code може аналізувати проект кодування за допомогою простої команди, наприклад, «Поясніть структуру цього проекту». Використовуючи просту англійську в командному рядку, розробник може змінювати кодову базу. Claude Code описуватиме свої правки в міру внесення змін і навіть тестуватиме проєкт на наявність помилок або відправлятиме його в репозиторій GitHub.

Представник Anthropic повідомив, що спочатку Claude Code буде доступний обмеженому числу користувачів за принципом «першим прийшов, першим обслужений».

Anthropic випускає Claude 3.7 Sonnet у той час, коли лабораторії ШІ постачають нові моделі ШІ із запаморочливою швидкістю. Anthropic історично дотримувалася більш методичного, орієнтованого на безпеку підходу. Але цього разу компанія прагне очолити групу.

Але як довго це триватиме  питання. OpenAI може бути близька до випуску власної гібридної моделі ШІ; генеральний директор компанії Сем Альтман заявив, що вона з'явиться через «місяці».

Залишити коментар

Актуальне

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

1 010

0
Чіп Majorana 1 від Microsoft відкриває новий шлях для квантових обчислень

Інновації

Чіп Majorana 1 від Microsoft відкриває новий шлях для квантових обчислень

Інновації

Microsoft представила Majorana 1, перший у світі квантовий чіп на основі нової архітектури Topological Core, який, як очікується, реалізує квантові ко...

22.02.25

927

0
У Києві відбувся Mind Export Summit 2025 – два дні про вихід бізнесу за кордон

Пресреліз

У Києві відбувся Mind Export Summit 2025 – два дні про вихід бізнесу за кордон

13 лютого у столичному КВЦ «Парковий» за підтримки Ощадбанку відбувся Mind Export Summit 2025 – захід для тих, хто бажає масштабувати свій бізнес на з...

21.02.25

647

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Найкращі розширення для LinkedIn, які підвищать вашу продуктивність

Бізнес

Найкращі розширення для LinkedIn, які підвищать вашу продуктивність

LinkedIn став однією з найкращих соцмереж для ведення бізнесу. Він розроблений спеціально для комунікації між представниками компаній та зручної B2B-в...

01.05.24

1 777

0
Понад 4 роки розвитку, глобальна експансія та AI технології: український Getpin залучив $400,000 від Presto Ventures

Понад 4 роки розвитку, глобальна експансія та AI технології: український Getpin залучив $400,000 від Presto Ventures

Інвестиції

Getpin — це український стартап, SaaS-інструмент онлайн-маркетингу, що допомагає бізнесу з фізичними точками продажу залучати клієнтів, які шукають т...

27.11.23

1 766

0
Поради від Віталіка Бутеріна: як не стати жертвою дипфейків

Інвестиції

Поради від Віталіка Бутеріна: як не стати жертвою дипфейків

Потреба постійного захисту своїх коштів — це те, з чим щодня стикається світ криптовалют. Хакери стають все більш винахідливими, тому завжди потрібно...

01.03.24

1 758

0
Згасаючі надії Apple на ШІ ввідроджуються завдяки появі DeepSeek

Аналітика

Згасаючі надії Apple на ШІ ввідроджуються завдяки появі DeepSeek

Аналітика

Побоювання з приводу результатів Apple Inc. за перший квартал зіткнулися з оптимізмом, який панує останніми годинами, і який полягає в тому, що компан...

30.01.25

1 758

0
Ставки за акційними депозитами можуть досягти 17% річних

Пресреліз

Ставки за акційними депозитами можуть досягти 17% річних

У березні ставки за акційними гривневими депозитами залежно від терміну розміщення коштів можуть досягти 17% річних. Про це розповів Дмитро Замотаєв...

29.02.24

1 753

0
ШІ: Словник термінів революції штучного інтелекту

Аналітика

ШІ: Словник термінів революції штучного інтелекту

Аналітика

A AGI (Artificial General Intelligence) Штучний загальний інтелект — це гіпотетичні системи ШІ, здатні виконувати широкий спектр складних завдань з м...

17.10.24

1 749

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
13% (40)
Instagram
6% (19)
TikTok
9% (27)
Telegram
24% (74)
Youtube
31% (96)
Twitter
2% (5)
А що це?
14% (44)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».