Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

24.02.25

0

750

0

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями стільки часу, скільки потрібно користувачам.

Anthropic називає Claude 3.7 Sonnet першою в галузі «гібридною моделлю міркувань ШІ», тому що це єдина модель, яка може давати як відповіді в реальному часі, так і більш виважені, «продумані» відповіді на запитання. Користувачі можуть вибирати, чи активувати «розумові» здібності моделі ШІ, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду часу.

Claude 3.7 Sonnet
Anthropic

Модель являє собою ширші зусилля Anthropic зі спрощення користувацького досвіду навколо своїх продуктів ШІ. Більшість чат-ботів ШІ сьогодні мають лякаючий вибір моделі, який змушує користувачів обирати з кількох різних варіантів, що різняться за вартістю та можливостями. Такі лабораторії, як Anthropic, воліли б, щоб ви не думали про це  в ідеалі одна модель робить усю роботу.

Claude 3.7 Sonnet буде доступний усім користувачам і розробникам у понеділок, повідомила Anthropic, але тільки ті, хто заплатить за преміум-плани чат-бота Claude від Anthropic, отримають доступ до функцій міркування моделі. Безкоштовні користувачі Claude отримають стандартну версію Claude 3.7 Sonnet без міркувань, яка, за твердженням Anthropic, перевершує її попередню передову модель ШІ Claude 3.5 Sonnet. 

Claude 3.7 Sonnet коштує $3 за мільйон вхідних токенів (тобто ви можете ввести приблизно 750 000 слів, більше слів, ніж уся серія «Володар кілець», у Claude за $3) і $15 за мільйон вихідних токенів. Це робить його дорожчим, ніж o3-mini від OpenAI ($1,10 за 1 мільйон вхідних токенів/$4,40 за 1 мільйон вихідних токенів) і R1 від DeepSeek (55 центів за 1 мільйон вхідних токенів/$2,19 за 1 мільйон вихідних токенів), але майте на увазі, що o3-mini та R1  це суворо міркуючі моделі, а не гібриди, як Claude 3.7 Sonnet.

Claude 3.7 Sonnet  перша модель штучного інтелекту від Anthropic, здатна «міркувати»  метод, до якого звернулися багато лабораторій штучного інтелекту, оскільки традиційні методи підвищення продуктивності штучного інтелекту втрачають свою актуальність.

Моделі міркувань, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google і Grok 3 (Think) від xAI, використовують більше часу й обчислювальної потужності перед відповіддю на запитання. Моделі розбивають проблеми на більш дрібні кроки, що підвищує точність остаточної відповіді. Моделі міркувань не обов'язково думають або міркують так, як це робить людина, але їхній процес моделюється після дедукції.

Зрештою Anthropic хотіла б, щоб Claude самостійно визначав, як довго йому слід «думати» над питаннями, не вимагаючи від користувачів попереднього вибору елементів управління, розповіла в інтерв'ю керівниця відділу досліджень і розробки продуктів Anthropic Дайанна Пенн.

«Подібно до того, як у людей немає двох окремих мізків для запитань, на які можна відповісти негайно, і для тих, що потребують роздумів», — написав Антропік у повідомленні в блозі, опублікованому TechCrunch, — “ми розглядаємо міркування просто як одну з можливостей, якою має володіти прикордонна модель, яку необхідно плавно інтегрувати з іншими можливостями, а не як щось, що повинно бути представлено в окремій моделі”.
Anthropic повідомляє, що дозволяє Claude 3.7 Sonnet демонструвати свою внутрішню фазу планування за допомогою «видимого блокнота». Пенн повідомив TechCrunch, що користувачі побачать повний хід думок Клода для більшості підказок, але деякі частини можуть бути відредаговані з метою забезпечення довіри і безпеки.

Anthropic стверджує, що оптимізувала режими мислення Клода для завдань реального світу, як-от складні проблеми кодування або агентські завдання. Розробники, які використовують API Anthropic, можуть контролювати «бюджет» для мислення, швидкість торгівлі та вартість якості відповіді.

В одному тесті для вимірювання завдань кодування реального тексту, SWE-Bench, точність Claude 3.7 Sonnet склала 62,3%, порівняно з моделлю OpenAI o3-mini, яка набрала 49,3%. В іншому тесті для вимірювання здатності моделі ШІ взаємодіяти з модельованими користувачами та зовнішніми API в роздрібній торгівлі, TAU-Bench, точність Claude 3.7 Sonnet склала 81,2%, порівняно з моделлю OpenAI o1, яка набрала 73,5%.

Anthropic також заявляє, що Claude 3.7 Sonnet рідше відмовлятиметься відповідати на запитання, ніж попередні моделі, стверджуючи, що модель здатна проводити більш тонкі відмінності між шкідливими і нешкідливими підказками. Anthropic заявляє, що вона скоротила непотрібні відмови на 45% порівняно з Claude 3.5 Sonnet. Це відбувається в той час, коли деякі інші лабораторії ШІ переглядають свій підхід до обмеження відповідей свого чат-бота ШІ.

На додаток до Claude 3.7 Sonnet, Anthropic також випускає агентний інструмент кодування під назвою Claude Code. Запущений як дослідницький попередній перегляд, інструмент дає змогу розробникам запускати певні завдання через Claude прямо зі свого терміналу.

У демонстрації співробітники Anthropic показали, як Claude Code може аналізувати проект кодування за допомогою простої команди, наприклад, «Поясніть структуру цього проекту». Використовуючи просту англійську в командному рядку, розробник може змінювати кодову базу. Claude Code описуватиме свої правки в міру внесення змін і навіть тестуватиме проєкт на наявність помилок або відправлятиме його в репозиторій GitHub.

Представник Anthropic повідомив, що спочатку Claude Code буде доступний обмеженому числу користувачів за принципом «першим прийшов, першим обслужений».

Anthropic випускає Claude 3.7 Sonnet у той час, коли лабораторії ШІ постачають нові моделі ШІ із запаморочливою швидкістю. Anthropic історично дотримувалася більш методичного, орієнтованого на безпеку підходу. Але цього разу компанія прагне очолити групу.

Але як довго це триватиме  питання. OpenAI може бути близька до випуску власної гібридної моделі ШІ; генеральний директор компанії Сем Альтман заявив, що вона з'явиться через «місяці».

Залишити коментар

Актуальне

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

750

0
Чіп Majorana 1 від Microsoft відкриває новий шлях для квантових обчислень

Інновації

Чіп Majorana 1 від Microsoft відкриває новий шлях для квантових обчислень

Інновації

Microsoft представила Majorana 1, перший у світі квантовий чіп на основі нової архітектури Topological Core, який, як очікується, реалізує квантові ко...

22.02.25

638

0
У Києві відбувся Mind Export Summit 2025 – два дні про вихід бізнесу за кордон

Пресреліз

У Києві відбувся Mind Export Summit 2025 – два дні про вихід бізнесу за кордон

13 лютого у столичному КВЦ «Парковий» за підтримки Ощадбанку відбувся Mind Export Summit 2025 – захід для тих, хто бажає масштабувати свій бізнес на з...

21.02.25

599

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Останні новини: 1 проста ідея пасивного доходу, яка допоможе вам розбагатіти в 2024 році

Огляд

Останні новини: 1 проста ідея пасивного доходу, яка допоможе вам розбагатіти в 2024 році

Традиційний майнінг криптовалют вимагає потужної обчислювальної потужності та спеціалізованого апаратного забезпечення, і перші майнери зіткнулися з в...

07.11.24

3 886

0
Топ бізнес-ідей для підприємців-початківців

Бізнес

Топ бізнес-ідей для підприємців-початківців

Якщо ви подумуєте про початок бізнесу, вам слід подумати, чи відповідає ваша ідея тому, як люди живуть і підходять до своєї роботи. Якщо ви зможете ви...

28.09.23

3 457

1
Які ІТ-компанії заробляють найбільше? ТОП-15

Аналітика

Які ІТ-компанії заробляють найбільше? ТОП-15

Аналітика

Виїзд ІТ-фахівців за кордон, мобілізаційні процеси, падіння попиту на ІТ-послуги та політично напружена ситуація в країні — основні причини зменшення...

23.12.24

3 174

0
Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Інновації

Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Стартапи

Напрочуд ефективна та потужна китайська модель ШІ захопила технологічну галузь штурмом. Він називається DeepSeek R1 і дратує нерви на Волл-стріт. Нов...

28.01.25

3 143

0
Продажі автомобілів у Європі стагнують, оскільки споживачі уникають електромобілів

Бізнес

Продажі автомобілів у Європі стагнують, оскільки споживачі уникають електромобілів

Дослідження

Продажі автомобілів у Європі минулого року майже не зросли, оскільки постійна інфляція, вищі витрати на позики та апатія до електричних моделей змусил...

19.01.25

3 086

0
Мемкоїни родини Трамп за лічені години зібрали мільярдну капіталізацію та підірвали ринок криптовалют

Інвестиції

Мемкоїни родини Трамп за лічені години зібрали мільярдну капіталізацію та підірвали ринок криптовалют

Інвестиції

Криптоспільнота зробила багатого бізнесмена та президента США Дональда Трампа ще багатшим. Напередодні інавгурації він оголосив про запуск власної кри...

20.01.25

2 847

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
13% (40)
Instagram
6% (19)
TikTok
9% (27)
Telegram
24% (74)
Youtube
31% (96)
Twitter
2% (5)
А що це?
14% (44)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».