Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

24.02.25

0

764

0

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями стільки часу, скільки потрібно користувачам.

Anthropic називає Claude 3.7 Sonnet першою в галузі «гібридною моделлю міркувань ШІ», тому що це єдина модель, яка може давати як відповіді в реальному часі, так і більш виважені, «продумані» відповіді на запитання. Користувачі можуть вибирати, чи активувати «розумові» здібності моделі ШІ, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду часу.

Claude 3.7 Sonnet
Anthropic

Модель являє собою ширші зусилля Anthropic зі спрощення користувацького досвіду навколо своїх продуктів ШІ. Більшість чат-ботів ШІ сьогодні мають лякаючий вибір моделі, який змушує користувачів обирати з кількох різних варіантів, що різняться за вартістю та можливостями. Такі лабораторії, як Anthropic, воліли б, щоб ви не думали про це  в ідеалі одна модель робить усю роботу.

Claude 3.7 Sonnet буде доступний усім користувачам і розробникам у понеділок, повідомила Anthropic, але тільки ті, хто заплатить за преміум-плани чат-бота Claude від Anthropic, отримають доступ до функцій міркування моделі. Безкоштовні користувачі Claude отримають стандартну версію Claude 3.7 Sonnet без міркувань, яка, за твердженням Anthropic, перевершує її попередню передову модель ШІ Claude 3.5 Sonnet. 

Claude 3.7 Sonnet коштує $3 за мільйон вхідних токенів (тобто ви можете ввести приблизно 750 000 слів, більше слів, ніж уся серія «Володар кілець», у Claude за $3) і $15 за мільйон вихідних токенів. Це робить його дорожчим, ніж o3-mini від OpenAI ($1,10 за 1 мільйон вхідних токенів/$4,40 за 1 мільйон вихідних токенів) і R1 від DeepSeek (55 центів за 1 мільйон вхідних токенів/$2,19 за 1 мільйон вихідних токенів), але майте на увазі, що o3-mini та R1  це суворо міркуючі моделі, а не гібриди, як Claude 3.7 Sonnet.

Claude 3.7 Sonnet  перша модель штучного інтелекту від Anthropic, здатна «міркувати»  метод, до якого звернулися багато лабораторій штучного інтелекту, оскільки традиційні методи підвищення продуктивності штучного інтелекту втрачають свою актуальність.

Моделі міркувань, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google і Grok 3 (Think) від xAI, використовують більше часу й обчислювальної потужності перед відповіддю на запитання. Моделі розбивають проблеми на більш дрібні кроки, що підвищує точність остаточної відповіді. Моделі міркувань не обов'язково думають або міркують так, як це робить людина, але їхній процес моделюється після дедукції.

Зрештою Anthropic хотіла б, щоб Claude самостійно визначав, як довго йому слід «думати» над питаннями, не вимагаючи від користувачів попереднього вибору елементів управління, розповіла в інтерв'ю керівниця відділу досліджень і розробки продуктів Anthropic Дайанна Пенн.

«Подібно до того, як у людей немає двох окремих мізків для запитань, на які можна відповісти негайно, і для тих, що потребують роздумів», — написав Антропік у повідомленні в блозі, опублікованому TechCrunch, — “ми розглядаємо міркування просто як одну з можливостей, якою має володіти прикордонна модель, яку необхідно плавно інтегрувати з іншими можливостями, а не як щось, що повинно бути представлено в окремій моделі”.
Anthropic повідомляє, що дозволяє Claude 3.7 Sonnet демонструвати свою внутрішню фазу планування за допомогою «видимого блокнота». Пенн повідомив TechCrunch, що користувачі побачать повний хід думок Клода для більшості підказок, але деякі частини можуть бути відредаговані з метою забезпечення довіри і безпеки.

Anthropic стверджує, що оптимізувала режими мислення Клода для завдань реального світу, як-от складні проблеми кодування або агентські завдання. Розробники, які використовують API Anthropic, можуть контролювати «бюджет» для мислення, швидкість торгівлі та вартість якості відповіді.

В одному тесті для вимірювання завдань кодування реального тексту, SWE-Bench, точність Claude 3.7 Sonnet склала 62,3%, порівняно з моделлю OpenAI o3-mini, яка набрала 49,3%. В іншому тесті для вимірювання здатності моделі ШІ взаємодіяти з модельованими користувачами та зовнішніми API в роздрібній торгівлі, TAU-Bench, точність Claude 3.7 Sonnet склала 81,2%, порівняно з моделлю OpenAI o1, яка набрала 73,5%.

Anthropic також заявляє, що Claude 3.7 Sonnet рідше відмовлятиметься відповідати на запитання, ніж попередні моделі, стверджуючи, що модель здатна проводити більш тонкі відмінності між шкідливими і нешкідливими підказками. Anthropic заявляє, що вона скоротила непотрібні відмови на 45% порівняно з Claude 3.5 Sonnet. Це відбувається в той час, коли деякі інші лабораторії ШІ переглядають свій підхід до обмеження відповідей свого чат-бота ШІ.

На додаток до Claude 3.7 Sonnet, Anthropic також випускає агентний інструмент кодування під назвою Claude Code. Запущений як дослідницький попередній перегляд, інструмент дає змогу розробникам запускати певні завдання через Claude прямо зі свого терміналу.

У демонстрації співробітники Anthropic показали, як Claude Code може аналізувати проект кодування за допомогою простої команди, наприклад, «Поясніть структуру цього проекту». Використовуючи просту англійську в командному рядку, розробник може змінювати кодову базу. Claude Code описуватиме свої правки в міру внесення змін і навіть тестуватиме проєкт на наявність помилок або відправлятиме його в репозиторій GitHub.

Представник Anthropic повідомив, що спочатку Claude Code буде доступний обмеженому числу користувачів за принципом «першим прийшов, першим обслужений».

Anthropic випускає Claude 3.7 Sonnet у той час, коли лабораторії ШІ постачають нові моделі ШІ із запаморочливою швидкістю. Anthropic історично дотримувалася більш методичного, орієнтованого на безпеку підходу. Але цього разу компанія прагне очолити групу.

Але як довго це триватиме  питання. OpenAI може бути близька до випуску власної гібридної моделі ШІ; генеральний директор компанії Сем Альтман заявив, що вона з'явиться через «місяці».

Залишити коментар

Актуальне

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

764

0
Чіп Majorana 1 від Microsoft відкриває новий шлях для квантових обчислень

Інновації

Чіп Majorana 1 від Microsoft відкриває новий шлях для квантових обчислень

Інновації

Microsoft представила Majorana 1, перший у світі квантовий чіп на основі нової архітектури Topological Core, який, як очікується, реалізує квантові ко...

22.02.25

653

0
У Києві відбувся Mind Export Summit 2025 – два дні про вихід бізнесу за кордон

Пресреліз

У Києві відбувся Mind Export Summit 2025 – два дні про вихід бізнесу за кордон

13 лютого у столичному КВЦ «Парковий» за підтримки Ощадбанку відбувся Mind Export Summit 2025 – захід для тих, хто бажає масштабувати свій бізнес на з...

21.02.25

600

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Книги, які варто прочитати у 2025 році

Огляд

Книги, які варто прочитати у 2025 році

Аналітика

Тільки книжки — як літературні, так і науково-популярні — здаються несприйнятливими до зовнішнього тиску; вони все ще ставлять важкі запитання та дают...

30.12.24

2 845

0
Ключові переваги гібридної та віддаленої роботи

Аналітика

Ключові переваги гібридної та віддаленої роботи

Аналітика

Чи відчуває бізнес все ще загрозу через дистанційну роботу? Можливо. Легко зрозуміти, чому так багато власників бізнесу виступають проти віддаленої ро...

04.10.24

2 807

0
10 ефективних методів вимірювання щастя співробітників

Бізнес

10 ефективних методів вимірювання щастя співробітників

Бізнес

Керівникам малого бізнесу важливо визначити, наскільки щасливі та задоволені працівники своєю роботою, щоб визначити здоров’я та силу свого бізнесу. Ч...

21.10.24

2 757

0
Які біотехнології нам потрібні, щоб досягти Марса

Огляд

Які біотехнології нам потрібні, щоб досягти Марса

BioTech

Оскільки ми готуємося до далеких космічних подорожей і життя на Марсі, біотехнології матимуть важливе значення для того, щоб космічні кораблі більше н...

11.10.23

2 555

0
Топ 10 стартапів вересня, які отримали мільйонні інвестиції

Інвестиції

Топ 10 стартапів вересня, які отримали мільйонні інвестиції

Інвестиції

Переможцями вересня стали штучний інтелект, космос і біотехнології, зібравши понад 2 мільярди доларів у п'яти найбільших раундах. Anthropic Anthropic,...

03.10.23

2 494

1
Способи, якими рекламна продукція може допомогти стартапу залишити свій слід

Бізнес

Способи, якими рекламна продукція може допомогти стартапу залишити свій слід

Аналітика

Рекламна продукція - важливий маркетинговий інструмент для будь-якого бізнесу. Але вони особливо ефективні для компаній-початківців. Вони роблять ваш...

05.12.23

2 403

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
13% (40)
Instagram
6% (19)
TikTok
9% (27)
Telegram
24% (74)
Youtube
31% (96)
Twitter
2% (5)
А що це?
14% (44)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».