Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

24.02.25

0

1 183

0

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями стільки часу, скільки потрібно користувачам.

Anthropic називає Claude 3.7 Sonnet першою в галузі «гібридною моделлю міркувань ШІ», тому що це єдина модель, яка може давати як відповіді в реальному часі, так і більш виважені, «продумані» відповіді на запитання. Користувачі можуть вибирати, чи активувати «розумові» здібності моделі ШІ, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду часу.

Claude 3.7 Sonnet
Anthropic

Модель являє собою ширші зусилля Anthropic зі спрощення користувацького досвіду навколо своїх продуктів ШІ. Більшість чат-ботів ШІ сьогодні мають лякаючий вибір моделі, який змушує користувачів обирати з кількох різних варіантів, що різняться за вартістю та можливостями. Такі лабораторії, як Anthropic, воліли б, щоб ви не думали про це  в ідеалі одна модель робить усю роботу.

Claude 3.7 Sonnet буде доступний усім користувачам і розробникам у понеділок, повідомила Anthropic, але тільки ті, хто заплатить за преміум-плани чат-бота Claude від Anthropic, отримають доступ до функцій міркування моделі. Безкоштовні користувачі Claude отримають стандартну версію Claude 3.7 Sonnet без міркувань, яка, за твердженням Anthropic, перевершує її попередню передову модель ШІ Claude 3.5 Sonnet. 

Claude 3.7 Sonnet коштує $3 за мільйон вхідних токенів (тобто ви можете ввести приблизно 750 000 слів, більше слів, ніж уся серія «Володар кілець», у Claude за $3) і $15 за мільйон вихідних токенів. Це робить його дорожчим, ніж o3-mini від OpenAI ($1,10 за 1 мільйон вхідних токенів/$4,40 за 1 мільйон вихідних токенів) і R1 від DeepSeek (55 центів за 1 мільйон вхідних токенів/$2,19 за 1 мільйон вихідних токенів), але майте на увазі, що o3-mini та R1  це суворо міркуючі моделі, а не гібриди, як Claude 3.7 Sonnet.

Claude 3.7 Sonnet  перша модель штучного інтелекту від Anthropic, здатна «міркувати»  метод, до якого звернулися багато лабораторій штучного інтелекту, оскільки традиційні методи підвищення продуктивності штучного інтелекту втрачають свою актуальність.

Моделі міркувань, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google і Grok 3 (Think) від xAI, використовують більше часу й обчислювальної потужності перед відповіддю на запитання. Моделі розбивають проблеми на більш дрібні кроки, що підвищує точність остаточної відповіді. Моделі міркувань не обов'язково думають або міркують так, як це робить людина, але їхній процес моделюється після дедукції.

Зрештою Anthropic хотіла б, щоб Claude самостійно визначав, як довго йому слід «думати» над питаннями, не вимагаючи від користувачів попереднього вибору елементів управління, розповіла в інтерв'ю керівниця відділу досліджень і розробки продуктів Anthropic Дайанна Пенн.

«Подібно до того, як у людей немає двох окремих мізків для запитань, на які можна відповісти негайно, і для тих, що потребують роздумів», — написав Антропік у повідомленні в блозі, опублікованому TechCrunch, — “ми розглядаємо міркування просто як одну з можливостей, якою має володіти прикордонна модель, яку необхідно плавно інтегрувати з іншими можливостями, а не як щось, що повинно бути представлено в окремій моделі”.
Anthropic повідомляє, що дозволяє Claude 3.7 Sonnet демонструвати свою внутрішню фазу планування за допомогою «видимого блокнота». Пенн повідомив TechCrunch, що користувачі побачать повний хід думок Клода для більшості підказок, але деякі частини можуть бути відредаговані з метою забезпечення довіри і безпеки.

Anthropic стверджує, що оптимізувала режими мислення Клода для завдань реального світу, як-от складні проблеми кодування або агентські завдання. Розробники, які використовують API Anthropic, можуть контролювати «бюджет» для мислення, швидкість торгівлі та вартість якості відповіді.

В одному тесті для вимірювання завдань кодування реального тексту, SWE-Bench, точність Claude 3.7 Sonnet склала 62,3%, порівняно з моделлю OpenAI o3-mini, яка набрала 49,3%. В іншому тесті для вимірювання здатності моделі ШІ взаємодіяти з модельованими користувачами та зовнішніми API в роздрібній торгівлі, TAU-Bench, точність Claude 3.7 Sonnet склала 81,2%, порівняно з моделлю OpenAI o1, яка набрала 73,5%.

Anthropic також заявляє, що Claude 3.7 Sonnet рідше відмовлятиметься відповідати на запитання, ніж попередні моделі, стверджуючи, що модель здатна проводити більш тонкі відмінності між шкідливими і нешкідливими підказками. Anthropic заявляє, що вона скоротила непотрібні відмови на 45% порівняно з Claude 3.5 Sonnet. Це відбувається в той час, коли деякі інші лабораторії ШІ переглядають свій підхід до обмеження відповідей свого чат-бота ШІ.

На додаток до Claude 3.7 Sonnet, Anthropic також випускає агентний інструмент кодування під назвою Claude Code. Запущений як дослідницький попередній перегляд, інструмент дає змогу розробникам запускати певні завдання через Claude прямо зі свого терміналу.

У демонстрації співробітники Anthropic показали, як Claude Code може аналізувати проект кодування за допомогою простої команди, наприклад, «Поясніть структуру цього проекту». Використовуючи просту англійську в командному рядку, розробник може змінювати кодову базу. Claude Code описуватиме свої правки в міру внесення змін і навіть тестуватиме проєкт на наявність помилок або відправлятиме його в репозиторій GitHub.

Представник Anthropic повідомив, що спочатку Claude Code буде доступний обмеженому числу користувачів за принципом «першим прийшов, першим обслужений».

Anthropic випускає Claude 3.7 Sonnet у той час, коли лабораторії ШІ постачають нові моделі ШІ із запаморочливою швидкістю. Anthropic історично дотримувалася більш методичного, орієнтованого на безпеку підходу. Але цього разу компанія прагне очолити групу.

Але як довго це триватиме  питання. OpenAI може бути близька до випуску власної гібридної моделі ШІ; генеральний директор компанії Сем Альтман заявив, що вона з'явиться через «місяці».

Залишити коментар

Актуальне

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

1 183

0
Чіп Majorana 1 від Microsoft відкриває новий шлях для квантових обчислень

Інновації

Чіп Majorana 1 від Microsoft відкриває новий шлях для квантових обчислень

Інновації

Microsoft представила Majorana 1, перший у світі квантовий чіп на основі нової архітектури Topological Core, який, як очікується, реалізує квантові ко...

22.02.25

1 117

0
У Києві відбувся Mind Export Summit 2025 – два дні про вихід бізнесу за кордон

Пресреліз

У Києві відбувся Mind Export Summit 2025 – два дні про вихід бізнесу за кордон

13 лютого у столичному КВЦ «Парковий» за підтримки Ощадбанку відбувся Mind Export Summit 2025 – захід для тих, хто бажає масштабувати свій бізнес на з...

21.02.25

686

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Як ШІ в маркетингових дослідженнях впливає на прийняття ділових та інвестиційних рішень

Бізнес

Як ШІ в маркетингових дослідженнях впливає на прийняття ділових та інвестиційних рішень

Бізнес

Чи знаєте ви, як еволюція маркетингових досліджень впливає на ухвалення ділових та інвестиційних рішень? Маркетингові дослідження можуть надати компан...

22.08.24

1 554

0
Як розпочати ремісничий бізнес

Бізнес

Як розпочати ремісничий бізнес

Бізнес

Це захоплююча ідея проводити дні, займаючись улюбленою справою, і заробляти на цьому. Але це щось більше, ніж просто насолоджуватися своїм ремеслом. Щ...

08.08.24

1 552

0
Максимізація доходу за допомогою гнучких методів ціноутворення

Бізнес

Максимізація доходу за допомогою гнучких методів ціноутворення

Бізнес

Швидка адаптація до ринкових коливань має важливе значення для успіху бізнесу. Однією з найефективніших стратегій підтримки конкурентної переваги є ви...

27.09.24

1 547

0
Projector Institute запускає AI-стартап LEZO  для найму та пошуку роботи. Ось як він працює

Пресреліз

Projector Institute запускає AI-стартап LEZO для найму та пошуку роботи. Ось як він працює

Український інститут Projector оголосив про офіційний запуск карʼєрного сервісу на основі штучного інтелекту LEZO, щоб якісно змінити підходи до найму...

08.02.24

1 545

0
Очікування бізнесу залишаються песимістичними

Бізнес

Очікування бізнесу залишаються песимістичними

Бізнес

У липні 2024 року ІОДА зріс до 44.4 з 43.6 у червні. Підприємства будівництва значно покращили стримані оцінки своїх економічних результатів завдяки с...

02.08.24

1 540

0
Інтерв'ю з Ваншикою Шріваставою про майбутнє блокчейну та сучасні тренди індустрії

Інвестиції

Інтерв'ю з Ваншикою Шріваставою про майбутнє блокчейну та сучасні тренди індустрії

Інтерв'ю

У світі технологічні інновації формують майбутнє, відкриваючи нові можливості різних галузей. Технологія блокчейн – одна з таких інновацій, яка вже ма...

28.06.24

1 537

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
13% (40)
Instagram
6% (19)
TikTok
9% (27)
Telegram
24% (74)
Youtube
31% (96)
Twitter
2% (5)
А що це?
14% (44)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».