Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

24.02.25

0

5 206

0

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями стільки часу, скільки потрібно користувачам.

Anthropic називає Claude 3.7 Sonnet першою в галузі «гібридною моделлю міркувань ШІ», тому що це єдина модель, яка може давати як відповіді в реальному часі, так і більш виважені, «продумані» відповіді на запитання. Користувачі можуть вибирати, чи активувати «розумові» здібності моделі ШІ, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду часу.

Claude 3.7 Sonnet
Anthropic

Модель являє собою ширші зусилля Anthropic зі спрощення користувацького досвіду навколо своїх продуктів ШІ. Більшість чат-ботів ШІ сьогодні мають лякаючий вибір моделі, який змушує користувачів обирати з кількох різних варіантів, що різняться за вартістю та можливостями. Такі лабораторії, як Anthropic, воліли б, щоб ви не думали про це  в ідеалі одна модель робить усю роботу.

Claude 3.7 Sonnet буде доступний усім користувачам і розробникам у понеділок, повідомила Anthropic, але тільки ті, хто заплатить за преміум-плани чат-бота Claude від Anthropic, отримають доступ до функцій міркування моделі. Безкоштовні користувачі Claude отримають стандартну версію Claude 3.7 Sonnet без міркувань, яка, за твердженням Anthropic, перевершує її попередню передову модель ШІ Claude 3.5 Sonnet. 

Claude 3.7 Sonnet коштує $3 за мільйон вхідних токенів (тобто ви можете ввести приблизно 750 000 слів, більше слів, ніж уся серія «Володар кілець», у Claude за $3) і $15 за мільйон вихідних токенів. Це робить його дорожчим, ніж o3-mini від OpenAI ($1,10 за 1 мільйон вхідних токенів/$4,40 за 1 мільйон вихідних токенів) і R1 від DeepSeek (55 центів за 1 мільйон вхідних токенів/$2,19 за 1 мільйон вихідних токенів), але майте на увазі, що o3-mini та R1  це суворо міркуючі моделі, а не гібриди, як Claude 3.7 Sonnet.

Claude 3.7 Sonnet  перша модель штучного інтелекту від Anthropic, здатна «міркувати»  метод, до якого звернулися багато лабораторій штучного інтелекту, оскільки традиційні методи підвищення продуктивності штучного інтелекту втрачають свою актуальність.

Моделі міркувань, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google і Grok 3 (Think) від xAI, використовують більше часу й обчислювальної потужності перед відповіддю на запитання. Моделі розбивають проблеми на більш дрібні кроки, що підвищує точність остаточної відповіді. Моделі міркувань не обов'язково думають або міркують так, як це робить людина, але їхній процес моделюється після дедукції.

Зрештою Anthropic хотіла б, щоб Claude самостійно визначав, як довго йому слід «думати» над питаннями, не вимагаючи від користувачів попереднього вибору елементів управління, розповіла в інтерв'ю керівниця відділу досліджень і розробки продуктів Anthropic Дайанна Пенн.

«Подібно до того, як у людей немає двох окремих мізків для запитань, на які можна відповісти негайно, і для тих, що потребують роздумів», — написав Антропік у повідомленні в блозі, опублікованому TechCrunch, — “ми розглядаємо міркування просто як одну з можливостей, якою має володіти прикордонна модель, яку необхідно плавно інтегрувати з іншими можливостями, а не як щось, що повинно бути представлено в окремій моделі”.
Anthropic повідомляє, що дозволяє Claude 3.7 Sonnet демонструвати свою внутрішню фазу планування за допомогою «видимого блокнота». Пенн повідомив TechCrunch, що користувачі побачать повний хід думок Клода для більшості підказок, але деякі частини можуть бути відредаговані з метою забезпечення довіри і безпеки.

Anthropic стверджує, що оптимізувала режими мислення Клода для завдань реального світу, як-от складні проблеми кодування або агентські завдання. Розробники, які використовують API Anthropic, можуть контролювати «бюджет» для мислення, швидкість торгівлі та вартість якості відповіді.

В одному тесті для вимірювання завдань кодування реального тексту, SWE-Bench, точність Claude 3.7 Sonnet склала 62,3%, порівняно з моделлю OpenAI o3-mini, яка набрала 49,3%. В іншому тесті для вимірювання здатності моделі ШІ взаємодіяти з модельованими користувачами та зовнішніми API в роздрібній торгівлі, TAU-Bench, точність Claude 3.7 Sonnet склала 81,2%, порівняно з моделлю OpenAI o1, яка набрала 73,5%.

Anthropic також заявляє, що Claude 3.7 Sonnet рідше відмовлятиметься відповідати на запитання, ніж попередні моделі, стверджуючи, що модель здатна проводити більш тонкі відмінності між шкідливими і нешкідливими підказками. Anthropic заявляє, що вона скоротила непотрібні відмови на 45% порівняно з Claude 3.5 Sonnet. Це відбувається в той час, коли деякі інші лабораторії ШІ переглядають свій підхід до обмеження відповідей свого чат-бота ШІ.

На додаток до Claude 3.7 Sonnet, Anthropic також випускає агентний інструмент кодування під назвою Claude Code. Запущений як дослідницький попередній перегляд, інструмент дає змогу розробникам запускати певні завдання через Claude прямо зі свого терміналу.

У демонстрації співробітники Anthropic показали, як Claude Code може аналізувати проект кодування за допомогою простої команди, наприклад, «Поясніть структуру цього проекту». Використовуючи просту англійську в командному рядку, розробник може змінювати кодову базу. Claude Code описуватиме свої правки в міру внесення змін і навіть тестуватиме проєкт на наявність помилок або відправлятиме його в репозиторій GitHub.

Представник Anthropic повідомив, що спочатку Claude Code буде доступний обмеженому числу користувачів за принципом «першим прийшов, першим обслужений».

Anthropic випускає Claude 3.7 Sonnet у той час, коли лабораторії ШІ постачають нові моделі ШІ із запаморочливою швидкістю. Anthropic історично дотримувалася більш методичного, орієнтованого на безпеку підходу. Але цього разу компанія прагне очолити групу.

Але як довго це триватиме  питання. OpenAI може бути близька до випуску власної гібридної моделі ШІ; генеральний директор компанії Сем Альтман заявив, що вона з'явиться через «місяці».

Залишити коментар

Актуальне

У тіні трильйону: Як Ілон Маск повторює шлях Рокфеллера і чому це лякає економістів

Бізнес

У тіні трильйону: Як Ілон Маск повторює шлях Рокфеллера і чому це лякає економістів

Бізнес

Сьогодні світ стоїть на порозі фінансової події, яку важко осягнути людським розумом: статки Ілона Маска стрімко наближаються до позначки в 1 трильйон...

13.03.26

634

0
5 способів швидкого розвитку вашого бізнесу

Бізнес

5 способів швидкого розвитку вашого бізнесу

Бізнес

Коли ви вперше запускаєте свій бізнес, ваша головна мета — створити свій бренд і почати зростати. На жаль, це не відбувається за одну ніч. Зростання —...

09.03.26

724

0
Чому технічні фахівці одержимі Moltbook, соціальною мережею для ботів

Аналітика

Чому технічні фахівці одержимі Moltbook, соціальною мережею для ботів

Інновації

Moltbook штурмом захопив технологічну індустрію — Ілон Маск припустив, що сайт представляє «дуже ранні стадії сингулярності» — і став неформальним вип...

10.03.26

827

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

9 410

1
Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Під час тестування своєї останньої моделі штучного інтелекту дослідники з Anthropic виявили щось дуже дивне: штучний інтелект був готовий і бажав вдав...

26.05.25

5 919

0
Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

5 206

0
Огляд передових моделей AI : які моделі змінять світ і як їх використовувати

Огляд

Огляд передових моделей AI : які моделі змінять світ і як їх використовувати

Інновації

Моделі ШІ розробляються із запаморочливою швидкістю всіма, від великих технологічних компаній на кшталт Google до стартапів на кшталт OpenAI і Anthrop...

18.02.25

4 995

0
Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Інновації

Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Стартапи

Напрочуд ефективна та потужна китайська модель ШІ захопила технологічну галузь штурмом. Він називається DeepSeek R1 і дратує нерви на Волл-стріт. Нов...

28.01.25

4 711

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (34)
Telegram
21% (88)
Youtube
36% (150)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».