Нові моделі ШІ OpenAI GPT-4.1 зосереджені на кодуванні

15.04.25

0

1 773

0

GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі з яких OpenAI каже «відмінно» у кодуванні та наступних інструкціях. Мультимодальні моделі, доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть приймати приблизно 750 000 слів за один раз.

GPT-4.1 з’являється, коли конкуренти OpenAI, такі як Google і Anthropic, активізують зусилля зі створення складних моделей програмування.

Нещодавно випущений Google Gemini 2.5 Pro, який також має контекстне вікно в 1 мільйон токенів, займає високі позиції в популярних тестах кодування, пише TechCrunch. Так само як Claude 3.7 Sonnet від Anthropic і оновлений V3 китайського стартапу DeepSeek зі штучним інтелектом.

Метою багатьох технологічних гігантів, включаючи OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Великі амбіції OpenAI — створити «агентного програмного інженера», як сказала фінансовий директор Сара Фріар під час технічного саміту в Лондоні минулого місяця. Компанія стверджує, що її майбутні моделі зможуть наскрізно програмувати цілі додатки, керуючись такими аспектами, як забезпечення якості, тестування помилок і написання документації.

GPT-4.1 є кроком у цьому напрямку.

OpenAI
OpenAI

«Ми оптимізували GPT-4.1 для використання в реальному світі на основі прямого зворотного зв’язку, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, внесення меншої кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI. «Ці вдосконалення дозволяють розробникам створювати агенти, які значно краще справляються з реальними завданнями розробки програмного забезпечення».

OpenAI стверджує, що повна модель GPT-4.1 перевершує свої моделі GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Кажуть, що GPT-4.1 mini і nano є більш ефективними та швидшими за рахунок певної точності, а OpenAI каже, що GPT-4.1 nano є найшвидшою — і найдешевшою — моделлю в історії.

GPT-4.1 коштує 2 долари США за мільйон вхідних токенів і 8 доларів США за мільйон вихідних токенів. GPT-4.1 mini становить 0,40 доларів США/мільйон вхідних токенів і 1,60 доларів США/мільйон вихідних токенів, а GPT-4.1 nano – 0,10 доларів США/мільйон вхідних токенів і 0,40 доларів США/мільйон вихідних токенів.

Згідно з внутрішнім тестуванням OpenAI, GPT-4.1, який може генерувати більше токенів одночасно, ніж GPT-4o (32 768 проти 16 384), набрав від 52% до 54,6% на SWE-bench Verified, перевіреній людиною підмножині SWE-bench. (OpenAI зазначив у дописі в блозі, що деякі рішення проблем SWE-bench Verified не можуть працювати на його інфраструктурі, отже, діапазон балів.) Ці цифри трохи нижчі від показників, повідомлених Google і Anthropic для Gemini 2.5 Pro (63,8%) і Claude 3.7 Sonnet (62,3%), відповідно, за тим самим тестом.

Залишити коментар

Актуальне

Вчора ви пили з ними пиво, а сьогодні ви їхній начальник. 7 кроків, щоб не стати посміховиськом на новій посаді

Бізнес

Вчора ви пили з ними пиво, а сьогодні ви їхній начальник. 7 кроків, щоб не стати посміховиськом на новій посаді

Бізнес

Перехід зі статусу фахівця у статус керівника — це не просто зміна таблички на дверях, а фундаментальна зміна ролі, яка вимагає дій. Вчора ви могли об...

19.02.26

569

0
Ви бідні не через лінощі. Чому одні заробляють копійки, а інші — мільйони за ту саму роботу

Бізнес

Ви бідні не через лінощі. Чому одні заробляють копійки, а інші — мільйони за ту саму роботу

Бізнес

Багатьом здається, що великі гроші — це якась магія, удача чи ознака неймовірної геніальності. Люди вірять, що треба народитися у «правильній» родині,...

18.02.26

508

0
Як ШІ змінює математику для стартапів

Аналітика

Як ШІ змінює математику для стартапів

Інтерв'ю

Аманда Сільвер з Microsoft протягом 24 років допомагає розробникам, а останні кілька років це означало створення інструментів для штучного інтелекту....

17.02.26

802

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

47 030

0
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

8 807

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

7 914

1
Головні біотехнологічні інновації 2023 року

Головні біотехнологічні інновації 2023 року

BioTech

У світі біотехнології кожен рік приносить приголомшливі інновації та переломні моменти, що сприяють розв'язанню складних проблем і поліпшенню якості ж...

06.10.23

5 395

0
Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Під час тестування своєї останньої моделі штучного інтелекту дослідники з Anthropic виявили щось дуже дивне: штучний інтелект був готовий і бажав вдав...

26.05.25

5 227

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (33)
Telegram
21% (88)
Youtube
36% (148)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».