Нові моделі ШІ OpenAI GPT-4.1 зосереджені на кодуванні

15.04.25

0

1 549

0

GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі з яких OpenAI каже «відмінно» у кодуванні та наступних інструкціях. Мультимодальні моделі, доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть приймати приблизно 750 000 слів за один раз.

GPT-4.1 з’являється, коли конкуренти OpenAI, такі як Google і Anthropic, активізують зусилля зі створення складних моделей програмування.

Нещодавно випущений Google Gemini 2.5 Pro, який також має контекстне вікно в 1 мільйон токенів, займає високі позиції в популярних тестах кодування, пише TechCrunch. Так само як Claude 3.7 Sonnet від Anthropic і оновлений V3 китайського стартапу DeepSeek зі штучним інтелектом.

Метою багатьох технологічних гігантів, включаючи OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Великі амбіції OpenAI — створити «агентного програмного інженера», як сказала фінансовий директор Сара Фріар під час технічного саміту в Лондоні минулого місяця. Компанія стверджує, що її майбутні моделі зможуть наскрізно програмувати цілі додатки, керуючись такими аспектами, як забезпечення якості, тестування помилок і написання документації.

GPT-4.1 є кроком у цьому напрямку.

OpenAI
OpenAI

«Ми оптимізували GPT-4.1 для використання в реальному світі на основі прямого зворотного зв’язку, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, внесення меншої кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI. «Ці вдосконалення дозволяють розробникам створювати агенти, які значно краще справляються з реальними завданнями розробки програмного забезпечення».

OpenAI стверджує, що повна модель GPT-4.1 перевершує свої моделі GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Кажуть, що GPT-4.1 mini і nano є більш ефективними та швидшими за рахунок певної точності, а OpenAI каже, що GPT-4.1 nano є найшвидшою — і найдешевшою — моделлю в історії.

GPT-4.1 коштує 2 долари США за мільйон вхідних токенів і 8 доларів США за мільйон вихідних токенів. GPT-4.1 mini становить 0,40 доларів США/мільйон вхідних токенів і 1,60 доларів США/мільйон вихідних токенів, а GPT-4.1 nano – 0,10 доларів США/мільйон вхідних токенів і 0,40 доларів США/мільйон вихідних токенів.

Згідно з внутрішнім тестуванням OpenAI, GPT-4.1, який може генерувати більше токенів одночасно, ніж GPT-4o (32 768 проти 16 384), набрав від 52% до 54,6% на SWE-bench Verified, перевіреній людиною підмножині SWE-bench. (OpenAI зазначив у дописі в блозі, що деякі рішення проблем SWE-bench Verified не можуть працювати на його інфраструктурі, отже, діапазон балів.) Ці цифри трохи нижчі від показників, повідомлених Google і Anthropic для Gemini 2.5 Pro (63,8%) і Claude 3.7 Sonnet (62,3%), відповідно, за тим самим тестом.

Залишити коментар

Актуальне

Керівники McKinsey та General Catalyst кажуть, що ера «навчися один раз, працюй вічно» закінчилася

Бізнес

Керівники McKinsey та General Catalyst кажуть, що ера «навчися один раз, працюй вічно» закінчилася

Бізнес

У вівторок у прямому ефірі подкасту All-In співведучий Джейсон Калаканіс взяв інтерв'ю у Боба Стернфелса, глобального керуючого партнера McKinsey &amp...

07.01.26

506

0
Зараз кожен пристойний ресторан має свій продукт у продуктовому магазині

Бізнес

Зараз кожен пристойний ресторан має свій продукт у продуктовому магазині

Бізнес

Колись основна привабливість ресторанів полягала в тому, що вони пропонували смаки, які ви не могли знайти вдома. Якщо ви хотіли те, що продав найкращ...

08.01.26

518

0
Чому так багато залежить від буму центрів обробки даних

Аналітика

Чому так багато залежить від буму центрів обробки даних

Аналітика

Підприємці Кремнієвої долини воліють говорити про можливості, а не про перешкоди, та про величезні можливості для отримання доходу, які можна отримати...

04.01.26

675

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

46 348

0
Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

9 727

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

8 063

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

7 465

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

7 294

1

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (23)
TikTok
8% (33)
Telegram
22% (88)
Youtube
35% (143)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».