Нові моделі ШІ OpenAI GPT-4.1 зосереджені на кодуванні

15.04.25

0

760

0

GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі з яких OpenAI каже «відмінно» у кодуванні та наступних інструкціях. Мультимодальні моделі, доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть приймати приблизно 750 000 слів за один раз.

GPT-4.1 з’являється, коли конкуренти OpenAI, такі як Google і Anthropic, активізують зусилля зі створення складних моделей програмування.

Нещодавно випущений Google Gemini 2.5 Pro, який також має контекстне вікно в 1 мільйон токенів, займає високі позиції в популярних тестах кодування, пише TechCrunch. Так само як Claude 3.7 Sonnet від Anthropic і оновлений V3 китайського стартапу DeepSeek зі штучним інтелектом.

Метою багатьох технологічних гігантів, включаючи OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Великі амбіції OpenAI — створити «агентного програмного інженера», як сказала фінансовий директор Сара Фріар під час технічного саміту в Лондоні минулого місяця. Компанія стверджує, що її майбутні моделі зможуть наскрізно програмувати цілі додатки, керуючись такими аспектами, як забезпечення якості, тестування помилок і написання документації.

GPT-4.1 є кроком у цьому напрямку.

OpenAI
OpenAI

«Ми оптимізували GPT-4.1 для використання в реальному світі на основі прямого зворотного зв’язку, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, внесення меншої кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI. «Ці вдосконалення дозволяють розробникам створювати агенти, які значно краще справляються з реальними завданнями розробки програмного забезпечення».

OpenAI стверджує, що повна модель GPT-4.1 перевершує свої моделі GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Кажуть, що GPT-4.1 mini і nano є більш ефективними та швидшими за рахунок певної точності, а OpenAI каже, що GPT-4.1 nano є найшвидшою — і найдешевшою — моделлю в історії.

GPT-4.1 коштує 2 долари США за мільйон вхідних токенів і 8 доларів США за мільйон вихідних токенів. GPT-4.1 mini становить 0,40 доларів США/мільйон вхідних токенів і 1,60 доларів США/мільйон вихідних токенів, а GPT-4.1 nano – 0,10 доларів США/мільйон вхідних токенів і 0,40 доларів США/мільйон вихідних токенів.

Згідно з внутрішнім тестуванням OpenAI, GPT-4.1, який може генерувати більше токенів одночасно, ніж GPT-4o (32 768 проти 16 384), набрав від 52% до 54,6% на SWE-bench Verified, перевіреній людиною підмножині SWE-bench. (OpenAI зазначив у дописі в блозі, що деякі рішення проблем SWE-bench Verified не можуть працювати на його інфраструктурі, отже, діапазон балів.) Ці цифри трохи нижчі від показників, повідомлених Google і Anthropic для Gemini 2.5 Pro (63,8%) і Claude 3.7 Sonnet (62,3%), відповідно, за тим самим тестом.

Залишити коментар

Актуальне

SEO просування в епоху ШІ: як бізнесу адаптуватися до нової реальності

Інновації

SEO просування в епоху ШІ: як бізнесу адаптуватися до нової реальності

Інновації

Світ цифрового маркетингу стрімко змінюється під впливом штучного інтелекту. Пошукові системи змінюються: тепер до них інтегруються мовні моделі, які...

02.06.25

556

0
Чому штучний інтелект такий дорогий

Інновації

Чому штучний інтелект такий дорогий

Інновації

Минуло трохи більше півтора року з того часу, як весь світ накрила хвиля ейфорії від генеративного штучного інтелекту. За цей час великі технокорпорац...

02.06.25

603

0
Співробітники стартапу Neuralink визнають, що компанія Ілона Маска вбила 1500 тварин

Інновації

Співробітники стартапу Neuralink визнають, що компанія Ілона Маска вбила 1500 тварин

Новини компаній

У стартапі Ілона Маска, який займається розробкою інтерфейсу мозку та комп'ютера, з'явилися проблеми. Внутрішні співробітники попереджають про хаос, к...

27.05.25

2 303

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

44 837

0
Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

8 266

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

6 481

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

6 065

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

6 047

1

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (43)
Instagram
6% (21)
TikTok
9% (32)
Telegram
23% (82)
Youtube
33% (116)
Twitter
1% (5)
А що це?
15% (51)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».