Нові моделі ШІ OpenAI GPT-4.1 зосереджені на кодуванні

15.04.25

0

655

0

GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі з яких OpenAI каже «відмінно» у кодуванні та наступних інструкціях. Мультимодальні моделі, доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть приймати приблизно 750 000 слів за один раз.

GPT-4.1 з’являється, коли конкуренти OpenAI, такі як Google і Anthropic, активізують зусилля зі створення складних моделей програмування.

Нещодавно випущений Google Gemini 2.5 Pro, який також має контекстне вікно в 1 мільйон токенів, займає високі позиції в популярних тестах кодування, пише TechCrunch. Так само як Claude 3.7 Sonnet від Anthropic і оновлений V3 китайського стартапу DeepSeek зі штучним інтелектом.

Метою багатьох технологічних гігантів, включаючи OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Великі амбіції OpenAI — створити «агентного програмного інженера», як сказала фінансовий директор Сара Фріар під час технічного саміту в Лондоні минулого місяця. Компанія стверджує, що її майбутні моделі зможуть наскрізно програмувати цілі додатки, керуючись такими аспектами, як забезпечення якості, тестування помилок і написання документації.

GPT-4.1 є кроком у цьому напрямку.

OpenAI
OpenAI

«Ми оптимізували GPT-4.1 для використання в реальному світі на основі прямого зворотного зв’язку, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, внесення меншої кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI. «Ці вдосконалення дозволяють розробникам створювати агенти, які значно краще справляються з реальними завданнями розробки програмного забезпечення».

OpenAI стверджує, що повна модель GPT-4.1 перевершує свої моделі GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Кажуть, що GPT-4.1 mini і nano є більш ефективними та швидшими за рахунок певної точності, а OpenAI каже, що GPT-4.1 nano є найшвидшою — і найдешевшою — моделлю в історії.

GPT-4.1 коштує 2 долари США за мільйон вхідних токенів і 8 доларів США за мільйон вихідних токенів. GPT-4.1 mini становить 0,40 доларів США/мільйон вхідних токенів і 1,60 доларів США/мільйон вихідних токенів, а GPT-4.1 nano – 0,10 доларів США/мільйон вхідних токенів і 0,40 доларів США/мільйон вихідних токенів.

Згідно з внутрішнім тестуванням OpenAI, GPT-4.1, який може генерувати більше токенів одночасно, ніж GPT-4o (32 768 проти 16 384), набрав від 52% до 54,6% на SWE-bench Verified, перевіреній людиною підмножині SWE-bench. (OpenAI зазначив у дописі в блозі, що деякі рішення проблем SWE-bench Verified не можуть працювати на його інфраструктурі, отже, діапазон балів.) Ці цифри трохи нижчі від показників, повідомлених Google і Anthropic для Gemini 2.5 Pro (63,8%) і Claude 3.7 Sonnet (62,3%), відповідно, за тим самим тестом.

Залишити коментар

Актуальне

Статки спадкоємця Gucci падають, оскільки він не може відродити бізнес

Бізнес

Статки спадкоємця Gucci падають, оскільки він не може відродити бізнес

Бізнес

Франсуа Піно, вісімдесятирічний засновник Kering SA, став свідком того, як статки його сім'ї скоротилися на понад дві третини після буму, спричиненого...

25.04.25

743

0
Вчені знайшли «найвагоміший доказ» існування життя на далекій планеті

Інновації

Вчені знайшли «найвагоміший доказ» існування життя на далекій планеті

BioTech

Вчені знайшли нові, але попередні докази того, що далекий світ, що обертається навколо іншої зірки, може бути домом для життя. Кембриджська команда, я...

19.04.25

1 000

0
Квартальні продажі Hermès постраждали через слабкий попит на предмети розкоші в Китаї

Аналітика

Квартальні продажі Hermès постраждали через слабкий попит на предмети розкоші в Китаї

Аналітика

Продажі Hermès на початку року постраждали через зниження попиту в Китаї, що показало, що навіть найстійкіший постачальник товарів класу люкс не уникн...

17.04.25

575

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

44 609

0
Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

7 958

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

6 249

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

5 872

0
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

5 849

1

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (42)
Instagram
6% (21)
TikTok
9% (31)
Telegram
23% (78)
Youtube
33% (111)
Twitter
1% (5)
А що це?
15% (50)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».