Нові моделі ШІ OpenAI GPT-4.1 зосереджені на кодуванні

15.04.25

0

1 912

0

GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі з яких OpenAI каже «відмінно» у кодуванні та наступних інструкціях. Мультимодальні моделі, доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть приймати приблизно 750 000 слів за один раз.

GPT-4.1 з’являється, коли конкуренти OpenAI, такі як Google і Anthropic, активізують зусилля зі створення складних моделей програмування.

Нещодавно випущений Google Gemini 2.5 Pro, який також має контекстне вікно в 1 мільйон токенів, займає високі позиції в популярних тестах кодування, пише TechCrunch. Так само як Claude 3.7 Sonnet від Anthropic і оновлений V3 китайського стартапу DeepSeek зі штучним інтелектом.

Метою багатьох технологічних гігантів, включаючи OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Великі амбіції OpenAI — створити «агентного програмного інженера», як сказала фінансовий директор Сара Фріар під час технічного саміту в Лондоні минулого місяця. Компанія стверджує, що її майбутні моделі зможуть наскрізно програмувати цілі додатки, керуючись такими аспектами, як забезпечення якості, тестування помилок і написання документації.

GPT-4.1 є кроком у цьому напрямку.

OpenAI
OpenAI

«Ми оптимізували GPT-4.1 для використання в реальному світі на основі прямого зворотного зв’язку, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, внесення меншої кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI. «Ці вдосконалення дозволяють розробникам створювати агенти, які значно краще справляються з реальними завданнями розробки програмного забезпечення».

OpenAI стверджує, що повна модель GPT-4.1 перевершує свої моделі GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Кажуть, що GPT-4.1 mini і nano є більш ефективними та швидшими за рахунок певної точності, а OpenAI каже, що GPT-4.1 nano є найшвидшою — і найдешевшою — моделлю в історії.

GPT-4.1 коштує 2 долари США за мільйон вхідних токенів і 8 доларів США за мільйон вихідних токенів. GPT-4.1 mini становить 0,40 доларів США/мільйон вхідних токенів і 1,60 доларів США/мільйон вихідних токенів, а GPT-4.1 nano – 0,10 доларів США/мільйон вхідних токенів і 0,40 доларів США/мільйон вихідних токенів.

Згідно з внутрішнім тестуванням OpenAI, GPT-4.1, який може генерувати більше токенів одночасно, ніж GPT-4o (32 768 проти 16 384), набрав від 52% до 54,6% на SWE-bench Verified, перевіреній людиною підмножині SWE-bench. (OpenAI зазначив у дописі в блозі, що деякі рішення проблем SWE-bench Verified не можуть працювати на його інфраструктурі, отже, діапазон балів.) Ці цифри трохи нижчі від показників, повідомлених Google і Anthropic для Gemini 2.5 Pro (63,8%) і Claude 3.7 Sonnet (62,3%), відповідно, за тим самим тестом.

Залишити коментар

Актуальне

Найважливіше налаштування Google, яке ви не використовуєте

Бізнес

Найважливіше налаштування Google, яке ви не використовуєте

Бізнес

Існує безкоштовний автоматизований інструмент, який видаляє інформацію про вас із результатів пошуку Google. З якоїсь причини більшість людей ним не к...

20.03.26

567

0
Новий звіт показує, що додатки на базі штучного інтелекту мають проблеми з довгостроковим утриманням підписників

Аналітика

Новий звіт показує, що додатки на базі штучного інтелекту мають проблеми з довгостроковим утриманням підписників

Аналітика

З огляду на те, що провідні магазини додатків переповнені додатками зі штучним інтелектом, розробники можуть вважати, що найкращим способом отримання...

19.03.26

626

0
Як розпізнати справжню сутність: стратегія перевірки оточення та бізнес-партнерів

Бізнес

Як розпізнати справжню сутність: стратегія перевірки оточення та бізнес-партнерів

Бізнес

Особистий шарм — головний інструмент маніпулятора. Професійні аферисти завжди мають бездоганний вигляд, адже їхній дохід безпосередньо залежить від ум...

18.03.26

662

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

9 619

1
Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Під час тестування своєї останньої моделі штучного інтелекту дослідники з Anthropic виявили щось дуже дивне: штучний інтелект був готовий і бажав вдав...

26.05.25

6 170

0
Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

5 448

0
Огляд передових моделей AI : які моделі змінять світ і як їх використовувати

Огляд

Огляд передових моделей AI : які моделі змінять світ і як їх використовувати

Інновації

Моделі ШІ розробляються із запаморочливою швидкістю всіма, від великих технологічних компаній на кшталт Google до стартапів на кшталт OpenAI і Anthrop...

18.02.25

5 236

0
Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Інновації

Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Стартапи

Напрочуд ефективна та потужна китайська модель ШІ захопила технологічну галузь штурмом. Він називається DeepSeek R1 і дратує нерви на Волл-стріт. Нов...

28.01.25

4 800

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (34)
Telegram
21% (89)
Youtube
36% (150)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».