Новые модели ИИ OpenAI GPT-4.1 сосредоточены на кодировании

15.04.25

0

624

0

GPT-4.1, GPT-4.1 mini и GPT-4.1 nano, все из которых OpenAI говорит «отлично» в кодировании и последующих инструкциях. Мультимодальные модели, доступные через API OpenAI, но не через ChatGPT, имеют окно контекста в 1 миллион токенов, что означает, что они могут принимать примерно 750 000 слов за один раз.

GPT-4.1 появляется, когда конкуренты OpenAI, такие как Google и Anthropic, активизируют усилия по созданию сложных моделей программирования.

Недавно выпущенный Google Gemini 2.5 Pro, который также имеет контекстное окно в 1 миллион токенов, занимает высокие позиции в популярных тестах кодирования, пишет TechCrunch.  Так же как Claude 3.7 Sonnet от Anthropic и обновленный V3 китайского стартапа DeepSeek с искусственным интеллектом.

Целью многих технологических гигантов, включая OpenAI, является обучение моделей кодирования ИИ, способных выполнять сложные задачи разработки программного обеспечения. Большие амбиции OpenAI — создать «агентного программного инженера», как сказала финансовый директор Сара Фриар во время технического саммита в Лондоне в прошлом месяце. Компания утверждает, что ее будущие модели смогут сквозно программировать целые приложения, руководствуясь такими аспектами, как обеспечение качества, тестирование ошибок и написание документации.

GPT-4.1 является шагом в этом направлении.

OpenAI
OpenAI

«Мы оптимизировали GPT-4.1 для использования в реальном мире на основе прямой обратной связи, чтобы улучшить те сферы, которые больше всего интересуют разработчиков: интерфейсное кодирование, внесение меньшего количества сторонних правок, надежное соблюдение форматов, соблюдение структуры ответов и порядка, согласованное использование инструментов и т.д.», — представитель OpenAI. «Эти усовершенствования позволяют разработчикам создавать агенты, которые значительно лучше справляются с реальными задачами разработки программного обеспечения».

OpenAI утверждает, что полная модель GPT-4.1 превосходит свои модели GPT-4o и GPT-4o mini по тестам кодирования, включая SWE-bench. Говорят, что GPT-4.1 mini и nano являются более эффективными и более быстрыми за счет определенной точности, а OpenAI говорит, что GPT-4.1 nano является самой быстрой — и самой дешевой — моделью в истории.

GPT-4.1 стоит 2 доллара США за миллион входных токенов и 8 долларов США за миллион выходных токенов. GPT-4.1 mini составляет 0,40 долларов США/миллион входных токенов и 1,60 долларов США/миллион выходных токенов, а GPT-4.1 nano — 0,10 долларов США/миллион входных токенов и 0,40 долларов США/миллион выходных токенов.

Согласно внутреннему тестированию OpenAI, GPT-4.1, который может генерировать больше токенов одновременно, чем GPT-4o (32 768 против 16 384), набрал от 52% до 54,6% на SWE-bench Verified, проверенном человеком подмножестве SWE-bench. (OpenAI отметил в заметке в блоге, что некоторые решения проблем SWE-bench Verified не могут работать на его инфраструктуре, следовательно, диапазон баллов). Эти цифры немного ниже показателей, сообщенных Google и Anthropic для Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%), соответственно, по тому же тесту.

Оставить комментарий

Актуальное

Квартальные продажи Hermès пострадали из-за слабого спроса на предметы роскоши в Китае

Аналитика

Квартальные продажи Hermès пострадали из-за слабого спроса на предметы роскоши в Китае

Аналитика

Продажи Hermès в начале года пострадали из-за снижения спроса в Китае, что показало, что даже самый устойчивый поставщик товаров класса люкс не избежа...

17.04.25

502

0
Female Freedom Forum 2025: в Киеве состоялось вдохновенное благотворительное мероприятие

Пресс-релиз

Female Freedom Forum 2025: в Киеве состоялось вдохновенное благотворительное мероприятие

Бизнес

13 апреля в Киеве, в отеле «Премьер Палац», уже в третий раз состоялся Female Freedom Forum 2025 — благотворительное мероприятие о женской смелости, с...

17.04.25

574

0
Alex Polin HR Summit 2025: трансформации, вызовы и новые горизонты

Пресс-релиз

Alex Polin HR Summit 2025: трансформации, вызовы и новые горизонты

Бизнес

10 апреля 2025 года в Киеве состоялось ключевое событие года в сфере управления талантами — Alex Polin HR Summit. Мероприятие объединило более 300 HR-...

16.04.25

433

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

44 569

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

7 905

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

6 207

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

5 838

0
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

5 809

1

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
13% (42)
Instagram
6% (21)
TikTok
9% (31)
Telegram
23% (77)
Youtube
32% (108)
Twitter
1% (5)
А что это?
15% (50)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».