Новые модели ИИ OpenAI GPT-4.1 сосредоточены на кодировании

15.04.25

2 620

GPT-4.1, GPT-4.1 mini и GPT-4.1 nano, все из которых OpenAI говорит «отлично» в кодировании и последующих инструкциях. Мультимодальные модели, доступные через API OpenAI, но не через ChatGPT, имеют окно контекста в 1 миллион токенов, что означает, что они могут принимать примерно 750 000 слов за один раз.

GPT-4.1 появляется, когда конкуренты OpenAI, такие как Google и Anthropic, активизируют усилия по созданию сложных моделей программирования.

Недавно выпущенный Google Gemini 2.5 Pro, который также имеет контекстное окно в 1 миллион токенов, занимает высокие позиции в популярных тестах кодирования, пишет TechCrunch. Так же как Claude 3.7 Sonnet от Anthropic и обновленный V3 китайского стартапа DeepSeek с искусственным интеллектом.

Целью многих технологических гигантов, включая OpenAI, является обучение моделей кодирования ИИ, способных выполнять сложные задачи разработки программного обеспечения. Большие амбиции OpenAI — создать «агентного программного инженера», как сказала финансовый директор Сара Фриар во время технического саммита в Лондоне в прошлом месяце. Компания утверждает, что ее будущие модели смогут сквозно программировать целые приложения, руководствуясь такими аспектами, как обеспечение качества, тестирование ошибок и написание документации.

GPT-4.1 является шагом в этом направлении.

«Мы оптимизировали GPT-4.1 для использования в реальном мире на основе прямой обратной связи, чтобы улучшить те сферы, которые больше всего интересуют разработчиков: интерфейсное кодирование, внесение меньшего количества сторонних правок, надежное соблюдение форматов, соблюдение структуры ответов и порядка, согласованное использование инструментов и т.д.», — представитель OpenAI. «Эти усовершенствования позволяют разработчикам создавать агенты, которые значительно лучше справляются с реальными задачами разработки программного обеспечения».

OpenAI утверждает, что полная модель GPT-4.1 превосходит свои модели GPT-4o и GPT-4o mini по тестам кодирования, включая SWE-bench. Говорят, что GPT-4.1 mini и nano являются более эффективными и более быстрыми за счет определенной точности, а OpenAI говорит, что GPT-4.1 nano является самой быстрой — и самой дешевой — моделью в истории.

GPT-4.1 стоит 2 доллара США за миллион входных токенов и 8 долларов США за миллион выходных токенов. GPT-4.1 mini составляет 0,40 долларов США/миллион входных токенов и 1,60 долларов США/миллион выходных токенов, а GPT-4.1 nano — 0,10 долларов США/миллион входных токенов и 0,40 долларов США/миллион выходных токенов.

Согласно внутреннему тестированию OpenAI, GPT-4.1, который может генерировать больше токенов одновременно, чем GPT-4o (32 768 против 16 384), набрал от 52% до 54,6% на SWE-bench Verified, проверенном человеком подмножестве SWE-bench. (OpenAI отметил в заметке в блоге, что некоторые решения проблем SWE-bench Verified не могут работать на его инфраструктуре, следовательно, диапазон баллов). Эти цифры немного ниже показателей, сообщенных Google и Anthropic для Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%), соответственно, по тому же тесту.

0 Комментариев

Оставить свой комментарий

Оставить комментарий

Актуальное

Бизнес

Что делает людей действительно успешными и счастливыми на работе

Бизнес

На протяжении десятилетий корпоративный мир пытался разгадать секрет максимальной производительности сотрудников. Большинство компаний до сих пор пола...

31.07.26

608

Бизнес

Переосмысление капитала: альтернативные пути финансирования для бизнеса

Инвестиции

В условиях военного положения, высоких процентных ставок и общей экономической неопределённости традиционное банковское кредитование остаётся недоступ...

30.07.26

674

Инновации

ИИ в маркетинге новостроек: что уже работает на практике

Недвижимость

В прошлом году в одной из публикаций я писал об ИИ в основном как об образе будущего — новой цифровой среде, в которой люди, компании, данные и интелл...

29.07.26

762

Все публикации

Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована