Новые модели ИИ OpenAI GPT-4.1 сосредоточены на кодировании

15.04.25

0

670

0

GPT-4.1, GPT-4.1 mini и GPT-4.1 nano, все из которых OpenAI говорит «отлично» в кодировании и последующих инструкциях. Мультимодальные модели, доступные через API OpenAI, но не через ChatGPT, имеют окно контекста в 1 миллион токенов, что означает, что они могут принимать примерно 750 000 слов за один раз.

GPT-4.1 появляется, когда конкуренты OpenAI, такие как Google и Anthropic, активизируют усилия по созданию сложных моделей программирования.

Недавно выпущенный Google Gemini 2.5 Pro, который также имеет контекстное окно в 1 миллион токенов, занимает высокие позиции в популярных тестах кодирования, пишет TechCrunch.  Так же как Claude 3.7 Sonnet от Anthropic и обновленный V3 китайского стартапа DeepSeek с искусственным интеллектом.

Целью многих технологических гигантов, включая OpenAI, является обучение моделей кодирования ИИ, способных выполнять сложные задачи разработки программного обеспечения. Большие амбиции OpenAI — создать «агентного программного инженера», как сказала финансовый директор Сара Фриар во время технического саммита в Лондоне в прошлом месяце. Компания утверждает, что ее будущие модели смогут сквозно программировать целые приложения, руководствуясь такими аспектами, как обеспечение качества, тестирование ошибок и написание документации.

GPT-4.1 является шагом в этом направлении.

OpenAI
OpenAI

«Мы оптимизировали GPT-4.1 для использования в реальном мире на основе прямой обратной связи, чтобы улучшить те сферы, которые больше всего интересуют разработчиков: интерфейсное кодирование, внесение меньшего количества сторонних правок, надежное соблюдение форматов, соблюдение структуры ответов и порядка, согласованное использование инструментов и т.д.», — представитель OpenAI. «Эти усовершенствования позволяют разработчикам создавать агенты, которые значительно лучше справляются с реальными задачами разработки программного обеспечения».

OpenAI утверждает, что полная модель GPT-4.1 превосходит свои модели GPT-4o и GPT-4o mini по тестам кодирования, включая SWE-bench. Говорят, что GPT-4.1 mini и nano являются более эффективными и более быстрыми за счет определенной точности, а OpenAI говорит, что GPT-4.1 nano является самой быстрой — и самой дешевой — моделью в истории.

GPT-4.1 стоит 2 доллара США за миллион входных токенов и 8 долларов США за миллион выходных токенов. GPT-4.1 mini составляет 0,40 долларов США/миллион входных токенов и 1,60 долларов США/миллион выходных токенов, а GPT-4.1 nano — 0,10 долларов США/миллион входных токенов и 0,40 долларов США/миллион выходных токенов.

Согласно внутреннему тестированию OpenAI, GPT-4.1, который может генерировать больше токенов одновременно, чем GPT-4o (32 768 против 16 384), набрал от 52% до 54,6% на SWE-bench Verified, проверенном человеком подмножестве SWE-bench. (OpenAI отметил в заметке в блоге, что некоторые решения проблем SWE-bench Verified не могут работать на его инфраструктуре, следовательно, диапазон баллов). Эти цифры немного ниже показателей, сообщенных Google и Anthropic для Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%), соответственно, по тому же тесту.

Оставить комментарий

Актуальное

Какие существуют типы владения бизнесом? Все, что нужно знать предпринимателям

Бизнес

Какие существуют типы владения бизнесом? Все, что нужно знать предпринимателям

Бизнес

Владение бизнесом может быть сложным и долгим процессом. Особенно, когда вы застреваете на первом препятствии: знание различных типов владения бизнесо...

26.04.25

522

0
Состояние наследника Gucci падает, поскольку он не может возродить бизнес

Бизнес

Состояние наследника Gucci падает, поскольку он не может возродить бизнес

Бизнес

Франсуа Пино, восьмидесятилетний основатель Kering SA, стал свидетелем того, как состояние его семьи сократилось более чем на две трети после бума, вы...

25.04.25

772

0
Ученые нашли «самое весомое доказательство» существования жизни на далекой планете

Инновации

Ученые нашли «самое весомое доказательство» существования жизни на далекой планете

BioTech

Ученые нашли новые, но предварительные доказательства того, что далекий мир, вращающийся вокруг другой звезды, может быть домом для жизни. Кембриджска...

19.04.25

1 022

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

44 621

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

7 980

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

6 256

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

5 879

0
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

5 863

1

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (42)
Instagram
6% (21)
TikTok
9% (31)
Telegram
23% (78)
Youtube
33% (111)
Twitter
1% (5)
А что это?
15% (50)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».