OpenAI запустила GPT-5, новую флагманскую модель искусственного интеллекта

08.08.25

0

554

0

GPT-5, выпущенная в четверг, является первой «унифицированной» моделью искусственного интеллекта OpenAI, которая сочетает в себе возможности мышления моделей серии o с быстрыми реакциями серии GPT.

Модель следующего поколения GPT-5 больше похожа на агента, чем на чат-бота.

OpenAI
OpenAI

С помощью GPT-5 OpenAI также стремился сделать ChatGPT более простым в использовании. Вместо того, чтобы просить пользователей выбирать правильные настройки, GPT-5 оснащен маршрутизатором в режиме реального времени, который решает, как предложить лучший ответ, независимо от того, является ли это быстрым ответом на вопросы пользователей или дополнительным временем для «обдумывания» ответов.

Во время брифинга с журналистами генеральный директор OpenAI Сэм Альтман заявил, что GPT-5 является «лучшей моделью в мире», и сказал, что она представляет собой «значительный шаг» на пути компании к разработке искусственного интеллекта, который может превзойти людей в наиболее экономически ценной работе, то есть в искусственном общем интеллекте (ИОИ).

«Наличие чего-то вроде GPT-5 было бы практически немыслимым в любой предыдущий период истории», — сказал Альтман.

GPT-5 будет доступен всем бесплатным пользователям ChatGPT как модель по умолчанию. Вице-президент OpenAI по вопросам ChatGPT Ник Терли заявил, что это часть усилий компании, направленных на то, чтобы впервые предоставить бесплатным пользователям доступ к модели рассуждений искусственного интеллекта. Ранее компания ограничивала эти более продвинутые модели платным доступом.

OpenAI утверждает, что GPT-5 является самым современным в нескольких сферах, несколько опережая ведущие модели ИИ от Anthropic, Google DeepMind и xAI Илона Маска по ключевым тестам. Однако GPT-5 несколько уступает передовым моделям ИИ в других областях.

В SWE-bench Verified — тесте реальных задач кодирования, взятых из GitHub — GPT-5 набрал 74,9% с первой попытки. Это означает, что GPT-5 немного превосходит последнюю модель Claude Opus 4.1 от Anthropic, которая набрала 74,5%, и Gemini 2.5 Pro от Google DeepMind, набравшую 59,6.

На «Последнем экзамене человечества» — сложном тесте, измеряющем производительность моделей искусственного интеллекта в математике, гуманитарных и естественных науках — версия GPT-5 с расширенным мышлением (GPT-5 Pro) набрала 42% при использовании инструментов. Это немного меньше, чем xAI смог достичь с Grok 4 Heavy, который набрал 44,4% в тесте.

В GPQA Diamond — тесте по научным вопросам уровня PhD — GPT-5 pro набрал 89,4% с первой попытки, превзойдя Claude Opus 4.1, который набрал 80,9%, и Grok 4 Heavy, который набрал 88,9%.

OpenAI утверждает, что GPT-5 лучше подходит для ответов на вопросы, связанные со здоровьем. В тесте HealthBench Hard Hallucinations, который измеряет точность ответов моделей ИИ на темы здравоохранения, OpenAI утверждает, что GPT-5 (с мышлением) вызывает галлюцинации только в 1,6% случаев. Это намного ниже, чем у предыдущих моделей компании GPT-4o и o3, которые набрали 12,9% и 15,8% соответственно.

Кроме того, OpenAI утверждает, что GPT-5 лучше других моделей ИИ в более сложных для измерения, субъективных сферах, таких как креативный дизайн и письмо. Терли сказал, что GPT-5 реагирует более естественно и демонстрирует «лучший вкус», чем другие модели ИИ, в творческих задачах.

GPT-5 (с мышлением) вызывает галлюцинации и отвечает неправильной информацией в 4,8% случаев. Это значительное снижение по сравнению с o3 и GPT-4o, которые имеют показатели галлюцинаций 22% и 20,6% соответственно в тесте.

В бенчмарке Tau-bench, который измеряет способность модели искусственного интеллекта выполнять симулированные онлайн-задачи, GPT-5 демонстрирует смешанные результаты. В части теста, измеряющей способность искусственного интеллекта ориентироваться на веб-сайте авиакомпании, GPT-5 получает 63,5%, что немного уступает o3, набравшему 64,8%. В другой части теста, измеряющей способность искусственного интеллекта ориентироваться на веб-сайтах розничной торговли, GPT-5 получает 81,1%, уступая Claude Opus 4.1, набравшему 82,4%.

Подписчики плана Plus от ChatGPT стоимостью 20 долларов в месяц получают более высокие лимиты использования GPT-5, чем бесплатные пользователи. Между тем подписчики Pro стоимостью 200 долларов в месяц будут иметь неограниченный доступ к GPT-5, а также к улучшенной версии под названием GPT-5 Pro, которая использует дополнительные вычислительные ресурсы для получения лучших ответов. Организации, пользующиеся планами OpenAI Team, Edu и Enterprise, получат доступ к GPT-5 как модели по умолчанию на следующей неделе.

Оставить комментарий

Актуальное

Финансовые истины, о которых вам никто не расскажет в первые 2 года предпринимательства

Бизнес

Финансовые истины, о которых вам никто не расскажет в первые 2 года предпринимательства

Бизнес

Когда я только начинал свой бизнес, я подходил к составлению бюджета с оптимизмом человека, который еще не обжегся. Я относился к этому как к аккуратн...

11.08.25

426

0
6 шагов для создания эффективных ретаргетинговых кампаний

Бизнес

6 шагов для создания эффективных ретаргетинговых кампаний

Бизнес

Эффективные ретаргетинговые кампании — это мощный способ повторно привлечь потенциальных клиентов, которые уже посещали ваш веб-сайт или социальные се...

07.08.25

597

0
Как Telegram стал магнитом для экстремистов и преступности

Аналитика

Как Telegram стал магнитом для экстремистов и преступности

Аналитика

Мессенджер Telegram является одним из самых скачиваемых приложений в мире. Его настройки приватного чата сделали его свободным пространством для откры...

30.07.25

933

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

45 219

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

8 629

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

6 853

1
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

6 393

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

6 334

1

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (45)
Instagram
6% (21)
TikTok
9% (33)
Telegram
23% (85)
Youtube
35% (129)
Twitter
1% (5)
А что это?
15% (55)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».