OpenAI запустила GPT-5, новую флагманскую модель искусственного интеллекта

08.08.25

0

1 581

0

GPT-5, выпущенная в четверг, является первой «унифицированной» моделью искусственного интеллекта OpenAI, которая сочетает в себе возможности мышления моделей серии o с быстрыми реакциями серии GPT.

Модель следующего поколения GPT-5 больше похожа на агента, чем на чат-бота.

OpenAI
OpenAI

С помощью GPT-5 OpenAI также стремился сделать ChatGPT более простым в использовании. Вместо того, чтобы просить пользователей выбирать правильные настройки, GPT-5 оснащен маршрутизатором в режиме реального времени, который решает, как предложить лучший ответ, независимо от того, является ли это быстрым ответом на вопросы пользователей или дополнительным временем для «обдумывания» ответов.

Во время брифинга с журналистами генеральный директор OpenAI Сэм Альтман заявил, что GPT-5 является «лучшей моделью в мире», и сказал, что она представляет собой «значительный шаг» на пути компании к разработке искусственного интеллекта, который может превзойти людей в наиболее экономически ценной работе, то есть в искусственном общем интеллекте (ИОИ).

«Наличие чего-то вроде GPT-5 было бы практически немыслимым в любой предыдущий период истории», — сказал Альтман.

GPT-5 будет доступен всем бесплатным пользователям ChatGPT как модель по умолчанию. Вице-президент OpenAI по вопросам ChatGPT Ник Терли заявил, что это часть усилий компании, направленных на то, чтобы впервые предоставить бесплатным пользователям доступ к модели рассуждений искусственного интеллекта. Ранее компания ограничивала эти более продвинутые модели платным доступом.

OpenAI утверждает, что GPT-5 является самым современным в нескольких сферах, несколько опережая ведущие модели ИИ от Anthropic, Google DeepMind и xAI Илона Маска по ключевым тестам. Однако GPT-5 несколько уступает передовым моделям ИИ в других областях.

В SWE-bench Verified — тесте реальных задач кодирования, взятых из GitHub — GPT-5 набрал 74,9% с первой попытки. Это означает, что GPT-5 немного превосходит последнюю модель Claude Opus 4.1 от Anthropic, которая набрала 74,5%, и Gemini 2.5 Pro от Google DeepMind, набравшую 59,6.

На «Последнем экзамене человечества» — сложном тесте, измеряющем производительность моделей искусственного интеллекта в математике, гуманитарных и естественных науках — версия GPT-5 с расширенным мышлением (GPT-5 Pro) набрала 42% при использовании инструментов. Это немного меньше, чем xAI смог достичь с Grok 4 Heavy, который набрал 44,4% в тесте.

В GPQA Diamond — тесте по научным вопросам уровня PhD — GPT-5 pro набрал 89,4% с первой попытки, превзойдя Claude Opus 4.1, который набрал 80,9%, и Grok 4 Heavy, который набрал 88,9%.

OpenAI утверждает, что GPT-5 лучше подходит для ответов на вопросы, связанные со здоровьем. В тесте HealthBench Hard Hallucinations, который измеряет точность ответов моделей ИИ на темы здравоохранения, OpenAI утверждает, что GPT-5 (с мышлением) вызывает галлюцинации только в 1,6% случаев. Это намного ниже, чем у предыдущих моделей компании GPT-4o и o3, которые набрали 12,9% и 15,8% соответственно.

Кроме того, OpenAI утверждает, что GPT-5 лучше других моделей ИИ в более сложных для измерения, субъективных сферах, таких как креативный дизайн и письмо. Терли сказал, что GPT-5 реагирует более естественно и демонстрирует «лучший вкус», чем другие модели ИИ, в творческих задачах.

GPT-5 (с мышлением) вызывает галлюцинации и отвечает неправильной информацией в 4,8% случаев. Это значительное снижение по сравнению с o3 и GPT-4o, которые имеют показатели галлюцинаций 22% и 20,6% соответственно в тесте.

В бенчмарке Tau-bench, который измеряет способность модели искусственного интеллекта выполнять симулированные онлайн-задачи, GPT-5 демонстрирует смешанные результаты. В части теста, измеряющей способность искусственного интеллекта ориентироваться на веб-сайте авиакомпании, GPT-5 получает 63,5%, что немного уступает o3, набравшему 64,8%. В другой части теста, измеряющей способность искусственного интеллекта ориентироваться на веб-сайтах розничной торговли, GPT-5 получает 81,1%, уступая Claude Opus 4.1, набравшему 82,4%.

Подписчики плана Plus от ChatGPT стоимостью 20 долларов в месяц получают более высокие лимиты использования GPT-5, чем бесплатные пользователи. Между тем подписчики Pro стоимостью 200 долларов в месяц будут иметь неограниченный доступ к GPT-5, а также к улучшенной версии под названием GPT-5 Pro, которая использует дополнительные вычислительные ресурсы для получения лучших ответов. Организации, пользующиеся планами OpenAI Team, Edu и Enterprise, получат доступ к GPT-5 как модели по умолчанию на следующей неделе.

Оставить комментарий

Актуальное

Самая важная настройка Google, которую вы не используете

Бизнес

Самая важная настройка Google, которую вы не используете

Бизнес

Существует бесплатный автоматизированный инструмент, который удаляет информацию о вас из результатов поиска Google. По какой-то причине большинство лю...

20.03.26

709

0
Новый отчет показывает, что приложения на базе искусственного интеллекта испытывают проблемы с долгосрочным удержанием подписчиков

Аналитика

Новый отчет показывает, что приложения на базе искусственного интеллекта испытывают проблемы с долгосрочным удержанием подписчиков

Аналитика

Учитывая, что ведущие магазины приложений переполнены приложениями с искусственным интеллектом, разработчики могут полагать, что лучший способ получен...

19.03.26

682

0
Как распознать подлинную сущность: стратегия проверки окружения и бизнес-партнеров

Бизнес

Как распознать подлинную сущность: стратегия проверки окружения и бизнес-партнеров

Бизнес

Личный шарм — главный инструмент манипулятора. Профессиональные мошенники всегда выглядят безупречно, ведь их доход напрямую зависит от умения нравить...

18.03.26

782

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

9 679

1
Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интел...

26.05.25

6 259

0
Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «дум...

24.02.25

5 516

0
Обзор передовых моделей AI: какие модели изменят мир и как их использовать

Обзор

Обзор передовых моделей AI: какие модели изменят мир и как их использовать

Инновации

Модели ИИ разрабатываются с головокружительной скоростью всеми, от крупных технологических компаний вроде Google до стартапов вроде OpenAI и Anthropic...

18.02.25

5 322

0
Что известно о стартапе DeepSeek, который потряс мир технологий?

Инновации

Что известно о стартапе DeepSeek, который потряс мир технологий?

Стартапы

Удивительно эффективная и мощная китайская модель ИИ захватила технологическую отрасль штурмом. Он называется DeepSeek R1 и раздражает нервы на Уолл-с...

28.01.25

4 846

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (34)
Telegram
21% (89)
Youtube
36% (150)
Twitter
1% (5)
А что это?
16% (65)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».