OpenAI запустила GPT-5, новую флагманскую модель искусственного интеллекта

08.08.25

0

2 123

0

GPT-5, выпущенная в четверг, является первой «унифицированной» моделью искусственного интеллекта OpenAI, которая сочетает в себе возможности мышления моделей серии o с быстрыми реакциями серии GPT.

Модель следующего поколения GPT-5 больше похожа на агента, чем на чат-бота.

OpenAI
OpenAI

С помощью GPT-5 OpenAI также стремился сделать ChatGPT более простым в использовании. Вместо того, чтобы просить пользователей выбирать правильные настройки, GPT-5 оснащен маршрутизатором в режиме реального времени, который решает, как предложить лучший ответ, независимо от того, является ли это быстрым ответом на вопросы пользователей или дополнительным временем для «обдумывания» ответов.

Во время брифинга с журналистами генеральный директор OpenAI Сэм Альтман заявил, что GPT-5 является «лучшей моделью в мире», и сказал, что она представляет собой «значительный шаг» на пути компании к разработке искусственного интеллекта, который может превзойти людей в наиболее экономически ценной работе, то есть в искусственном общем интеллекте (ИОИ).

«Наличие чего-то вроде GPT-5 было бы практически немыслимым в любой предыдущий период истории», — сказал Альтман.

GPT-5 будет доступен всем бесплатным пользователям ChatGPT как модель по умолчанию. Вице-президент OpenAI по вопросам ChatGPT Ник Терли заявил, что это часть усилий компании, направленных на то, чтобы впервые предоставить бесплатным пользователям доступ к модели рассуждений искусственного интеллекта. Ранее компания ограничивала эти более продвинутые модели платным доступом.

OpenAI утверждает, что GPT-5 является самым современным в нескольких сферах, несколько опережая ведущие модели ИИ от Anthropic, Google DeepMind и xAI Илона Маска по ключевым тестам. Однако GPT-5 несколько уступает передовым моделям ИИ в других областях.

В SWE-bench Verified — тесте реальных задач кодирования, взятых из GitHub — GPT-5 набрал 74,9% с первой попытки. Это означает, что GPT-5 немного превосходит последнюю модель Claude Opus 4.1 от Anthropic, которая набрала 74,5%, и Gemini 2.5 Pro от Google DeepMind, набравшую 59,6.

На «Последнем экзамене человечества» — сложном тесте, измеряющем производительность моделей искусственного интеллекта в математике, гуманитарных и естественных науках — версия GPT-5 с расширенным мышлением (GPT-5 Pro) набрала 42% при использовании инструментов. Это немного меньше, чем xAI смог достичь с Grok 4 Heavy, который набрал 44,4% в тесте.

В GPQA Diamond — тесте по научным вопросам уровня PhD — GPT-5 pro набрал 89,4% с первой попытки, превзойдя Claude Opus 4.1, который набрал 80,9%, и Grok 4 Heavy, который набрал 88,9%.

OpenAI утверждает, что GPT-5 лучше подходит для ответов на вопросы, связанные со здоровьем. В тесте HealthBench Hard Hallucinations, который измеряет точность ответов моделей ИИ на темы здравоохранения, OpenAI утверждает, что GPT-5 (с мышлением) вызывает галлюцинации только в 1,6% случаев. Это намного ниже, чем у предыдущих моделей компании GPT-4o и o3, которые набрали 12,9% и 15,8% соответственно.

Кроме того, OpenAI утверждает, что GPT-5 лучше других моделей ИИ в более сложных для измерения, субъективных сферах, таких как креативный дизайн и письмо. Терли сказал, что GPT-5 реагирует более естественно и демонстрирует «лучший вкус», чем другие модели ИИ, в творческих задачах.

GPT-5 (с мышлением) вызывает галлюцинации и отвечает неправильной информацией в 4,8% случаев. Это значительное снижение по сравнению с o3 и GPT-4o, которые имеют показатели галлюцинаций 22% и 20,6% соответственно в тесте.

В бенчмарке Tau-bench, который измеряет способность модели искусственного интеллекта выполнять симулированные онлайн-задачи, GPT-5 демонстрирует смешанные результаты. В части теста, измеряющей способность искусственного интеллекта ориентироваться на веб-сайте авиакомпании, GPT-5 получает 63,5%, что немного уступает o3, набравшему 64,8%. В другой части теста, измеряющей способность искусственного интеллекта ориентироваться на веб-сайтах розничной торговли, GPT-5 получает 81,1%, уступая Claude Opus 4.1, набравшему 82,4%.

Подписчики плана Plus от ChatGPT стоимостью 20 долларов в месяц получают более высокие лимиты использования GPT-5, чем бесплатные пользователи. Между тем подписчики Pro стоимостью 200 долларов в месяц будут иметь неограниченный доступ к GPT-5, а также к улучшенной версии под названием GPT-5 Pro, которая использует дополнительные вычислительные ресурсы для получения лучших ответов. Организации, пользующиеся планами OpenAI Team, Edu и Enterprise, получат доступ к GPT-5 как модели по умолчанию на следующей неделе.

Оставить комментарий

Актуальное

Шаги для управления своим мышлением для достижения успеха

Бизнес

Шаги для управления своим мышлением для достижения успеха

Бизнес

Развитие позитивного мышления требует времени и усилий, но существует множество стратегий, которые вы можете использовать для формирования более позит...

28.06.26

453

0
8 способов, как инвесторы могут проверить подлинность золота

Инвестиции

8 способов, как инвесторы могут проверить подлинность золота

Инвестиции

Золото по-прежнему остается популярным активом среди инвесторов, ценится за способность защищать от инфляции и экономической нестабильности, обеспечив...

24.06.26

633

0
6 важных шагов маркетинга и брендинга для развития вашего бизнеса в течение первых 18 месяцев

Бизнес

6 важных шагов маркетинга и брендинга для развития вашего бизнеса в течение первых 18 месяцев

Бизнес

Вы сделали рывок и начали свой бизнес — что дальше? В первые 18 месяцев рост заключается не только в прибыли, но и в укреплении доверия к бренду, четк...

23.06.26

806

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

12 177

1
Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интел...

26.05.25

8 845

0
Обзор передовых моделей AI: какие модели изменят мир и как их использовать

Обзор

Обзор передовых моделей AI: какие модели изменят мир и как их использовать

Инновации

Модели ИИ разрабатываются с головокружительной скоростью всеми, от крупных технологических компаний вроде Google до стартапов вроде OpenAI и Anthropic...

18.02.25

8 357

0
Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

Инновации

Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «дум...

24.02.25

8 099

0
Что известно о стартапе DeepSeek, который потряс мир технологий?

Инновации

Что известно о стартапе DeepSeek, который потряс мир технологий?

Стартапы

Удивительно эффективная и мощная китайская модель ИИ захватила технологическую отрасль штурмом. Он называется DeepSeek R1 и раздражает нервы на Уолл-с...

28.01.25

5 803

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
11% (48)
Instagram
6% (24)
TikTok
8% (34)
Telegram
22% (91)
Youtube
36% (150)
Twitter
1% (5)
А что это?
16% (66)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».