OpenAI запустила GPT-5, нову флагманську модель штучного інтелекту

08.08.25

0

1 456

0

GPT-5, випущена в четвер, є першою «уніфікованою» моделлю штучного інтелекту OpenAI, яка поєднує в собі можливості мислення моделей серії o зі швидкими реакціями серії GPT.

Модель наступного покоління GPT-5 більше схожа на агента, ніж на чат-бота.

OpenAI
OpenAI

За допомогою GPT-5 OpenAI також прагнув зробити ChatGPT простішим у використанні. Замість того, щоб просити користувачів вибирати правильні налаштування, GPT-5 оснащений маршрутизатором у режимі реального часу, який вирішує, як запропонувати найкращу відповідь, незалежно від того, чи це швидка відповідь на запитання користувачів, чи додатковий час для «обмірковування» відповідей.

Під час брифінгу з журналістами генеральний директор OpenAI Сем Альтман заявив, що GPT-5 є «найкращою моделлю у світі», і сказав, що вона являє собою «значний крок» на шляху компанії до розробки штучного інтелекту, який може перевершити людей у найбільш економічно цінній роботі, тобто у штучному загальному інтелекті (ШЗІ).

«Наявність чогось на кшталт GPT-5 була б практично немислимою в будь-який попередній період історії», – сказав Альтман.

GPT-5 буде доступний усім безкоштовним користувачам ChatGPT як модель за замовчуванням. Віце-президент OpenAI з питань ChatGPT Нік Терлі заявив, що це частина зусиль компанії, спрямованих на те, щоб вперше надати безкоштовним користувачам доступ до моделі міркувань штучного інтелекту. Раніше компанія обмежувала ці більш просунуті моделі платним доступом.

OpenAI стверджує, що GPT-5 є найсучаснішим у кількох сферах, дещо випереджаючи провідні моделі ШІ від Anthropic, Google DeepMind та xAI Ілона Маска за ключовими тестами. Однак GPT-5 дещо поступається передовим моделям ШІ в інших областях.

У SWE-bench Verified — тесті реальних завдань кодування, взятих з GitHub — GPT-5 набрав 74,9% з першої спроби. Це означає, що GPT-5 трохи перевершує останню модель Claude Opus 4.1 від Anthropic, яка набрала 74,5% , та Gemini 2.5 Pro від Google DeepMind, який набрав 59,6.

На «Останньому іспиті людства» — складному тесті, що вимірює продуктивність моделей штучного інтелекту в математиці, гуманітарних та природничих науках — версія GPT-5 з розширеним мисленням (GPT-5 Pro) набрала 42% при використанні інструментів. Це трохи менше, ніж xAI зміг досягти з Grok 4 Heavy , який набрав 44,4% у тесті.

У GPQA Diamond — тесті з наукових питань рівня PhD — GPT-5 pro набрав 89,4% з першої спроби, перевершивши Claude Opus 4.1, який набрав 80,9%, та Grok 4 Heavy, який набрав 88,9%.

OpenAI стверджує, що GPT-5 краще підходить для відповідей на запитання, пов'язані зі здоров'ям. У тесті HealthBench Hard Hallucinations, що вимірює точність відповідей моделей ШІ на теми охорони здоров'я, OpenAI стверджує, що GPT-5 (з мисленням) викликає галюцинації лише в 1,6% випадків. Це набагато нижче, ніж у попередніх моделей компанії GPT-4o та o3, які набрали 12,9% та 15,8% відповідно.

Крім того, OpenAI стверджує, що GPT-5 кращий за інші моделі ШІ у складніших для вимірювання, суб'єктивних сферах, таких як креативний дизайн та письмо. Терлі сказав, що GPT-5 реагує природніше та демонструє «кращий смак», ніж інші моделі ШІ, у творчих завданнях.

GPT-5 (з мисленням) викликає галюцинації та відповідає неправильною інформацією у 4,8% випадків. Це значне зниження порівняно з o3 та GPT-4o, які мають показники галюцинацій 22% та 20,6% відповідно в тесті.

У бенчмарку Tau-bench, що вимірює агентну здатність моделі штучного інтелекту виконувати симульовані онлайн-завдання, GPT-5 демонструє змішані результати. У частині тесту, що вимірює здатність штучного інтелекту орієнтуватися на веб-сайті авіакомпанії, GPT-5 отримує 63,5%, що трохи поступається o3, який набрав 64,8%. В іншій частині тесту, що вимірює здатність штучного інтелекту орієнтуватися на веб-сайтах роздрібної торгівлі, GPT-5 отримує 81,1%, поступаючись Claude Opus 4.1, який набрав 82,4%.

Передплатники плану Plus від ChatGPT вартістю 20 доларів на місяць отримують вищі ліміти використання GPT-5, ніж безкоштовні користувачі. Тим часом передплатники Pro вартістю 200 доларів на місяць матимуть необмежений доступ до GPT-5, а також до покращеної версії під назвою GPT-5 Pro, яка використовує додаткові обчислювальні ресурси для отримання кращих відповідей. Організації, що користуються планами OpenAI Team, Edu та Enterprise, отримають доступ до GPT-5 як моделі за замовчуванням наступного тижня.

Залишити коментар

Актуальне

Як засновнику контролювати бізнес у реальному часі: ERP для проєктної компанії як інструмент управління, а не бухгалтерії

Бізнес

Як засновнику контролювати бізнес у реальному часі: ERP для проєктної компанії як інструмент управління, а не бухгалтерії

Бізнес

Кожен власник проєктного бізнесу — чи то в IT, архітектурі, маркетингу чи консалтингу — рано чи пізно опиняється в «точці засліплення». Це момент, кол...

24.02.26

308

0
Звільнення без виправдань. Як перевести прощання зі співробітником із площини емоцій у цифри

Бізнес

Звільнення без виправдань. Як перевести прощання зі співробітником із площини емоцій у цифри

Бізнес

В управлінській практиці часто трапляється сценарій, коли звільнення співробітника відбувається за формулою «ми більше не зацікавлені у ваших послугах...

23.02.26

551

0
Вчора ви пили з ними пиво, а сьогодні ви їхній начальник. 7 кроків, щоб не стати посміховиськом на новій посаді

Бізнес

Вчора ви пили з ними пиво, а сьогодні ви їхній начальник. 7 кроків, щоб не стати посміховиськом на новій посаді

Бізнес

Перехід зі статусу фахівця у статус керівника — це не просто зміна таблички на дверях, а фундаментальна зміна ролі, яка вимагає дій. Вчора ви могли об...

19.02.26

757

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

47 144

0
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

8 917

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

8 006

1
Головні біотехнологічні інновації 2023 року

Головні біотехнологічні інновації 2023 року

BioTech

У світі біотехнології кожен рік приносить приголомшливі інновації та переломні моменти, що сприяють розв'язанню складних проблем і поліпшенню якості ж...

06.10.23

5 520

0
Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Під час тестування своєї останньої моделі штучного інтелекту дослідники з Anthropic виявили щось дуже дивне: штучний інтелект був готовий і бажав вдав...

26.05.25

5 356

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (33)
Telegram
21% (88)
Youtube
36% (148)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».