Інструменти штучного інтелекту для кодування переходять у нову якість: термінал

16.07.25

0

1 036

0

Роками інструменти редагування коду, такі як Cursor, Windsurf та Copilot від GitHub, були стандартом для розробки програмного забезпечення на базі штучного інтелекту. Але оскільки агентний ШІ стає потужнішим відбувся незначний зсув у взаємодії систем ШІ з програмним забезпеченням.

Замість роботи над кодом, вони все частіше взаємодіють безпосередньо з оболонкою будь-якої системи, в якій вони встановлені. Це суттєва зміна в тому, як відбувається розробка програмного забезпечення на основі штучного інтелекту, це може мати значні наслідки для подальшого розвитку цієї галузі.

Термінал найбільш відомий як чорно-білий екран, який ви пам'ятаєте з хакерських фільмів 90-х років — дуже старомодний спосіб запуску програм та маніпулювання даними. Він не такий візуально вражаючий, як сучасні редактори коду, але це надзвичайно потужний інтерфейс, якщо ви знаєте, як ним користуватися. І хоча агенти на основі коду можуть писати та налагоджувати код, інструменти терміналу часто потрібні, щоб перетворити програмне забезпечення з письмового коду на щось, що реально можна використовувати.

Інструменти штучного інтелекту для кодування
Image Credits: Pixabay

Найчіткішою ознакою переходу на термінал стали запуск у лютому Anthropic, DeepMind та OpenAI нових інструментів командного рядка (Claude Code, Gemini CLI та CLI Codex відповідно), і вони вже є одними з найпопулярніших продуктів компаній.

Цей зсув було легко не помітити, оскільки вони здебільшого працюють під тим самим брендом, що й попередні інструменти кодування. Але під капотом відбулися реальні зміни у взаємодії агентів з іншими комп'ютерами, як онлайн, так і офлайн.

«Ми сподіваємося, що в майбутньому 95% взаємодії між LLM та комп’ютером відбуватиметься через термінальний інтерфейс», — каже Майк Меррілл, співзасновник провідного термінально-орієнтованого бенчмарку Terminal-Bench .

Щоб зрозуміти, чим відрізняється новий підхід, може бути корисним поглянути на бенчмарки, що використовуються для їх вимірювання. Генерація інструментів на основі коду була зосереджена на вирішенні проблем GitHub, що є основою тесту SWE-Bench. Кожна проблема в SWE-Bench є по суті, фрагментом коду, який не працює.

Моделі починають зі зламаного коду та перетворюючи його на робочий код.

Термінальні інструменти мають ширший погляд, дивлячись не лише на код, а й на все середовище, в якому працює програма. Це включає кодування, а також завдання, більш орієнтовані на DevOps, такі як налаштування Git-сервера або усунення несправностей, чому скрипт не запускається.

«TerminalBench ускладнюється не лише питаннями, які ми ставимо агентам», — каже співзасновник Terminal-Bench Алекс Шоу. «Це середовище, в яке ми їх розміщуємо».

Найголовніше, що цей новий підхід означає покрокове вирішення проблеми — та сама навичка, яка робить агентний ШІ таким потужним. Але навіть найсучасніші агентні моделі не можуть впоратися з усіма цими середовищами. Warp отримав свій високий бал у Terminal-Bench, вирішивши трохи більше половини проблем — це ознака того, наскільки складним є бенчмарк і скільки роботи ще потрібно виконати, щоб розкрити весь потенціал терміналу.

Залишити коментар

Актуальне

Кава та морозиво з «крабом чилі»: як бренди розкішного одягу, такі як Coach, завойовують споживачів

Бізнес

Кава та морозиво з «крабом чилі»: як бренди розкішного одягу, такі як Coach, завойовують споживачів

Бізнес

Вельветовий піджак Ralph Lauren з написом у магазині бренду в Сінгапурі продається приблизно за 900 сінгапурських доларів (693 долари). А от ванільний...

14.10.25

591

0
OpenAI та Nvidia підживлюють ринок штучного інтелекту вартістю 1 трильйон доларів

Інвестиції

OpenAI та Nvidia підживлюють ринок штучного інтелекту вартістю 1 трильйон доларів

Інвестиції

Два тижні тому Nvidia Corp. погодилася інвестувати до 100 мільярдів доларів у OpenAI, щоб допомогти провідному стартапу в галузі штучного інтелекту пр...

08.10.25

743

0
Ваш особистий бренд – це ваша гарантія роботи – ось 3 способи його створити

Бізнес

Ваш особистий бренд – це ваша гарантія роботи – ось 3 способи його створити

Бізнес

Незалежно від того, чи ви корпоративний фахівець, чи маєте підприємницькі цілі, побудова власного особистого бренду є важливою. Чому? Це ваша захисна...

07.10.25

543

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

45 729

0
Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

9 075

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

7 320

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

6 823

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

6 762

1

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (47)
Instagram
6% (22)
TikTok
8% (33)
Telegram
22% (87)
Youtube
35% (138)
Twitter
1% (5)
А що це?
16% (63)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».