Інструменти штучного інтелекту для кодування переходять у нову якість: термінал

16.07.25

0

866

0

Роками інструменти редагування коду, такі як Cursor, Windsurf та Copilot від GitHub, були стандартом для розробки програмного забезпечення на базі штучного інтелекту. Але оскільки агентний ШІ стає потужнішим відбувся незначний зсув у взаємодії систем ШІ з програмним забезпеченням.

Замість роботи над кодом, вони все частіше взаємодіють безпосередньо з оболонкою будь-якої системи, в якій вони встановлені. Це суттєва зміна в тому, як відбувається розробка програмного забезпечення на основі штучного інтелекту, це може мати значні наслідки для подальшого розвитку цієї галузі.

Термінал найбільш відомий як чорно-білий екран, який ви пам'ятаєте з хакерських фільмів 90-х років — дуже старомодний спосіб запуску програм та маніпулювання даними. Він не такий візуально вражаючий, як сучасні редактори коду, але це надзвичайно потужний інтерфейс, якщо ви знаєте, як ним користуватися. І хоча агенти на основі коду можуть писати та налагоджувати код, інструменти терміналу часто потрібні, щоб перетворити програмне забезпечення з письмового коду на щось, що реально можна використовувати.

Інструменти штучного інтелекту для кодування
Image Credits: Pixabay

Найчіткішою ознакою переходу на термінал стали запуск у лютому Anthropic, DeepMind та OpenAI нових інструментів командного рядка (Claude Code, Gemini CLI та CLI Codex відповідно), і вони вже є одними з найпопулярніших продуктів компаній.

Цей зсув було легко не помітити, оскільки вони здебільшого працюють під тим самим брендом, що й попередні інструменти кодування. Але під капотом відбулися реальні зміни у взаємодії агентів з іншими комп'ютерами, як онлайн, так і офлайн.

«Ми сподіваємося, що в майбутньому 95% взаємодії між LLM та комп’ютером відбуватиметься через термінальний інтерфейс», — каже Майк Меррілл, співзасновник провідного термінально-орієнтованого бенчмарку Terminal-Bench .

Щоб зрозуміти, чим відрізняється новий підхід, може бути корисним поглянути на бенчмарки, що використовуються для їх вимірювання. Генерація інструментів на основі коду була зосереджена на вирішенні проблем GitHub, що є основою тесту SWE-Bench. Кожна проблема в SWE-Bench є по суті, фрагментом коду, який не працює.

Моделі починають зі зламаного коду та перетворюючи його на робочий код.

Термінальні інструменти мають ширший погляд, дивлячись не лише на код, а й на все середовище, в якому працює програма. Це включає кодування, а також завдання, більш орієнтовані на DevOps, такі як налаштування Git-сервера або усунення несправностей, чому скрипт не запускається.

«TerminalBench ускладнюється не лише питаннями, які ми ставимо агентам», — каже співзасновник Terminal-Bench Алекс Шоу. «Це середовище, в яке ми їх розміщуємо».

Найголовніше, що цей новий підхід означає покрокове вирішення проблеми — та сама навичка, яка робить агентний ШІ таким потужним. Але навіть найсучасніші агентні моделі не можуть впоратися з усіма цими середовищами. Warp отримав свій високий бал у Terminal-Bench, вирішивши трохи більше половини проблем — це ознака того, наскільки складним є бенчмарк і скільки роботи ще потрібно виконати, щоб розкрити весь потенціал терміналу.

Залишити коментар

Актуальне

Як бути впевненим: 8 підтверджених даними способів подолати синдром самозванця

Бізнес

Як бути впевненим: 8 підтверджених даними способів подолати синдром самозванця

Бізнес

Незалежно від того, чи ви хочете подолати низьку впевненість заради загального відчуття благополуччя, чи заради чогось конкретного, наприклад, успішно...

29.08.25

520

0
Майже провалені стартапи: чого можна навчитися у стартапів, які попри все досягли успіху

Бізнес

Майже провалені стартапи: чого можна навчитися у стартапів, які попри все досягли успіху

Стартапи

У світі підприємців є приказка приблизно такого змісту: «День, коли я кидаю бізнес, — це день до того, як я досягну успіху». Хоча неможливо спростуват...

26.08.25

670

0
Бум штучного інтелекту, як очікується, буде рушійною силою прибутковості ринків, що розвиваються, протягом наступного десятиліття

Інвестиції

Бум штучного інтелекту, як очікується, буде рушійною силою прибутковості ринків, що розвиваються, протягом наступного десятиліття

Інвестиції

Фонди ринків, що розвиваються, орієнтуються на те, щоб захопити бум штучного інтелекту, і деякі інвестори прогнозують, що стрімке зростання витрат на...

18.08.25

746

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

45 325

0
Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

8 728

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

6 962

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

6 491

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

6 435

1

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (45)
Instagram
6% (22)
TikTok
9% (33)
Telegram
22% (85)
Youtube
35% (132)
Twitter
1% (5)
А що це?
15% (57)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».