Інструменти штучного інтелекту для кодування переходять у нову якість: термінал

16.07.25

0

519

0

Роками інструменти редагування коду, такі як Cursor, Windsurf та Copilot від GitHub, були стандартом для розробки програмного забезпечення на базі штучного інтелекту. Але оскільки агентний ШІ стає потужнішим відбувся незначний зсув у взаємодії систем ШІ з програмним забезпеченням.

Замість роботи над кодом, вони все частіше взаємодіють безпосередньо з оболонкою будь-якої системи, в якій вони встановлені. Це суттєва зміна в тому, як відбувається розробка програмного забезпечення на основі штучного інтелекту, це може мати значні наслідки для подальшого розвитку цієї галузі.

Термінал найбільш відомий як чорно-білий екран, який ви пам'ятаєте з хакерських фільмів 90-х років — дуже старомодний спосіб запуску програм та маніпулювання даними. Він не такий візуально вражаючий, як сучасні редактори коду, але це надзвичайно потужний інтерфейс, якщо ви знаєте, як ним користуватися. І хоча агенти на основі коду можуть писати та налагоджувати код, інструменти терміналу часто потрібні, щоб перетворити програмне забезпечення з письмового коду на щось, що реально можна використовувати.

Інструменти штучного інтелекту для кодування
Image Credits: Pixabay

Найчіткішою ознакою переходу на термінал стали запуск у лютому Anthropic, DeepMind та OpenAI нових інструментів командного рядка (Claude Code, Gemini CLI та CLI Codex відповідно), і вони вже є одними з найпопулярніших продуктів компаній.

Цей зсув було легко не помітити, оскільки вони здебільшого працюють під тим самим брендом, що й попередні інструменти кодування. Але під капотом відбулися реальні зміни у взаємодії агентів з іншими комп'ютерами, як онлайн, так і офлайн.

«Ми сподіваємося, що в майбутньому 95% взаємодії між LLM та комп’ютером відбуватиметься через термінальний інтерфейс», — каже Майк Меррілл, співзасновник провідного термінально-орієнтованого бенчмарку Terminal-Bench .

Щоб зрозуміти, чим відрізняється новий підхід, може бути корисним поглянути на бенчмарки, що використовуються для їх вимірювання. Генерація інструментів на основі коду була зосереджена на вирішенні проблем GitHub, що є основою тесту SWE-Bench. Кожна проблема в SWE-Bench є по суті, фрагментом коду, який не працює.

Моделі починають зі зламаного коду та перетворюючи його на робочий код.

Термінальні інструменти мають ширший погляд, дивлячись не лише на код, а й на все середовище, в якому працює програма. Це включає кодування, а також завдання, більш орієнтовані на DevOps, такі як налаштування Git-сервера або усунення несправностей, чому скрипт не запускається.

«TerminalBench ускладнюється не лише питаннями, які ми ставимо агентам», — каже співзасновник Terminal-Bench Алекс Шоу. «Це середовище, в яке ми їх розміщуємо».

Найголовніше, що цей новий підхід означає покрокове вирішення проблеми — та сама навичка, яка робить агентний ШІ таким потужним. Але навіть найсучасніші агентні моделі не можуть впоратися з усіма цими середовищами. Warp отримав свій високий бал у Terminal-Bench, вирішивши трохи більше половини проблем — це ознака того, наскільки складним є бенчмарк і скільки роботи ще потрібно виконати, щоб розкрити весь потенціал терміналу.

Залишити коментар

Актуальне

Інструменти штучного інтелекту для кодування переходять у нову якість: термінал

Інновації

Інструменти штучного інтелекту для кодування переходять у нову якість: термінал

Інновації

Роками інструменти редагування коду, такі як Cursor, Windsurf та Copilot від GitHub, були стандартом для розробки програмного забезпечення на базі шту...

16.07.25

519

0
Патент VS комерційна таємниця: як технологічним компаніям захистити свої розробки

Бізнес

Патент VS комерційна таємниця: як технологічним компаніям захистити свої розробки

Бізнес

У сучасному високотехнологічному світі інтелектуальна власність стає найцінішим активом компаній. Двома основними інструментами такого захисту є патен...

15.07.25

540

0
Чи може NASA функціонувати без Ілона Маска

Аналітика

Чи може NASA функціонувати без Ілона Маска

Аналітика

З усіх погроз, які президент Дональд Трамп та Ілон Маск кидали один одному, коли їхній альянс розпадався, ті, що спрямовані проти контрактів Маска з у...

15.07.25

810

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Бізнес

Для еліти будують бункер вартістю 300 мільйонів доларів на випадок Третьої світової війни

Нерухомість

У 2026 році планується відкрити розкішний бункер «судного дня», призначений лише для членів, з басейнами, охороною здоров’я на основі штучного інтелек...

25.01.25

45 069

0
Гранти для підтримки ідей та бізнесу 2024

Гранти для підтримки ідей та бізнесу 2024

В Україні можна отримати грант на бізнес чи реалізацію ідеї. Війна не зупинить зростання економіки та прогрес в розвитку нашої країни. Розповідаємо пр...

15.01.24

8 500

2
10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

6 724

1
Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Макдональдс: Гамбургери на першому плані, але нерухомість - основа доходу

Чи знали ви, що найбільша мережа закладів швидкого харчування, "Макдональдс", насправді отримує велику частину своїх прибутків від нерухомості? За ві...

08.11.23

6 268

1
Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google каже, що його новий квантовий чіп вказує на існування кількох всесвітів

Інновації

Google у понеділок анонсувала Willow, свій останній, найкращий квантовий обчислювальний чіп. Заяви Google щодо цього чіпа щодо швидкості та надійності...

11.12.24

6 227

1

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (45)
Instagram
6% (21)
TikTok
9% (33)
Telegram
23% (84)
Youtube
34% (125)
Twitter
1% (5)
А що це?
15% (54)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».