Дослідник безпеки Meta AI повідомив, що агент OpenClaw здійснив несанкціонвани шкідливі дії

24.02.26

0

996

0

Спочатку вірусний пост X від дослідниці безпеки Meta AI Саммер Юе виглядає як сатира. Вона попросила свого агента OpenClaw AI перевірити її переповнену поштову скриньку та запропонувати, що видалити або архівувати.  

Агент почав шаленіти. Пристрій почав видаляти всю її електронну пошту «швидким рухом», ігноруючи команди з телефону, які наказували йому зупинитися. 

OpenClaw
YouTube/screen capture

«Мені довелося БІГТИ до свого Mac mini, ніби я знешкоджувала бомбу», – написала вона, опублікувавши зображення проігнорованих підказок про зупинку.

OpenClaw — це, звичайно ж, агент штучного інтелекту з відкритим кодом, який здобув популярність завдяки Moltbook, соціальній мережі, що працює виключно на основі штучного інтелекту.

Але місія OpenClaw, згідно з його сторінкою на GitHub, не зосереджена на соціальних мережах. Його метою є стати персональним помічником зі штучним інтелектом, який працює на ваших власних пристроях.

Інсайдерська спільнота Кремнієвої долини настільки закохалася в OpenClaw, що слова «claw» та «claws» стали модними словами для агентів, які працюють на персональному обладнанні. Серед інших таких агентів — ZeroClaw, IronClaw та PicoClaw.

Але пост Юе слугує попередженням. Як зазначали інші користувачі X, якщо дослідник безпеки штучного інтелекту міг зіткнутися з цією проблемою, на що сподіваються прості смертні? 

«Ви навмисно тестували його захисні огорожі чи зробили помилку новачка?» — запитав її розробник програмного забезпечення на X.  

«Чесно кажучи, помилка новачка», – відповіла вона. Вона тестувала свого агента з меншою «іграшковою» поштовою скринькою, як вона її називала, і та добре працювала з менш важливою електронною поштою. Вона заслужила її довіру, тому вона вирішила перевірити на справжній.

Юе вважає, що великий обсяг даних у її реальній поштовій скриньці «спричинив ущільнення», написала вона. Ущільнення відбувається, коли вікно контексту — поточний запис усього, що було сказано та що зробив ШІ протягом сеансу — стає занадто великим, що змушує агента почати підсумовувати, стискати та керувати розмовою.  

У цей момент ШІ може пропустити інструкції, які людина вважає досить важливими.

Суть цієї історії полягає в тому, що агенти, спрямовані на працівників інтелектуальної праці, на їхньому поточному етапі розвитку, є ризикованими. Люди, які кажуть, що успішно їх використовують, лише збирають методи для власного захисту.

Залишити коментар

Актуальне

Розкіш більше не в моді? Чому акції LVMH почали рік найгірше в історії

Аналітика

Розкіш більше не в моді? Чому акції LVMH почали рік найгірше в історії

Аналітика

Акції LVMH почали рік найгірше за всю історію спостережень, оскільки вплив війни на Близькому Сході затьмарює світові економічні перспективи та посилю...

01.04.26

431

0
Не дайте їм сказати «прощавай»: як врятувати стосунки з клієнтом в останній момент

Бізнес

Не дайте їм сказати «прощавай»: як врятувати стосунки з клієнтом в останній момент

Бізнес

Щодня клієнти вирішують залишати компанії, які можуть навіть не усвідомлювати, що вони незадоволені. Зазвичай вони не надсилають гнівні електронні лис...

30.03.26

771

0
AI First Media: нова модель медіа в епоху штучного інтелекту

Інновації

AI First Media: нова модель медіа в епоху штучного інтелекту

Інновації

У цій статті я формулюю авторську концепцію AI First Media — нової моделі медіа в епоху штучного інтелекту. За останні 30 років медіа пережили кілька...

29.03.26

880

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

9 946

1
Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Під час тестування своєї останньої моделі штучного інтелекту дослідники з Anthropic виявили щось дуже дивне: штучний інтелект був готовий і бажав вдав...

26.05.25

6 549

0
Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

5 837

0
Огляд передових моделей AI : які моделі змінять світ і як їх використовувати

Огляд

Огляд передових моделей AI : які моделі змінять світ і як їх використовувати

Інновації

Моделі ШІ розробляються із запаморочливою швидкістю всіма, від великих технологічних компаній на кшталт Google до стартапів на кшталт OpenAI і Anthrop...

18.02.25

5 712

0
Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Інновації

Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Стартапи

Напрочуд ефективна та потужна китайська модель ШІ захопила технологічну галузь штурмом. Він називається DeepSeek R1 і дратує нерви на Волл-стріт. Нов...

28.01.25

4 966

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (34)
Telegram
22% (90)
Youtube
36% (150)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».