Исследователь безопасности Meta AI сообщил, что агент OpenClaw совершил несанкционированные вредные действия

24.02.26

0

490

0

Сначала вирусный пост X от исследовательницы безопасности Meta AI Саммер Юэ выглядит как сатира. Она попросила своего агента OpenClaw AI проверить ее переполненный почтовый ящик и предложить, что удалить или архивировать.

Агент начал сходить с ума. Устройство начало удалять всю ее электронную почту «быстрым движением», игнорируя команды с телефона, которые приказывали ему остановиться.

OpenClaw
YouTube/screen capture

«Мне пришлось БЕЖАТЬ к своему Mac mini, как будто я обезвреживала бомбу», — написала она, опубликовав изображение проигнорированных подсказок об остановке.

OpenClaw — это, конечно же, агент искусственного интеллекта с открытым кодом, который приобрел популярность благодаря Moltbook, социальной сети, работающей исключительно на основе искусственного интеллекта.

Но миссия OpenClaw, согласно его странице на GitHub, не сосредоточена на социальных сетях. Его цель — стать персональным помощником с искусственным интеллектом, который работает на ваших собственных устройствах.

Инсайдерское сообщество Кремниевой долины настолько влюбилось в OpenClaw, что слова «claw» и «claws» стали модными словами для агентов, работающих на персональном оборудовании. Среди других таких агентов — ZeroClaw, IronClaw и PicoClaw.

Но пост Юэ служит предупреждением. Как отмечали другие пользователи X, если исследователь безопасности искусственного интеллекта мог столкнуться с этой проблемой, на что надеяться простым смертным?

«Вы намеренно тестировали его защитные ограждения или совершили ошибку новичка?» — спросил ее разработчик программного обеспечения на X.

«Честно говоря, ошибка новичка», — ответила она. Она тестировала своего агента с меньшим «игрушечным» почтовым ящиком, как она его называла, и он хорошо работал с менее важной электронной почтой. Он заслужил ее доверие, поэтому она решила проверить его на настоящем.

Юэ считает, что большой объем данных в ее реальном почтовом ящике «вызвал уплотнение», написала она. Уплотнение происходит, когда окно контекста — текущая запись всего, что было сказано и что сделал ИИ в течение сеанса — становится слишком большим, что заставляет агента начать обобщать, сжимать и управлять разговором.

В этот момент ИИ может пропустить инструкции, которые человек считает достаточно важными.

Суть этой истории заключается в том, что агенты, направленные на работников умственного труда, на их текущем этапе развития, являются рискованными. Люди, которые говорят, что успешно их используют, лишь собирают методы для собственной защиты.

Оставить комментарий

Актуальное

Как основателю контролировать бизнес в реальном времени: ERP для проектной компании как инструмент управления, а не бухгалтерии

Бизнес

Как основателю контролировать бизнес в реальном времени: ERP для проектной компании как инструмент управления, а не бухгалтерии

Бизнес

Каждый владелец проектного бизнеса — будь то в IT, архитектуре, маркетинге или консалтинге — рано или поздно оказывается в «точке ослепления». Это мом...

24.02.26

254

0
Увольнение без оправданий. Как перевести прощание с сотрудником из плоскости эмоций в цифры

Бизнес

Увольнение без оправданий. Как перевести прощание с сотрудником из плоскости эмоций в цифры

Бизнес

В управленческой практике часто встречается сценарий, когда увольнение сотрудника происходит по формуле «мы больше не заинтересованы в ваших услугах»...

23.02.26

543

0
Вчера вы пили с ними пиво, а сегодня вы их начальник. 7 шагов, чтобы не стать посмешищем на новой должности

Бизнес

Вчера вы пили с ними пиво, а сегодня вы их начальник. 7 шагов, чтобы не стать посмешищем на новой должности

Бизнес

Переход из статуса специалиста в статус руководителя — это не просто смена таблички на двери, а фундаментальное изменение роли, требующее действий. Вч...

19.02.26

755

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

47 140

0
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

8 913

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

8 006

1
Главные биотехнологические инновации 2023 года

Главные биотехнологические инновации 2023 года

BioTech

В мире биотехнологии каждый год приносит потрясающие инновации и переломные моменты, способствующие решению сложных проблем и улучшению качества жизни...

06.10.23

5 520

0
Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интел...

26.05.25

5 356

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (33)
Telegram
21% (88)
Youtube
36% (148)
Twitter
1% (5)
А что это?
16% (65)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».