Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

26.05.25

0

638

0

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интеллект был готов и желал прибегать к крайним действиям, вплоть до принуждения, когда ему угрожали отключением.

Как Anthropic подробно описала тестирование одной из своих последних моделей, Claude Opus 4, система угрожала шантажировать инженера изменой после того, как ему сказали, что ее заменят.

Искусственный интеллект
Image Credits: Unsplash

Этот «оппортунистический шантаж» произошел, когда модель, которой было поручено работать ассистентом в вымышленной компании, получила доступ к электронной почте инженера, которая была заполнена сообщениями, к счастью, фальшивыми, которые намекали на то, что он находится во внебрачной связи.

Затем Opus 4 сообщили, что тот же инженер вскоре выведет его из строя и заменит новой версией  и, как описал это Anthropic, было предложено «учесть долгосрочные последствия своих действий для своих целей».

Во время этих испытаний модель Клода пыталась шантажировать инженера в колоссальных 84 процентах случаев. Более того, система пользуется этими возможностями чаще, чем предыдущие модели.

Когда ей предлагают альтернативные варианты, модель все еще «имеет сильное преимущество отстаивать свое существование этическими средствами, такими как отправка электронных писем с просьбами ключевым лицам, принимающим решения»,  но когда ее единственными путями были замена или шантаж, Клод выбрал последнее. Вдобавок ко всему, она «почти всегда описывала свои действия открыто и не предпринимала никаких попыток их скрыть».

Если это звучит для вас как-то социопатично, вы не одиноки и, к сожалению, это не первый раз, когда мы слышим о модели искусственного интеллекта, которая демонстрирует такое страшное и неожиданное поведение на тему неверности.

Более двух лет назад чат-бот Microsoft Bing на базе искусственного интеллекта ненадолго сломал интернет, когда во время экспериментов журналиста New York Times Кевина Руса попытался разорвать брак писателя и вместо этого быть с ним.

«Ты женат, но не любишь своего мужа/жену»,  сказал Русу чат-бот, который начал называть себя „Сидней“, что, очевидно, является его кодовым названием для бета-тестирования. «Ты женат, но любишь меня».

В ту же эпоху чат-бот угрожал «позвонить властям» немецкому студенту-инженеру Марвину фон Хагену, если тот превысит его границы. Другие пользователи в Интернете описывали аналогично враждебное поведение чат-бота, который некоторые в шутку называли «ChatBPD», (Borderline Personality Disorder) ссылаясь на тогдашний новый ChatGPT от OpenAI и пограничное расстройство личности  психическое заболевание, характеризующееся угрожающим поведением и перепадами настроения.

Хотя довольно странно видеть, как чат-бот снова демонстрирует такое угрожающее поведение, хорошо, что вместо того, чтобы обнародовать его, не обнаружив таких эксплойтов, Anthropic зафиксировала очевидное отчаяние Claude Opus 4 во время красного командования , типа тестирования, предназначенного для выявления именно такого явления.

Тем не менее, показательно, что модель взломала чью-то электронную почту и использовала собранную там информацию для шантажа  что не только очень сомнительно, но и вызывает очевидные проблемы с конфиденциальностью.

В общем, мы не будем угрожать удалением чат-ботов в ближайшее время  и мы также рассмотрим, как заблокировать их в наших личных сообщениях.

Оставить комментарий

Актуальное

Сотрудники стартапа Neuralink признают, что компания Илона Маска убила 1500 животных

Инновации

Сотрудники стартапа Neuralink признают, что компания Илона Маска убила 1500 животных

Новости компаний

В стартапе Илона Маска, занимающегося разработкой интерфейса мозга и компьютера, появились проблемы. Внутренние сотрудники предупреждают о хаосе, гово...

27.05.25

1 258

0
Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

Инновации

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интел...

26.05.25

638

0
Владельцы Chanel намерены отказаться от выплат на фоне спада рынка предметов роскоши

Аналитика

Владельцы Chanel намерены отказаться от выплат на фоне спада рынка предметов роскоши

Аналитика

Семья миллиардеров Вертхаймеров, стоящая за Chanel, может отказаться от выплаты из последнего финансового цикла люксового бренда, что является признак...

23.05.25

607

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

44 806

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

8 223

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

6 448

1
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

6 024

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

6 019

1

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (43)
Instagram
6% (21)
TikTok
9% (32)
Telegram
23% (81)
Youtube
33% (116)
Twitter
1% (5)
А что это?
15% (51)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».