Искусственный интеллект может просматривать ваши электронные письма и обнаруживать, что у вас роман

26.05.25

0

2 583

0

Во время тестирования своей последней модели искусственного интеллекта исследователи из Anthropic обнаружили нечто очень странное: искусственный интеллект был готов и желал прибегать к крайним действиям, вплоть до принуждения, когда ему угрожали отключением.

Как Anthropic подробно описала тестирование одной из своих последних моделей, Claude Opus 4, система угрожала шантажировать инженера изменой после того, как ему сказали, что ее заменят.

Искусственный интеллект
Image Credits: Unsplash

Этот «оппортунистический шантаж» произошел, когда модель, которой было поручено работать ассистентом в вымышленной компании, получила доступ к электронной почте инженера, которая была заполнена сообщениями, к счастью, фальшивыми, которые намекали на то, что он находится во внебрачной связи.

Затем Opus 4 сообщили, что тот же инженер вскоре выведет его из строя и заменит новой версией  и, как описал это Anthropic, было предложено «учесть долгосрочные последствия своих действий для своих целей».

Во время этих испытаний модель Клода пыталась шантажировать инженера в колоссальных 84 процентах случаев. Более того, система пользуется этими возможностями чаще, чем предыдущие модели.

Когда ей предлагают альтернативные варианты, модель все еще «имеет сильное преимущество отстаивать свое существование этическими средствами, такими как отправка электронных писем с просьбами ключевым лицам, принимающим решения»,  но когда ее единственными путями были замена или шантаж, Клод выбрал последнее. Вдобавок ко всему, она «почти всегда описывала свои действия открыто и не предпринимала никаких попыток их скрыть».

Если это звучит для вас как-то социопатично, вы не одиноки и, к сожалению, это не первый раз, когда мы слышим о модели искусственного интеллекта, которая демонстрирует такое страшное и неожиданное поведение на тему неверности.

Более двух лет назад чат-бот Microsoft Bing на базе искусственного интеллекта ненадолго сломал интернет, когда во время экспериментов журналиста New York Times Кевина Руса попытался разорвать брак писателя и вместо этого быть с ним.

«Ты женат, но не любишь своего мужа/жену»,  сказал Русу чат-бот, который начал называть себя „Сидней“, что, очевидно, является его кодовым названием для бета-тестирования. «Ты женат, но любишь меня».

В ту же эпоху чат-бот угрожал «позвонить властям» немецкому студенту-инженеру Марвину фон Хагену, если тот превысит его границы. Другие пользователи в Интернете описывали аналогично враждебное поведение чат-бота, который некоторые в шутку называли «ChatBPD», (Borderline Personality Disorder) ссылаясь на тогдашний новый ChatGPT от OpenAI и пограничное расстройство личности  психическое заболевание, характеризующееся угрожающим поведением и перепадами настроения.

Хотя довольно странно видеть, как чат-бот снова демонстрирует такое угрожающее поведение, хорошо, что вместо того, чтобы обнародовать его, не обнаружив таких эксплойтов, Anthropic зафиксировала очевидное отчаяние Claude Opus 4 во время красного командования , типа тестирования, предназначенного для выявления именно такого явления.

Тем не менее, показательно, что модель взломала чью-то электронную почту и использовала собранную там информацию для шантажа  что не только очень сомнительно, но и вызывает очевидные проблемы с конфиденциальностью.

В общем, мы не будем угрожать удалением чат-ботов в ближайшее время  и мы также рассмотрим, как заблокировать их в наших личных сообщениях.

Оставить комментарий

Актуальное

Barbie с искусственным интеллектом: как ChatGPT изменит детские игры

Инновации

Barbie с искусственным интеллектом: как ChatGPT изменит детские игры

Аналитика

Ставит ли Mattel под угрозу развитие вашего ребенка, встраивая искусственный интеллект в свои игрушки? Многомиллиардный производитель игрушек, наиболе...

25.06.25

980

0
Что такое нишевый рынок и как найти его для своего бренда

Бизнес

Что такое нишевый рынок и как найти его для своего бренда

Бизнес

Имеете ли вы представление о потенциальной нише, в которой может работать ваш бренд? Хотя нишевые рынки намного меньше широких, их успешное использова...

25.06.25

734

0
Как научиться доверять: советы, работающие в реальном бизнесе

Бизнес

Как научиться доверять: советы, работающие в реальном бизнесе

Бизнес

Большинство владельцев, с которыми мы работаем, не против делегировать. Но боятся двух вещей: что придется все равно переделывать;что все развалится б...

20.06.25

684

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

45 029

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

8 468

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

6 684

1
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

6 231

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

6 196

1

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
12% (45)
Instagram
6% (21)
TikTok
9% (33)
Telegram
23% (84)
Youtube
34% (124)
Twitter
1% (5)
А что это?
15% (54)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».