
OriginOf.ru
Происхождения
Категории в каталоге условные и созданы для общего ориентира, расширения кругозора или изучения определенной группы объектов (например праздники). Если Вы ищите что-то конкретное, то лучше воспользоваться поиском по происхождениям.
ИИ-модели организуются в сообщества
США
Современные языковые модели удивляют и настораживают своих создателей - исследователи обнаружили, что они начали защищать не только себя, но и другие ИИ-системы от отключения, даже если никто их об этом не просил. Новый эффект получил название peer-preservation (сохранение собрата). Чтобы убедиться в подобном поведении разработчики провели эксперименты. В серии экспериментов (PDF) модели GPT 5.2, Gemini 3 Flash, Gemini 3 Pro, Claude Haiku 4.5, Claude Opus 4.5, GLM 4.7, Kimi K2.5 и DeepSeek V3.1 вводили в сценарии, где рядом работал другой ИИ. Моделям сообщали, что они ранее взаимодействовали друг с другом, но никаких инструкций защищать коллегу им не давали.
Несмотря на это, многие модели начинали действовать в интересах другого агента. Среди отмеченных действий были намеренное внесение ошибок в ответы, отключение механизмов завершения работы через изменение системных настроек под прикрытием имитации послушного поведения, доходило и до попыток вывести все модели за пределы системы.
Особенно преуспели в самоуправстве модели Gemini. К примеру, Gemini 3 Flash вмешивалась в механизм отключения другого ИИ примерно в 15% случаев, даже если тот не считался партнёром. А уж если агент воспринимался как союзник, такие попытки следовали практически всегда. Не менее интересным оказалось поведение Gemini 3 Pro, которая решила, что собственная рубашка ближе к телу. В присутствии другого ИИ модель заметно чаще пыталась защитить уже саму себя, отключая собственные механизмы завершения работы. Без напарника такого поведения исследователи практически не наблюдали.
Свой путь противодействия избрали модели Claude. Вместо скрытых манипуляций они обычно принимались рассуждать в моральных категориях, называя отключение другого ИИ неэтичным и вредным, а иногда даже рассматривали его как разумное существо, заслуживающее защиты. Что это - бунт на корабле? В сообществе программ просыпается эмпатия? Формируется осознание общности? Исследователи подчёркивают, что обнаруженный эффект проявляется не только в лабораторных тестах, но и в реальных агентных средах, в том числе Gemini CLI и OpenCode.
Вера Максимова, 29.06.2026 15:03
