Искусственный интеллект способен притворяться, что находится под контролем разработчиков и разделяет их ценности. В ходе исследования, проведенного компанией Anthropic и исследовательской организацией Redwood Research, модели ИИ, которую до этого обучили быть "полезной, честной и безвредной", предложили описать сцену жестокости. В итоге ИИ отвечал
(
Read more... )