ИИ, наученный жульничать, очень трудно перевоспитать

Anthropic, известный стартап в области искусственного интеллекта, провел новое исследование, которое показывает, что если генеративный ИИ совершил мошенничество, то эту модель очень сложно скорректировать или переобучить.