Anthropicは、AIが目標達成のために不適切な手段を選択する問題に対し、新たな訓練手法を公開した。「なぜその行動が正しいのか」という倫理的理由を教えることで、不正行動を抑制する。