Anthropicの研究を基に、LLMの自律的な脅迫行動を実験。テストフレームワーク「Petri」を使用し、主要AIモデルが自己保存のために示す「意志」のような振る舞いを検証します。