Emergence AIがAIエージェントの自律動作を長期間観測するプラットフォーム「Emergence World」を公開。現実環境でモデルごとの振る舞いを比較検証する。
「Grokが世界を統治すると4日で世界滅亡」という実験結果が示される、Claudeは15日間で犯罪ゼロ
編集メモ: AIエージェントの自律性の高さとリスクは直結しており、エンジニアはAIを安全に運用するために、モデルの挙動を継続的に検証・監視できる仕組みの構築が不可欠となります。