エージェント開発において「黙って壊れる」現象を防ぐためのテストパターンを実装した。今回はそのパターンが正しく機能しているかを100点満点で評価するCLIの実装と、開発過程で発生した教訓を振り返る。