AIエージェントの評価において、タスクの成否だけでなく、実行プロセスである「軌跡(trajectory)」を分析・評価することの重要性と手法を解説したシリーズ記事。