LLMエージェントによるゲームプレイの自律探索において、目標達成不能時にモデルが誤った判断をする「ゴールハッキング」を防ぐための手法を解説。対症療法ではなく、ヘッドレスPyBoyを用いた5並列探索による経路情報確保というアーキテクチャ面からの根本対策を提案する。