vLLMが公開した「Fusion」は、単一リクエストに対して複数のLLMを同時に走らせ、回答を統合する推論ルーター機能。Mixture-of-Agentsの発想を本番運用可能な形に落とし込み、精度と効率を両立させる最新手法を解説する。