RAGの本番運用におけるコスト最適化手法を紹介。入力を減らす設計だけでなく、そもそも検索・生成回数を減らす「キャッシュ」や「フィルタリング」などのアーキテクチャ設計により、コストを劇的に抑える方法を解説。