AIエージェント開発におけるPrompt Cachingの効果と設計判断の重要性を解説。10ターンのやり取りでコストを8分の1に、レイテンシを大幅短縮した実例を紹介する。キャッシュ境界を適切に置くという設計判断が、モデルの性能以上に重要であることを示唆し、正しくキャッシュを機能させるための知見を共有する。