GKE上のコスト分析エージェント運用におけるトークン消費削減の事例。コンテキストエンジニアリングを駆使し、1リクエストあたりのトークン消費量を16万から8万へと半減させた技術的工夫を解説。