AI推論エンドポイントのセキュリティ対策を解説。LLM推論のコスト構造とGPU占有という特性を踏まえ、トークン窃取に対する防御策をVercelやOWASPの知見をもとにまとめる。