LLMのコスト、速度、品質の源泉となる「トークン」について、その基礎から最適化手法までを網羅したガイド。サブワード分割、コンテキストウィンドウ、prefill/decodeプロセスなど、モデルに依存しない本質的な原理を全20章で身体化する決定版解説。