LLM推論速度の高速化・最適化を理解するための基礎知識解説。AutoRegressive Decoder Only Transformerの動作原理を振り返り、論文や技術ブログの理解を深める。