Transformerモデルの内部表現、logit、softmax、Grokking現象を通じ、生成AIがどのように出力を決定しているかを理論的に紐解く。