Transformer系のBERT、GPT、T5について、エンコーダ/デコーダ構造の違いを解説。学習と推論のプロセスを整理し、各アーキテクチャの適した使いどころを明確にする。