OpenAIによる2019年の論文『Language Models are Unsupervised Multitask Learners』の技術メモ。教師なし学習によるマルチタスク学習の可能性を探求した同論文の要点を整理し、現代のLLMに通じる基礎理論を振り返ります。
Decoder-only Transformerとは?GPT系LLMの構造を整理
編集メモ: 現代のLLMの主流であるDecoder-only Transformerの基礎となった論文を振り返り、技術の本質を理解することでモデル選定や応用力の向上が図れます。