LLMの性能を左右する「データ混合比率(Data Mixture)」の最適化手法を解説。事前学習からSFT、GRPO、DPOまで、各フェーズにおける戦略的なデータ配分の考え方を整理。