DiffusionGemmaの「最大4倍速」という謳い文句の裏側を技術的に検証。高速化の正体はGPUメモリ帯域の特性であり、クラウド環境での運用にはコスト増のリスクがあることを、アーキテクチャの視点から紐解く。