画像や音声のマルチモーダルモデルにおける「エンコーダー」廃止の流れを解説。Gemma 4 12Bを例に、生の信号を直接LLMに入力する新しいモデル構築の潮流と技術的意義を説明する。