Googleは、Gemma 4向けに推論速度を最大3倍向上させるマルチトークン予測ドラフター(MTP)をリリースしました。投機的デコーディングによる並列化で、生成品質を維持しつつ効率を大幅に高めています。
Google、「Gemma 4」のテキスト生成を最大3倍高速化する「MTP」をリリース
編集メモ: AIの推論速度向上技術は、リアルタイム応答が不可欠なビジネスアプリケーションの実装において、UXとコスト効率を両立させる重要な技術的ブレイクスルーです。