Googleは、小型AIを活用して大型AIの処理を高速化する「マルチトークン予測」技術を発表しました。投機的予測により、生成AIの応答速度を大幅に改善する革新的な手法です。