ガートナーは、2030年までに1兆パラメータ規模の大規模言語モデルの推論実行コストが、2025年と比較して90%以上削減されると予測しました。