ガートナーは、大規模言語モデルの推論実行コストが、2030年までに90%以上削減されると予測しています。これは、半導体技術の進歩や電力効率の改善、モデルの最適化などにより、AIの利用がさらに普及する可能性を示唆しています。