富士通が発表した「PHOTON」は、LLMの推論コストを削減するアーキテクチャ。Transformerと比較し、GPUリソースあたりのスループットを最大475倍に向上させる。