AMD GPU(RX6800)を用いたローカルLLM推論のベンチマーク検証結果。Vulkanバックエンドの活用により、MoEモデルにおいて123.7 t/sという高い実用性能を記録。帯域効率の観点から、dGPU性能を最大化するモデル構成の分析を行います。