M5 MaxでローカルLLMの性能検証！ボトルネックと発熱の影響とは

M5 Max のローカル LLM ベンチ — MoE は GPU 性能、Dense はメモリ帯域幅がボトルネック、発熱の影響も調査

上級 Zenn LLM 2026-05-26T14:43:11 約1分

編集メモ: M5 Max搭載機でのLLM推論において、モデル構造によりGPU演算かメモリ帯域のどちらが性能を左右するかが異なるため、用途に応じたハードウェア選定と熱対策が不可欠です。

M5 Max搭載MacにおけるローカルLLM推論の性能検証。mactopによるテレメトリ計測を通じ、MoEモデルではGPU性能、Denseモデルではメモリ帯域幅がボトルネックとなることや、発熱の影響を解説するシリーズ最終編。

M5 Max のローカル LLM ベンチ — MoE は GPU 性能、Dense はメモリ帯域幅がボトルネック、発熱の影響も調査