iPhoneのLLM性能比較：連続生成時の速度推移を検証

iPhoneのローカルLLM：GPUは短距離、Neural Engineは長距離（熱スロットリング実測）

上級 Zenn LLM 2026-06-04T08:08:11 約1分

編集メモ: iPhoneにおけるLLMの実行性能を熱スロットリングの観点から詳細に理解し、モバイル環境でのAI実装における持続的なパフォーマンス最適化の勘所を掴みましょう。

iPhone上でのLLMランタイムの性能を測定。初速のバースト性能だけでなく、10分間の連続生成時のデコード速度変化を検証。コールドスタートから持続的なパフォーマンスまで、各ランタイムの特性を比較。

iPhoneのローカルLLM：GPUは短距離、Neural Engineは長距離（熱スロットリング実測）