8GB VRAM搭載GPUでllama.cppを効率的に動かすための設定ガイド。主要5オプションの最適値を解説し、推論速度を劇的に向上させるための推奨設定を理論に基づいて提案します。