VRAM不足でLLMが動かせない問題に対し、llama.cppのRPC機能を用いて2台のPCのGPUをネットワークで束ねる手法を解説。70B級モデルをローカルで動かす試み。