単一GPUでvLLMとRAG関連プロセスをMPSで運用中に発生した処理停止トラブルの事例。負荷テスト時のVRAM割り当てと競合が原因の運用課題を解説。