DGX Spark環境でQwen3.6-35B-A3B-FP8モデルをSGLangで動かす手法。AIエージェント開発に最適なMoEモデルの選定から、効率的な推論APIサーバーの構築手順を技術的に解説します。