Qwen3.6-35B実機検証！推論速度の真因と対策

【検証】RTX 5090でQwen3.6-35B-A3Bを動かす — 18 t/sの罠とQwen3.5との本当の差

上級 Zenn LLM 2026-04-22T02:26:03 約1分

編集メモ: 最新モデルのローカル環境導入において、単なるスペック比較だけでなく、推論速度のボトルネックを特定・改善する技術的な最適化能力が、実務におけるパフォーマンスに直結します。

最新のQwen3.6-35B-A3Bモデルを実機検証した記録。RTX 5090環境下で当初想定より遅い18 t/sという結果が出た原因を突き止め、最適化プロセスを報告します。

【検証】RTX 5090でQwen3.6-35B-A3Bを動かす — 18 t/sの罠とQwen3.5との本当の差