最新のQwen3.6-35B-A3Bモデルを実機検証した記録。RTX 5090環境下で当初想定より遅い18 t/sという結果が出た原因を突き止め、最適化プロセスを報告します。
【検証】RTX 5090でQwen3.6-35B-A3Bを動かす — 18 t/sの罠とQwen3.5との本当の差
編集メモ: 最新モデルのローカル環境導入において、単なるスペック比較だけでなく、推論速度のボトルネックを特定・改善する技術的な最適化能力が、実務におけるパフォーマンスに直結します。