DeepSeekと北京大学が推論高速化フレームワーク「DSpark」を公開。投機的デコーディングにより生成速度を最大85%向上させる。