← 国内ニュースに戻る Q/Kの「大振幅」だけを更新:LongActが長文脈RLの壁を破る 中級 Zenn LLM 2026-06-08T06:38:02 約1分 編集メモ: 強化学習においてQ/Kの特定成分のみを効率的に更新するLongAct手法は、計算コストを抑えつつ長文脈の推論精度を劇的に向上させる鍵となります。 元記事を読む → 𝕏 B! LINE 🔗 コピー 関連記事 ローカルLLM専用フォーク「ClosedCode」をビルドレス・ピュアvanilla JSで作っている話 2026年06月07日 I Built My Own Cyber Dashboard to Talk to My AI Partner — From Scratch 2026年06月07日 AI相棒と会話できるサイバーダッシュボードを丸ごと自作した話 2026年06月07日