長文チャットでAIの応答品質が低下する問題をGemini Flash Liteで検証。「過去の会話の再投入をやめる」「要約とembeddingを活用する」という構造的な解決策を提示。
Gemini Flash Lite が 20 ターンで壊れるのを、要約を embedding することで止めた話
編集メモ: 会話の要約とembeddingを活用してAIの応答劣化を防ぐ手法は、長文コンテキストを扱う際の技術的限界を克服し、高品質なAIシステムを構築するための現実的な解決策です。