推論モデルにおいて「賢くなるほどハルシネーションが増える」逆説を、評価設計の問題から紐解く記事。事実誤認の原因となるReversal CurseやSycophancyといった構造的問題の根本に迫る。
LLMのハルシネーションは減ったのか?【後編:Reasoning Modelで増えたもの・評価設計の根本問題】
編集メモ: 高性能な推論モデルほどハルシネーションの構造的問題を抱える逆説を理解し、適切な評価指標を設計することが、AI運用の品質管理には重要です。