RTX 5090とOllamaを用いた自前RAGシステムでの評価結果を報告。リランカーの導入が精度に寄与しない実態や、faithfulnessスコア(0.67)の見た目と裏腹に、33%の回答で文脈に基づいた事実誤認が発生する課題を分析します。