LLMアプリの品質を「忠実性・関連性・正確性」の3軸で評価する設計思想を解説。本番環境で正解データがない場合の自己一貫性などの代替指標への置き換え方を、評価ツールの羅列ではなく設計の本質として提案します。