LLMアプリの品質をどう評価するかについて、評価(Evaluation)と観測(Observability)、オフライン/オンライン評価という概念の整理を行うガイド。
観測? オフライン評価? オンライン評価? LLM品質の言葉を地図で整理する
編集メモ: LLMアプリの品質を担保するためには、評価、観測、オンライン/オフライン手法といった各概念を体系的に整理し、開発プロセスに適切に統合することが重要です。
LLMアプリの品質をどう評価するかについて、評価(Evaluation)と観測(Observability)、オフライン/オンライン評価という概念の整理を行うガイド。