LLMアプリの品質をどう評価するかについて、評価(Evaluation)と観測(Observability)、オフライン/オンライン評価という概念の整理を行うガイド。