LLMアプリケーションのテストにおける課題を整理。従来の関数テストとは異なり、自然言語の不確定性がある中での品質保証について論じます。Hallucinationの抑制や、期待値評価のための現実的なテスト手法とワークフローの考え方を提案します。