生成AIチャットボット導入時の比較評価指標についての解説。LLM単体の性能だけでなく、RAG精度やガードレール設定など、実運用における多層的な評価の重要性を説く。