現代のAIシステムを構成する技術レイヤー(メモリ、ルーティング、投機的実行など)を整理。AIエージェントの運用において、LLM精度以外のパフォーマンス要件とハルシネーションの構造を解説する。