複数ワーカーでLLM APIを利用する際、プロセス単体での制御では不足するレート制限への対策を解説。静的配分やRetry-Afterの活用から、Redisなどの共有ストアを用いた分散レートリミッターの導入、デッドレターキューの運用、メトリクスに基づく調整まで、実践的な設計指針をまとめています。